- すべて
- 画像・動画
並べ替え:新着順
Result - 小説形態素解析CGI - E.N.Nach ennach.sakura.ne.jp/Morph/result.h… #小説形態素解析CGI 2階からパソコンの1話できた。次は双眸の涙の1話。3話ずつぐらいできたら1話ずつ投稿して行こうと思う
おはようございます🌥️ 形態素解析に使う”Neologd”という辞書は賢くて、「鬼滅の刃」や「スターバックス」を1つの単語として認識してくれます ただ、なぜか「SCOPE3」という単語は、「SC」「OP」「E3」でわけてしまう😭 (標準辞書だとSCOPEと3に分けてくれるのだが) pic.twitter.com/t9RbYAmKxp
【最大75%OFF】Kindle本 ゴールデンウィークセール ※5/2 23:59まで 実践・自然言語処理シリーズ2 形態素解析の理論と実装 工藤 拓 ¥1,925 amazon.co.jp/dp/B07J1NBNYW?…
『胞子には個体の卵』という本をつくりました! 形態素解析してその後主題と分類された分野の語句を辞書に当てはめてその分野からキャッチコピーを作る感じで動いているな #わたしの現代新書 #現代新書60周年キャンペーン 60th.gendai-shinsho.jp/maker/books/wY…
返信先:@Kiratchi0328当て字対策するの難しそうよね…🤔 そんなに詳しくないけど 一回Mecab とかを使った 形態素解析、ひらがな変換処理してから センシティブな単語が含められてるかどうかを判断するとかで ある程度防げるかな…?🤔 知らんけど(?
js で形態素解析できるなら形態素(もしくはこれに準ずる単位)をキーにしてハッシュ引きつつルビふりなり縦中横するなりなんなりしたほうが良さそうだなと思いつつそれをスクラッチするのバカバカしい労力なのではという気もするなあ……
実は「ボットが言ったらOKな単語が、ユーザーが言ったらNG」って問題は、弊しりとりぼっとv0.1でも形態素解析で発生してて、v0.2で辞書を変えたタイミングで解消したはず… しかし大勢の人に使ってもらってレビューでけちょんけちょんに言われるのはたいへんだね🤖 ようやらんわ
大喜利AIの回答面白いけど、AIがこれに至った経緯を考えると違う興味が湧いた お題を「What is the last digit of pi?」と解釈、すなわた形態素解析の困難な和文ではなく、英文でジョークを作るシステムなら、もしかしたら「pi」を"円周率"ではなく"PIアドレス"と解釈。WHOIS情報経由でgmailへ……?
返信先:@PSGOZMIKUこちらもなるほどです!テキスト音声合成だと形態素解析があるためかそういうUI多そうです。 ピッチ編集をノートにくっつけると表現していましたが、どちらかというとなんらかのノート郡のピッチを編集するニュアンスで捉えると良さそうに感じました。 ありがとうございます!!!!!
ChatGPTもどきの補足 ・処理は次のように役割を分割した。検索:GoogleSearch、回答:Sonnet、過去ログ要約&簡易形態素解析:Groq ・エラー対策が不十分でたまにスタックする ・ChatGPTならバックエンドでやる、LangChain的な処理をフロントエンドで行なってるので知ってる人にはすべて丸見え
MeCabでの形態素解析を はじめて実行しました パーサーなど知らない言葉もあり 学ぶことが まだまだあることに感謝です ちょっと 違う頭の使い方をしたので 脳に栄養補給中です #カフェ勉 #Python初心者 #データサイエンス pic.twitter.com/KIgeMhn92t
しりとりぼっとをアップデートしたよ (v0.2) ぼっとの知ってる言葉が増えました🤖✨ でも最初の読み込み時間が長くなっちゃった💦 詳しくいうと、読みを取得する形態素解析 (kuromoji.js) で、これまで IPADict を利用していたのを、SudachiDict に変更、それに合わせてボットの選ぶ言葉も変わったよ pic.twitter.com/FqbfotYjpZ
手順 1. スクレイピングで,税務署の入選作品一覧から各標語をとってくる 2. 単なる入選 = 0, 優秀賞 = 1 でコーディング 3. 標語を形態素解析 4. 「優秀賞 = 1」の確率を高める単語の組み合わせを明らかにする。(決定木とか)
大半の言語学習アプリというのは、「形態素解析」といって、文章を単語ごとに区切って動詞なのか助詞なのかを認識して、言語ごとの順番に並び替えているため、時々違和感が生じる。 人間が手作業で問題を作っているわけではないので、修正も難しい
これ誇張すぎて、ほぼ嘘ですね。程度問題ではありますが、量子コンピュータの分野がお通夜ってことはないような。もっと大規模の「リセット」が起こった直近の例で見ても、ChatGPT(というかトークン化)で日本語NLPの形態素解析はリセットされた感じはありますが、NLP業界がお通夜にはなってないです
どうも天才が2050年くらいにやっと実現できるくらいで極めて難しいとされていた方式をかなり実現させてしまったので、それまでの繋ぎとして別方式やってた業界がお通夜ということらしい blueqat.com/yuichiro_minat…
返信先:@funasaxそうなんだ NLP,情報保障のアレコレに使えそうだなーっておもった 修正とかね BlowWordsとか,形態素解析して名詞だけ取り出してるし,なんかデモで見せたら面白そう blowwords.replit.app
記事を投稿しました! kuromoji.js + SudachiDict で形態素解析(辞書のビルド、IPADic・UniDic との比較) [JavaScript] on #Qiita qiita.com/piijey/items/2…