形態素解析
少なからずWebに関わった仕事しているところで、この仕組みはどういう仕組みなんだろうと興味がでて、調べることがあります。そんで、↓のようなタグの仕組み、テキスト文章から語句を抽出する仕組みってどうやっているんだろうと思いしらべてみると。

形態素解析といのがあるようです、PHPでもそれとなく正規表現やJavaなどでもBreakIteratorというのを使えばできそうですが、そういったソフトがすでに出ているようで、MeCabやChaSenというソフトと連携させてもできそうです。専用ソフトだけあって日本語をうまく解析してくれます。んで、あれです、何がというと、ブログペットもこのような仕組み使っているように見えます。うちのラグナペットもただのアニメーションから人口無能的に、無作為にしゃべらせることができそうな予感w。
Posted by みーや | Permalink
トラックバック
この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/11132/10502998
この記事へのトラックバック一覧です: 形態素解析:






