形態素解析をする時はmecabを使う。他にも何種類かあるらしいけど、知人にお奨めされたのでmecabで。

下記サイトが参考になる。

インストール方法(ていうより本家のサイト)
http://mecab.googlecode.com/svn/trunk/mecab/doc/index.html

mecab pythonを使う
http://d.hatena.ne.jp/yutakikuchi/20130215/1360884220

品詞IDの定義
http://mecab.googlecode.com/svn/trunk/mecab/doc/posid.html

ユーザの類似性の評価の前準備
オライリー:集合値プログラミングより
http://kiwitobes.com/clusters/blogdata.txt

おすすめの記事