- Python3からMeCabを使う http://qiita.com/taroc/items/b9afd914432da08dafc8
- pip → pip3にする
- 以下のqiitaから感謝しながら利用しました
- word2vecの学習済み日本語モデルを公開します | カメリオ開発者ブログ
- pixiv小説で機械学習したらどうなるのっと【学習済みモデルデータ配布あり】 - pixiv inside
- word2vecより文脈理解が優秀らしい
- 学習済みデータと利用法
- python3 exec.py >> exec.log
- python exec.pyだとmac標準のpython2.6系が使われ、日本語がうまく扱えない
- 一旦読めなくはない文章に変換可能。ここから精度をあげる方法を模索する。
- 実行時間はメモリ8GB、2013年のMBA、wikipediaベースの辞書で120秒程度、pixiv辞書なら20秒程度