開発
Word2Vecを試してみた
Takumi Yamashita
アルバイトスタッフの山下です。
最近、アルバイトで自然言語処理の勉強をする機会が多く
それに伴い今回は「語」を「200次元のベクトル」に変換する ” Word2Vec ” を試しに使ってみました。
Word2Vecを拾ってくるのですが公式からのダウンロードリンクが404なのでgitからとってきます。
デモ実行までの流れは以下の通り
git clone https://github.com/svn2github/word2vec.git cd word2vec make ./demo-word.sh
少々時間がかかりますが、その後
“Enter word or Sentence” とメッセージが来るので単語を打つと単語間の距離が近い順に出力されます。
それでは “cat” という単語を入力してみましょう。
catの “cats”(catの複数形), “meow”(猫の鳴き声), “feline”(ネコ科の)が上位に来て時点で”dog”になっています。
続いて “car”
次は “increase”
最後に “high”
increase や high はその反語である decrease や low が上位に来ています。
また、他言語にも対応しており公式のリファレンスを見ながら自分で教師に使うデータを選ぶこともできます。
公式:https://code.google.com/archive/p/word2vec/
[参考にしたサイト]
http://qiita.com/okappy/items/e16639178ba85edfee72
http://qiita.com/EastResident/items/e3ee20f281529a253a61