Eyes, JAPAN Blog > Word2Vecを試してみた

Word2Vecを試してみた

Takumi Yamashita

この記事は1年以上前に書かれたもので、内容が古い可能性がありますのでご注意ください。

アルバイトスタッフの山下です。

最近、アルバイトで自然言語処理の勉強をする機会が多く

それに伴い今回は「語」を「200次元のベクトル」に変換する ” Word2Vec ” を試しに使ってみました。

Word2Vecを拾ってくるのですが公式からのダウンロードリンクが404なのでgitからとってきます。

デモ実行までの流れは以下の通り

git clone https://github.com/svn2github/word2vec.git
cd word2vec
make
./demo-word.sh

少々時間がかかりますが、その後
“Enter word or Sentence” とメッセージが来るので単語を打つと単語間の距離が近い順に出力されます。

それでは “cat” という単語を入力してみましょう。

b1

catの “cats”(catの複数形), “meow”(猫の鳴き声), “feline”(ネコ科の)が上位に来て時点で”dog”になっています。

続いて “car”

b2

次は “increase”

b3

最後に “high”

b4

increase や high はその反語である decrease や low が上位に来ています。

また、他言語にも対応しており公式のリファレンスを見ながら自分で教師に使うデータを選ぶこともできます。

公式:https://code.google.com/archive/p/word2vec/

[参考にしたサイト]

http://qiita.com/okappy/items/e16639178ba85edfee72

http://qiita.com/EastResident/items/e3ee20f281529a253a61

 

Comments are closed.