word2vecのdistance.c
変数がいっぱいある
%lld フォーマット文字列、「long long d」
st1 :入力された単語(1文字ずつ読んでいる。stへの代入を見ると、スペースがあってもいい)
st: 配列の中にスペースで区切られたst1を入力している
words, size:trainしたバイナリファイルの1行目にあった。多分、語彙数とウィンドウサイズ
cn 入力された語数
「Word Cosine distance」以降
vec…ウィンドウサイズ分のベクトル
121行目から語彙(words)中のベクトルを比較している
(20150108)
なんとなくは分かったが途中で時間がないのでPythonで
from gensim.models import Word2Vec
とした方が早かった
大文字でimportすると
http://radimrehurek.com/gensim/models/word2vec.html
でバイナリファイルが読み込めるのはなんか種類が違うんだろうか