2017-03-01から1ヶ月間の記事一覧

JUMANが解析した時のコストを見たい

jumanに-detailオプションを付ける juman/dicにあるようなコストを基に計算されている(多分)バイト数で文字をカウントしていて、「何文字目までのコストが○○」という形で計算している

文字列が数字かどうかを簡単に判定したい

isdigit()を使うhttp://d.hatena.ne.jp/artgear/20120217/1329493335 入ってくる値が「数字」か「自然言語」だけなのか、あるいは「数字でできているけど数ではないもの」も入ってくるのかによって簡単さが違ってくる 簡単にやるなら先頭の文字についてisdig…

eclipseでRを書きたくなった

追記 補完を行うならそもそもRstudioを使った方がいいのでは? Rstudioならtabで補完出来そうだから… StatET を使う http://www.walware.de/goto/statet ここで自分のeclipseのバージョンに合わせたダウンロードサイトを指定ホームの指定方法 http://pracmpe…

pythonの文字種判別は簡単だった

http://furodrive.com/2014/04/zenhan/ 文字を不等式で比較することで、文字コードの大小比較が可能となるため文字種判別が容易