JavaでMeCab
今日は前回の記事で掲載したMeCabをJavaから使えるようにしてみようと思います。
とはいっても、基本的に必要なライブラリは全て用意されているのでjava使いな人ならどなたでも出来ると思います。
環境
CentOS 5.5 final (VMware Fusion)
jdk-1.6.0_17
MeCab-0.98
mecab-javaライブラリ生成
今回もさくさくいきます。ここで気をつける必要があるのは、ファイル展開後Makefileに設定されているINCLUDEを
実行環境に応じてjdkがインストールされているパスに書き換えてからmakeする必要があります。
# cd /usr/local/src/ # wget []wget http://sourceforge.net/projects/mecab/files/mecab-java/0.97/mecab-java-0.97.tar.gz/download[] # tar xvfz mecab-java-0.97.tar.gz # cd mecab-java-0.97 # vi Makefile INCLUDE=/usr/local/jdk/include # make # ll [snip] MeCab.jar test.class [snip]
make後にMeCab.jarが出来ていれば必要なライブラリの生成は完了です。
サンプルの実行
といっても、先ほど生成したライブラリと一緒に生成されたサンプルをそのまま実行するだけですが。。。
ここは登竜門ということでお許しください。。。
注意として、事前に環境変数に LD_LIBRARY_PATH を設定しておく必要があります。
(このことに気づくのにどれだけ時間を無駄にしたか・・・)
# export LD_LIBRARY_PATH=/usr/local/src/mecab-java-0.97/ # java -cp .:MeCab.jar test -d ../dic 0.97 太郎 名詞,固有名詞,人名,名,*,*,太郎,タロウ,タロー,, は 助詞,係助詞,*,*,*,*,は,ハ,ワ,, 二郎 名詞,固有名詞,一般,*,*,*,二郎,ニロウ,ニロー,, に 助詞,格助詞,一般,*,*,*,に,ニ,ニ,, この 連体詞,*,*,*,*,*,この,コノ,コノ,, 本 名詞,一般,*,*,*,*,本,ホン,ホン,, を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ,, 渡し 動詞,自立,*,*,五段・サ行,連用形,渡す,ワタシ,ワタシ,わたし/渡し, た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ,, 。 記号,句点,*,*,*,*,。,。,。,, EOS BOS/EOS,*,*,*,*,*,*,*,* EOS
と言うわけでまたまたあっさりと動いてしまいました。
この勢いで次はPHPからも使えるようにしてみたい思います!!
しかし格女子、、、格助詞ってなんですか?(え