JavaでMeCab

今日は前回の記事で掲載したMeCabJavaから使えるようにしてみようと思います。
とはいっても、基本的に必要なライブラリは全て用意されているのでjava使いな人ならどなたでも出来ると思います。

環境

CentOS 5.5 final (VMware Fusion)
jdk-1.6.0_17
MeCab-0.98

mecab-javaライブラリ生成

今回もさくさくいきます。ここで気をつける必要があるのは、ファイル展開後Makefileに設定されているINCLUDEを
実行環境に応じてjdkがインストールされているパスに書き換えてからmakeする必要があります。

# cd /usr/local/src/
# wget []wget http://sourceforge.net/projects/mecab/files/mecab-java/0.97/mecab-java-0.97.tar.gz/download[]
# tar xvfz mecab-java-0.97.tar.gz 
# cd mecab-java-0.97
# vi Makefile
INCLUDE=/usr/local/jdk/include
# make
# ll
[snip]

MeCab.jar
test.class

[snip]

make後にMeCab.jarが出来ていれば必要なライブラリの生成は完了です。

サンプルの実行

といっても、先ほど生成したライブラリと一緒に生成されたサンプルをそのまま実行するだけですが。。。
ここは登竜門ということでお許しください。。。
注意として、事前に環境変数に LD_LIBRARY_PATH を設定しておく必要があります。
(このことに気づくのにどれだけ時間を無駄にしたか・・・)

# export LD_LIBRARY_PATH=/usr/local/src/mecab-java-0.97/
# java -cp .:MeCab.jar test -d ../dic
0.97
太郎	名詞,固有名詞,人名,名,*,*,太郎,タロウ,タロー,,
は	助詞,係助詞,*,*,*,*,は,ハ,ワ,,
二郎	名詞,固有名詞,一般,*,*,*,二郎,ニロウ,ニロー,,
に	助詞,格助詞,一般,*,*,*,に,ニ,ニ,,
この	連体詞,*,*,*,*,*,この,コノ,コノ,,
本	名詞,一般,*,*,*,*,本,ホン,ホン,,
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ,,
渡し	動詞,自立,*,*,五段・サ行,連用形,渡す,ワタシ,ワタシ,わたし/渡し,
た	助動詞,*,*,*,特殊・タ,基本形,た,タ,タ,,
。	記号,句点,*,*,*,*,。,。,。,,
EOS

	BOS/EOS,*,*,*,*,*,*,*,*
EOS

と言うわけでまたまたあっさりと動いてしまいました。
この勢いで次はPHPからも使えるようにしてみたい思います!!

しかし格女子、、、格助詞ってなんですか?(え