WindowsにSenをインストールする方法 | presosaiso

2008/01/18

WindowsにSenをインストールする方法

必要なファイルは、Perl(今回はActivePerl)、Ant、そしてSen

1. 導入
Perlはインストーラでお手軽インストール。
Ant、SenはDownloadしたら、Program Files内には入れてはいけない
スペースがあるとうまくPathが通らないためにエラーに泣かされる。
なのでC:\Javaとか作ったりしてどっちも突っ込んどく。

2.辞書の構築
UTF-8にしたかったら

sen\conf\sen.xml、sen-processor.xml 内
<charset>utf-8</charset> に変更

sen\dic\dictionary.properties 内
sen.charset=UTF-8 に変更 # dic.charset=EUC_JPは変更しない

コマンドプロンプトで、

> cd c:\Java\sen\ <-senを解凍したディレクトリ
> cd dic
> c:\Java\apache-ant-*.*.*\bin\ant -Dperl.bin=c:\Perl\bin\perl.exe

3.動作確認
> cd c:\java\sen\bin
> set JAVA_HOME="c:\Program Files\Java\jdk*.*.*"
> set SEN_HOME="c:\Java\sen"
> sen.bat
.....
SenはJavaで実装された形態素解析器です。 <- 入力したテスト文
Sen (Sen) 未知語(0,3,3) null null
は (は) 助詞-係助詞(3,4,1) ハ ワ
Java (Java) 未知語(4,8,4) null null
で (で) 助詞-格助詞-一般(8,9,1) デ デ
実装 (実装) 名詞-サ変接続(9,11,2) ジッソウ ジッソー
さ (する) 動詞-自立(11,12,1) サ サ
れ (れる) 動詞-接尾(12,13,1) レ レ
た (た) 助動詞(13,14,1) タ タ
形態素 (形態素) 名詞-一般(14,17,3) ケイタイソ ケイタイソ
解析 (解析) 名詞-サ変接続(17,19,2) カイセキ カイセキ
器 (器) 名詞-接尾-一般(19,20,1) キ キ
です (です) 助動詞(20,22,2) デス デス
。 (。) 記号-句点(22,23,1) 。 。

0 件のコメント: