今ATOK2007を使っているのだが、ついにATOK2008でn文節最長一致をやめるようだ。
n文節最長一致とは、文を先頭からn文節目までの合計の長さがもっとも長いものを正しいと見なす方法である。ちなみに経験的に後半が長いものを正しいと見なすようだ。
さて、なぜATOK2008になって急にATOKはこのn文節最長一致をやめたのだろうか?
PC Watch「ジャストシステム、一太郎/ATOKなど含む「JUST Suite 2008」を発表」
うーむ。近年稀ではなくなってきたという表現が曖昧すぎる。
私としては、前からATOKは文節を長くすればするほど失敗してしまう印象だ。
だから今回の内部アルゴリズムの変更は「ついにやったか!」という感じだ。
統計的言語処理手法ということだが、最小コスト法ではないのか?
まぁ、手に入ったら実際に使ってみていろいろとレビューしてみたい。
≪追記≫
ATOK2008レビュー
ATOKは従来、最も長く取れる2文節を優先的に選択する「n文節最長一致法」を採用していたが、近年この手法による誤変換の発生が稀ではなくなってきた。そこで、出現頻度や言語的性質などを数学理論によって1つの評価軸の上に積算する統計的言語処理手法を採り入れた。また、機械処理に頼らず、人手によ る検証と微調整を重ねることで、体感的な変換精度を向上させたという。
うーむ。近年稀ではなくなってきたという表現が曖昧すぎる。
私としては、前からATOKは文節を長くすればするほど失敗してしまう印象だ。
だから今回の内部アルゴリズムの変更は「ついにやったか!」という感じだ。
統計的言語処理手法ということだが、最小コスト法ではないのか?
まぁ、手に入ったら実際に使ってみていろいろとレビューしてみたい。
≪追記≫
ATOK2008レビュー
0 件のコメント:
コメントを投稿