2014-06-01から1ヶ月間の記事一覧

文節境界解析のラベルと性能

NLP

文節境界解析で使うラベルで、BIとBILUの2種類でどちらが性能がよいかを検証してみた。結果的にはBIだけのほうが性能が高かった。 前回の輪読会で紹介した固有表現抽出に関する論文の中で印象に残ったことのひとつとして、系列ラベリングに使うラベルで最近…

社内輪読会で「Joint Inference of Named Entity Recognition and Normalization for Tweets」を紹介した

NLP

社内輪読会で論文を紹介した。 今回はACL2012からJoint Inference of Named Entity Recognition and Normalization for Tweetsを紹介。 内容 ツイートから固有表現抽出(NER)、及び、固有表現の正規化(NEN)を行っている。提案のポイントは、これまで、NERとNE…

大阪PRML読書会#7に参加した

少し前になるけど、大阪PRML読書会#7 - 大阪PRML読書会 | Doorkeeper に参加した。 前回に続いて2回目の参加。大阪PRML読書会、良いんだけど、月1なので前回の話を結構忘れてしまう問題がある。あと、1回で進むのが15ページくらいなので、読み終わるのが3年…

Comainu for 中古和文

中古和文版の長単位解析Comainuを作って、リリースした。https://sourceforge.jp/projects/comainu-emj/ BCCWJ(現代日本語書き言葉均衡コーパス)を作るときに、長単位解析をしていて、現代文に関しては終わったのだけど、そのあと中古和文でもという話があっ…