社内輪読会で「Topical Keyphrase Extraction from Twitter」を紹介した

会社で最近始まった論文の輪講で担当だったので、発表をした。

論文はできるだけ自分の分野のトップカンファレンスから選ぶということだったので、自然言語処理の国際会議のACLから論文を選んで紹介した。
今回紹介したのは、少し古いけど、ACL2011からTopical Keyphrase Extraction from Twitter
参加してる人はそれぞれ分野が違うので、どの部分をどの程度説明すればいいかが難しい。

内容

内容はTwitterからトピックのキーフレーズを抽出する手法の提案で、提案は主に以下の2点

  1. Context-sensitive Topical PageRank によるキーワードスコアリング
  2. relevanceとinterestingnessを用いたキーフレーズスコアリング

紹介したものを少し修正したものをアップした。


感想

1つ目はスコアリングの際にトピックを考慮することにより、PageRankのスコアリングの性能が向上するというもので、納得感がある。2つ目は少し微妙でPageRankのスコアではなく、別の指標を用いているけど、スコアの和をとっていたものを積にしたということによる性能向上が大きそうで、relevanceという新しい指標を利用することがどの程度効果があったのかがいまいちよくわからなかった。


それにしても、論文紹介とかすごい久しぶりにしたのであまりうまくできた気がしない。