2014-01-01から1年間の記事一覧
年末なので2014年を振り返る。 目標 2014年の目標何にしてたかというと、下の3つだった。 2014年 - skozawa's blog 技術を深める できたようなできてないような。もう少し深堀したかった気はするけど、それなりにはできたんじゃないかな。 本を読む 1ヶ月に1…
「ビジネスモデル全史」を読んだので印象に残った部分を簡単に書いておく。ビジネスモデル全史 (ディスカヴァー・レボリューションズ)作者: 三谷宏治出版社/メーカー: ディスカヴァー・トゥエンティワン発売日: 2014/09/18メディア: 単行本(ソフトカバー)…
今日は久々に自分の担当の社内輪読会だった。 今回はACL2014のActive Learning with Efficient Feature Weighting Methods for Improving Data Quality and Classification Accuracyを紹介した。ACL2014読み会が色んなところで開催されていたと思うけど、た…
データ解析や機械学習の話が気になったので、PyCon JP 2014に参加した。 PyCon JP 2014 - connpass 会場に電源とれる場所が少なく、あまりメモ取れてなかったので、記憶をたどりながら書いてるけどあんまり覚えてない。 Deep Learning for Image Recognition…
テキストマイニングシンポジウムに参加した。 第5回 テキストマイニング・シンポジウム:参加募集 - 言語理解とコミュニケーション研究会 1日目は企業の方の話が多めで公にできないことも結構あるみたいだった。 Twitterから抽出したプロファイルデータと購…
もう1週間くらい前になるけど、Scala Matsuri 2014に参加した。 ScalaMatsuri 2014 - Scala Matsuri 2014 | Doorkeeper 今年は?Scalaを作ったOdersky先生がいらっしゃていて基調講演などをされていた。メモ程度に気になった発表を残しておく。 Node.js vs P…
最近、データ分析に興味があるので、「ビジネス活用事例で学ぶデータサイエンス入門」を読んでみた。ビジネス活用事例で学ぶ データサイエンス入門作者: 酒巻隆治,里洋平出版社/メーカー: SBクリエイティブ発売日: 2014/06/25メディア: 単行本この商品を含む…
下の記事を見て、研究とかで使われるツールでちょっとインストールとかが複雑なものはもうDockerで配布したほうがいいのかなと思った。 専門用語を自動抽出するTermExtractをDockerで簡単に使えるようにしました - CreateField Blogなので、試しにCabochaとC…
「ITビジネスの原理」を読んだけど、個人的にはそんなに面白くなかった。 章構成は以下の通り。 ITビジネスは何で稼いできたのか ネットが世界を細分化する ネットワークとコミュニケーション 消費されるコミュニケーション ITの目指すもの、向かう場所 1~4…
文節境界解析で使うラベルで、BIとBILUの2種類でどちらが性能がよいかを検証してみた。結果的にはBIだけのほうが性能が高かった。 前回の輪読会で紹介した固有表現抽出に関する論文の中で印象に残ったことのひとつとして、系列ラベリングに使うラベルで最近…
社内輪読会で論文を紹介した。 今回はACL2012からJoint Inference of Named Entity Recognition and Normalization for Tweetsを紹介。 内容 ツイートから固有表現抽出(NER)、及び、固有表現の正規化(NEN)を行っている。提案のポイントは、これまで、NERとNE…
少し前になるけど、大阪PRML読書会#7 - 大阪PRML読書会 | Doorkeeper に参加した。 前回に続いて2回目の参加。大阪PRML読書会、良いんだけど、月1なので前回の話を結構忘れてしまう問題がある。あと、1回で進むのが15ページくらいなので、読み終わるのが3年…
中古和文版の長単位解析Comainuを作って、リリースした。https://sourceforge.jp/projects/comainu-emj/ BCCWJ(現代日本語書き言葉均衡コーパス)を作るときに、長単位解析をしていて、現代文に関しては終わったのだけど、そのあと中古和文でもという話があっ…
日本語版のWordNet-Affectが欲しかったので構築した。 WordNet-Affect WordNet-AffectはWordNetに対して感情情報を付与したもので、感情分析などに利用されている言語資源。 WordNet-Affect: an Affective Extension of WordNet日本語のWordNet-Affectを構築…
以前、(ryを分析したけど、そのときに気になっていた言語モデルで(ryが推定できるかを少し試してみた。 (ry - skozawa's blog 結果としては思っていたよりできなかった。 問題設定 基本的には穴埋め問題で、 まぁ、冗談はさておき作ったら報告よr(ry の場合…
会社で最近始まった論文の輪講で担当だったので、発表をした。論文はできるだけ自分の分野のトップカンファレンスから選ぶということだったので、自然言語処理の国際会議のACLから論文を選んで紹介した。 今回紹介したのは、少し古いけど、ACL2011からTopica…
大阪PRML読書会#6 - 大阪PRML読書会 | Doorkeeper に参加してきたPRML読みたいと思って買ってはいたものの、完全に積読状態で、さすがに一人で読むのはつらいなーというのもあっていい機会があればと思ってたところで、読書会を見つけて、ちょうど2章からと…
(ry という表現がなぜか気になったので、分析してみた(ryとは (イカリャクとは) [単語記事] - ニコニコ大百科とは (ryとは『以下略』を意味するネットスラングであ(ry 由来は、『(略)』とタイピングする際に、ローマ字で(ryaku)とする表記かr(ry つまりこ…
「ヤバい統計学」を読んだ全5章で各章に2つのエピソードとともに統計的思考について書かれている。 ファストパスと交通渋滞 ホウレン草とクレジットカード 大学入試とハリケーン保険 ドーピング検査とテロ対策 飛行機事故と宝くじ まとめるのが面倒なので面…
札幌であった言語処理学会第20回年次大会に参加してきました 1年ぶりの学会参加。 今年は3年ぶり?くらいの発表もしてきました。 発表内容はComainuをリリースしました - skozawa's blog もう論文も公開されてる http://www.anlp.jp/proceedings/annual_meet…
中・長単位解析ツールComainuをリリースしました。Comainu | 中・長単位解析ツールダウンロードはsourceforgeからできます。 ソースファイルとモデルファイルをダウンロードしてください。 モデルファイルは解凍すると1Gくらいあるので注意してください。 中…
昨日新年会をした、そんなに飲みすぎたつもりはなかったけど、今日はあまり調子がよくなかった。 そんなことはさてより、2014年にやりたいことをぼんやり考えた。 技術を深める 去年はいろいろなことに手を出そうとして結局うまくいかなかった感じがするから…