2024年

2023年振り返り 去年の目標はインプットでした skozawa.hatenablog.com 機械学習 ChatGPTなどのLLMがかなり盛り上がった年だった。 LLMの流れがかなり速いのでインプットは追いついていない。 論文も少しは読んだけど、そこまで数は多くなかった。 それでも…

2023年

去年の振り返り 去年の目標はアウトプットとチャレンジでした。 skozawa.hatenablog.com 前半は本の感想書いたり、読んだ論文の実装を手元で試したりと、自分にしてはまぁまぁアウトプットできていたんだけど、5月あたりから仕事でバタバタしてそれ以降はア…

プロダクト関連の本を読んだ

Hidden Technical Debt in Machine Learning Systems にも書かれているように、システム全体に対して、機械学習のコンポーネントはほんの一部という話はよく言われるようになってきたと思う。 同様に、プロダクトに対して、機械学習を使った機能も(重要では…

SVMs with Problem Context Aware Pipeline を試した

社内でやっているGunosyDMという論文読み会で少し前に Enhancing SVMs with Problem Context Aware Pipeline という論文を読んだ。シンプルで分かりやすかったので少し手元のデータを使って実験してみた。 論文について 論文の概要としては DNNは計算コスト…

失敗の科学を読んだ

年末年始にいくつか本を読んでいたが、失敗の科学という本が面白かった。失敗の科学 失敗から学習する組織、学習できない組織作者:マシュー・サイドディスカヴァー・トゥエンティワンAmazon 内容的には、失敗をしたときにきちんとその失敗から学びましょうと…

2022年

今年はもう少しアウトプットしようかなと思い、だいぶ久しぶりの日記。去年はなんとなくまったり無理せずな1年だった。 今年はもう少し頑張ろうかなということで、今年の目標は アウトプット 最近は企業ブログにたまに書くくらいであまりアウトプットできて…

2017年振り返り

2017年を振り返る。2017年目標 - skozawa's blog 手を動かす、行動する VPSを移行したかったので、ansible触ってみたり、pythonで少しアプリ作ってみたりした。apacheからnginxになってある程度モダンにできたのでよかった。 あとは転職がらみで、いくつかの…

はてなを退職しました

正式には2017年10月15日付での退職ですが、9月29日が最終出社日でした。 はてなには2012年4月に新卒で入社して5年半、濃密な時間を過ごさせてもらいました。大変お世話になりました、ありがとうございました。 はてなでの5年 はてなでは、アプリケーションエ…

PyCon JP 2017に参加した

PyConJP 2017に参加してきた。トークを応募していたので、本当はトークできたらよかったけど、落ちてしまったので、聴講のみの参加。 聞いてある程度覚えているものを。 野球を科学する技術〜Pythonを用いた統計ライブラリ作成と分析基盤構築 slide 野球の分…

言語処理学会に参加した

筑波大学であった、言語処理学会第23回年次大会に参加してきた。参加したのは2日目と3日目。 聞いてある程度メモをとれたものを残しておく。徐々にメモするの疲れてきて3日目のはあまりメモとれてない。 『現代日本語書き言葉均衡コーパス』への情報構造アノ…

論文メモ: Linguistic Benchmarks of Online News Article Quality

ACL2016 の論文 Linguistic Benchmarks of Online News Article Quality を読んだのでメモ。 自分がやってみたいと思ってることに近いことをやっていて面白い。 概要 オンラインニュースの質を測れるかを検討した論文。質という1つの指標で表すのではなく、…

2017年目標

今年の目標を考えた。 手を動かす、行動する 去年は考えることが多い1年だった。それはそれで視野を広げられた気がするのでよかったけど、何もできなかった感がどうしても出てくるので、今年はもう少し実行性を高めていきたい。中長期的にやりたいことももう…

2016年振り返り

2016年を振り返る。 目標 2016年目標 - skozawa's blog 中・長期的な計画を立てて実行する 全く実行できなかった やりたいと思ってることと似ていることをやっている論文 ( Linguistic Benchmarks of Online News Article Quality ) は見つけたのでもう少し…

エンジニアの立ち居振る舞い: ボトルネックを作らないように

お題「エンジニア立ち居振舞い」僕が意識しているエンジニアの立ち居振る舞いは、チーム開発におけるボトルネックをなるべく発生させないようにすること。エンジニア、デザイナー、企画、ディレクターなどがいるチームで開発していると、エンジニアリングや…

最近読んだ本

最近興味のある話題について、いくつか本を読んだのでその感想。 フォーカス フォーカス作者: ダニエル・ゴールマン,土屋京子出版社/メーカー: 日本経済新聞出版社発売日: 2015/11/26メディア: 単行本(ソフトカバー)この商品を含むブログ (1件) を見る最近…

論文メモ:NLP2016

今年は言語処理学会に参加できなかったので、proceedingsを眺めて気になった論文を斜め読みだけした。メモ程度だけど残しておく。 来年の言語処理学会はどこなんだろ、筑波大?行けるといいな。 慣用句感情コーパスの構築および慣用句感情表現辞書の拡張 単…

Yahoo! JAPAN データ&サイエンスワークショップに参加した

yahoo-ds-event.connpass.com 関西であまりデータサイエンティスト系のイベントないので、参加してみた。 東京では、3回に分けてやったものをまとめてやったらしい。東京のやつのほうが内容濃くて面白そうな気もする。 Yahoo! JAPANデータサイエンスワークシ…

2016年目標

今年の目標を考えた。 中・長期的な計画を立てて実行する メインの目標。 去年からの継続だけど、やりことは去年のうちに決まったので、実現のための計画をたてて実行に移したい 日々のことを記録する 去年の振り返りをしようとしたときに結構何を考えて何を…

2015年振り返り

2015年を振り返る。 目標 2015年目標 - skozawa's blog 何か発表する 発表が夏頃に集中した感じだけど、5回くらい発表できた。 本読む 15冊くらい読んだ。3つ目の目標と関連しそうなものを中心に読んだつもり。 文章理解の認知心理学:ことば・からだ・脳 認…

Semi-supervised Sentiment-aware LDA

NAACL 2015の論文のLCCT: A Semi-supervised Model for Sentiment Classificationを読んだ。メモと気になった部分を軽く実装して試してみた。感情分析で、コーパスベースのアプローチと辞書ベースのアプローチでco-trainingする話。 コーパスベースのアプロ…

長単位解析器Comainu 0.72をリリースしました

中・長単位解析器Comainuのバージョン0.72をリリースしました。 バグフィックスです。リリース comainu 0.72 - 中・長単位解析器 Comainu - OSDN一部にハッシュの順序を前提としたコードが含まれていたため、ハッシュの順序がランダムとなったPerl5.18以降で…

表現/発想/言葉の技術を読んだ

少し前に広告コピーの本を読んでいて、その関連でたまたま本屋で見つけた「言葉の技術」が面白かった。少し調べたら同じ電通関連の本があることがわかったのでそれも含め3冊読んでみた。 表現の技術 感情を振り子に例えて、より振り子を大きく振らすための表…

YAPC::Asia Tokyo 2015の前夜祭で発表しました

初めてYAPC::Asiaに参加して、前夜祭で発表してきました。はてなブックマークのトピックページの裏側 - YAPC::Asia Tokyo 2015yapcasia.org YAPCの前夜祭の雰囲気をよく知らずに、ものすごい真面目というか硬派な発表をしてしまった。みんなビール飲んでるし…

Elasticsearch勉強会 in 大阪/京都で発表しました

京都と大阪であったElasticsearch勉強会で発表をしてきました。 もともと京都でだけ発表する予定でしたが、発表者が足りないとのことだったので急遽大阪でも同じ内容を発表しました。Elasticsearch勉強会 in 大阪 - elasticsearch勉強会 | Doorkeeper Elasti…

Hatena Engineer Seminar #5で関連記事レコメンドエンジンの開発について話しました

Hatena Engineer Seminar #5 で「はてなブックマークに基づく関連記事レコメンドエンジンの開発」というタイトルで話しました。 この内容です。「関連エントリー」機能のアルゴリズムを改善しました - はてなブックマーク開発ブログbookmark.hatenastaff.com…

認知心理学の本を読んだ

最近、認知心理学について少し興味が出てきたのでいくつか読んでみた。 自然言語処理の研究をしていたけど、認知科学のことは勉強するタイミングなかったせいか、全然知らなかった。けど、言語処理してるんだから、認知科学のこと多少は知っておいてもよいの…

長単位解析器Comainu 0.71をリリースしました

中・長単位解析器Comainuのバージョン0.71をリリースしました。 機能的な変更点はなく、unidic2 (unidic.db) の公開への対応が主な変更です。 unidic2を近日リリース予定としてから1年たってしまいました(すいません...)が、unidic2の一般配布に関する確認が…

言語処理学会に参加した

NLP

今年は京都(京大)であったということもあって、言語処理学会第21回年次大会に参加してきた。 16~21日でチュートリアル、本会議、ワークショップとあったけど、本会議の1,2日目とワークショップの計4日間参加。 本会議で発表を聞いたものの中から覚えてい…

論文紹介:HEADY: News headline abstraction through event pattern clustering

NLP

2週間くらい前になるけど、社内輪読会があって論文紹介をした。 今回はACL2013の HEADY: News headline abstraction through event pattern clustering を紹介した。 内容 同じ内容のニュースの集合に対してヘッドラインを生成する話。固有表現を汎化してパ…

日本語WordNet-Affect構築のnltk3対応

NLP

前に作った、日本語WordNet-Affect作るためのスクリプトが動かないとコメントをもらったので修正した。 日本語WordNet-Affectの構築 - skozawa's blog python2、nltk2系だと動いていたけど、バージョンを固定しないとnltk3が入るようになっていつの間にか動…