ビッグデータの衝撃を読んだ

読んだのは1ヶ月以上前。最近忙しくて書く暇なかったけど、論文書き終わって締切りに追われなくなったので、忘れないうちに印象に残ったところを書いておく(既に結構忘れてる)。


内容としてはビッグデータを活用した事例がたくさん紹介されていた。

1番印象に残ったのは、有名な話なんだろうけど、知らなくて驚いたのがreCAPTCHAの話。
スパム対策だけが目的のものかと思っていた。スパム対策も目的の1つなんだけど、もう1つの目的として「書籍のデジタル化」(具体的にはOCRの認識性能の向上)があるということ。普通にホームページにも書いてあるけど、知らなかった。
http://www.google.com/recaptcha/learnmore
機械で認識が難しかった画像をreCAPTCHAで出して、人間に教えてもらおうというもので、スパム対策をしつつ、OCRの認識性能向上のための機械学習のデータを収集できる仕組みになっている。同じ仕組みで2つの異なる目的を解決しようとしているというのもそうだけど、そこに人間が自然に(自然というのは言い過ぎかもしれないけど)関わっているのは良い仕組みだなと思った。

あと印象に残ったのは最後のほうに書いてあったデータ駆動企業になるのを妨げる企業体制・企業風土として挙げられていた以下の点。

  • 「ウチでは昔からこうしてきた」という「常識」が幅をきかせ,その正当性が検証されない。
  • 経営陣がデータや事実の裏づけのない意思決定をしても、批判されない。むしろヒラメキ型のリーダーの方がもてはやされる。
  • 分析のスキルを備え、データの山から宝を堀り出そうとする人間がいない。何も思いつかないとき仕方なくやるのが分析だとされ、しかも専門知識をもたない人間が取り組んでいる。
  • 「そのアイデアはよいか悪いか」よりも「それをいったのは誰か」が問題にされる

ちゃんとやるなら会社として力をいれないとうまくいかないということなんだろう


もう1年以上前の本だから結構知っていることも多かった。適当に流し読みしたけど、reCAPTCHAの話はおもしろかった。


ビッグデータの衝撃――巨大なデータが戦略を決める

ビッグデータの衝撃――巨大なデータが戦略を決める