【連載:クマでも読めるブックレビュー】「データ分析力を育てる教室」松本 | ゲヲログ2.0

【連載:クマでも読めるブックレビュー】「データ分析力を育てる教室」松本



データ分析力を育てる教室 松本 健太郎(著/文) – マイナビ出版 | 版元ドットコム

本書は本当に画期的だ。書の内容をもし仮に一言で言い表すならば【既存のデータの存在価値に流されず、本質的に考えろ】ということだろう。どんなデータもデータそのままでは商売にならんし、論文にもならぬ。それは松本が言うように、行先の決まった列車に乗るか?あるいは同じ行先の飛行機に乗るか?ということに過ぎない。北海道に旅行に行きたいという夢を叶えるルートに必要なのは、”本当にガチな面では”その夢そのものであって、旅路を列車にするか、それとも飛行機にするかのどちらかではない。なぜかっていうと、そのどちらを選んでも北海道には着くからだ。

この例えは漫画の例でも表現できると思う。たとえ、絵が上手くても漫画家にはなれない。絵がそこそこ上手くて、なにより本質的なストーリーの魅力がなければ、漫画にはならない。絵が上手くて画家になる人は確かにいる。だが、画家が即、漫画家になれる力量を持っているとは限らない。漫画家になるには総合力が求められ、判断力や表現力が求められる。漫画家には絵の本質的な魅力を構成する力が求められるのに対して、限られたリソースで絵という限界表現を一瞬で体現するのが画家である。そしてデータサイエンスは、この事例で例えたとき、どっちかというと画家になる必要はなく、漫画家になる必要があるのだ。

これを写像として、も一度とらえてみよう。同様な論理によって、高度な数式処理を考えても、それが長年をかけてまことに高級な論法が経験則としても素晴らしいものだととらえられない限り、称賛には値しない。こと実務にかけては、賞賛すべき業績が煮詰まった段階で活用しても意味はない。とっくのとうにその業績のツールは評価され、一般化されているからだ。松本は文系の視点で、数理モデルでは解決できない実務を取り扱ってきたかただろうから、さらにそのことが目に見えて感じられるのだろう。現に松本は言う。

今でも覚えていますが、あるメーカーのブランドマネージャーに「君は数字ばかり見て、数字を生んだ消費者を捉えていない。こんなレポートにお金は払えない」と激怒されたときは、本当に顔面蒼白になりました。

本書p3より

つまり、徹底的にデータサイエンスを問うと、結局のところ斬新なかつ本質的な考え方が求められるわけ。コアコアで中身のある思考回路が求められるのであって、あくまで、数式や数字はツールに過ぎないことを忘れていけないと松本は主張する。これはゲヲログの考え方にも妙に似ている。例えば、株価とPVの推移をホワイトノイズ的に捉え単純加重平均で解釈したとする。たしかにそれは凄いことだ。もしそれで株価の予測が出来たら凄いと思う。だが、なぜ株価の予測に適した形が出来たのか?なぜ本質的に株価の予測ができたのか?という理由まで浸食して考えなければ、データサイエンスの論文にはならない。

ビッグデータについても、データがすべてではない、という点では同様だ。結論から言うと、古典力学のモデルをデータサイエンスに適用するのは、まったくお門違いなんである。それは数字でモノゴトを語るということしかしないから。その意では、データサイエンスと純粋数学は待った違う学識領域なんだよな。実験的経験的知識,,,つまり求められているのは、血の通った知性に基づく証明であり、数理モデル的な証明ではない。経済学者の池田はこのように言う。

経験科学で、こんな数学みたいな書き方をしている学問は他にない。工学や生物学の論文で、定理とか証明というのは見たことがない。コースも警告するように、経済学はアダム・スミスの時代から政策科学だったのであり、古典力学をモデルにするのは筋違いなのだ。

池田信夫 blog : ロナルド・コース、1910-2013より引用

こと、データサイエンスという(松本が言うような)文理総合格闘技という種目は、そういう”数理証明”では体現できないものなんだよな。そういう意味では、そもそもオリジナルな論文を書く手法がどういったものなのか?という見地からも評価できる書だと思う。つまり、この書は【データサイエンスで実務を考えるとはどういうことか?】以外にも【データサイエンスでどういう論文を書くか?】という目的にも使えると思うんだ。

そして、本書にもその”答え”はまったく書いてない。これは至極当然のことで、データサイエンスの答案用紙に書く答えは受験と同様の問題ではないからである。ひとつの答えに絞って考えなければならないわけでないからだ。その部分は、自分で考え、自分の個性にあった方法を導出することが求められる。本書はそのためのヒントを提示しているに過ぎないんだね。