書評「Rによるセイバーメトリクス入門」MLB解析必携の書 | ゲヲログ2.0

書評「Rによるセイバーメトリクス入門」MLB解析必携の書



Rによるセイバーメトリクス入門

“セイバーメトリクス”っていうとなんかの広い意味の用語に聞こえるかもしれない。おっとそりゃ勘違いだ。野球に統計学の戦略を持ち込んだ手法のことをセイバーメトリクスと呼ぶ。この本は事実上のセイバーメトリクスの教科書・定本である。欧米でもそのように扱われている書の邦訳版がようやっと先日出版された。

野球はフィールディングポゼッションを主とするサッカーとは違うので、統計学の知識をうまく活かせるような球技である。具体的な指標が成績にすぐに反映されるので、実は球技の中でも統計的に抜群に扱いやすいスポーツ競技なのだ。例えば、デッドボール・四球・三振も、投球コース・変化球すべてにわたり、その切り抜いた場面場面に合わせ、セットで解析器に入れることで容易に生きた知識が得られる。これと同じことをサッカーでやろうとしても、なかなか難しいだろう。フットボールは足の速い、いわばシンプルすぎる競技なのだ。

本書のいいところは初心者でもコードを打ちながら勉強できるところだ。ただし、Rの技術としては中級以上が必要なので、初心者は入門本を別書で当たるべきだ。plotの複雑な構成やパイプ演算子の解説(まぁ実はパイプ演算子の解説は本書にもあるんだけど…)をすぐには理解できないだろう。これらの技術が豊富にコーディングに使われているので、Rはじめたての方にとってはそれなり難しい部類に入るはず。

学べることは、ぶっちゃけ表紙に書いてある。勝率分析や得点力の解析、選手にとっての好不調も含めたキャリア解析、”勝つための指標”を主としてコーディングの手法と解説が多く入ってる。演習問題も簡単なものから始まり豊富だ。総じて見ると、”勝つための指標”…得点力をプロットで描くためのバッティング・バッターよりの応用解析手法が豊富であるのが本書の最大の特徴だ(マルコフシミュレーションまであるという本格派…)。あんま、ピッチングのほうはふれてないんで、守備に重きを置いた別書、特にピッチング解析書を(もしそれがあったら)あたってみるといいかもしれない。

あと、解析に必要なcsvは簡単に手に入るのもいいところだ。ネット上にいくらでも、ライブラリがフリーで公開されている。だからすぐにクレンジングして使える。簡単な数理テーブルをRで解釈して、結果を視覚的に出力できる。まぁ、Rの勉強にもなるね。Rの勉強になるっていう、この点では「遺伝統計学の基礎」「Rによる医療統計学」に近しいかもしれない。

画期的な名著であることは間違いない。あたしは、ほか絶賛してるレビュアーと意見同じくして、さらに(勝手に)続刊を希望しているところよ。