123 P(A|B)P(B)P(B|A)=-----------------・・・ベイズの定理P(A)
ベイズの定理を踏まえたうえで、あなたの彼女のチョコレートが本命である確率をベイズの定理を用いて判別してみよう。ここで…
P(B|A)・・・Aが起きた後Bが起きる確率
P(A|B)・・・Bが起きた後でAが起きる確率
P(A)・・・Aが起きる確率
P(B)・・・Bが起きる確率
である。ベイズ更新の概念を持ち出せば、この難問も主観統計的には解ける。
☆画像はチョコレート – Wikipediaより引用
ベイズの定理より一般化すると…
12345 Dが得られたときにHが成立している確率HのもとでDが生じる確率*Hが成立する確率=---------------------------------------Dが得られた確率
ここで、
D:チョコをもらう(D:データ)
H:本命である(H:仮説)
より一般化して…
12345 チョコをもらうときに本命である確率本命のときにチョコをもらう確率*本命である確率・・・「事前確率」本命か?義理か?=-----------------------------------------チョコをもらえた確率・・・加法定理と乗法定理を使って求める間接的な値。
◆尤度表
チョコGet確率 or Lost確率/本命 or 義理 | 本命 | 義理 |
---|---|---|
チョコGet確率 | 0.4 | 0.2 |
チョコLost確率 | 0.6 | 0.8 |
◆「事前確率」本命か義理か?
本命 | 義理 |
---|---|
0.5 | 0.5 |
のとき、チョコをもらえた確率を加法定理と乗法定理を使って、分母は…
0.4*0.5+0.2*0.5=0.3
となる。
これは…
チョコをもらえた確率=本命のときにチョコGet確率*本命確率+義理のときにチョコGet確率*義理確率
という等式で求められる。ゆえに…
チョコをもらうときに本命である確率=(0.4*0.5)/0.3=0.666・・・=67パーセント・・・答え
これが回答で、至極当然だが数理的にもチョコをもらえばそれは本命というほうの確率が高いのがわかった!よりデータを収集して、ベイズ更新をすればもっとデータは集まるようになっていくはずだ。アルゴリズムとしてはいくつか考えられるだが、ここでは面積図を求めずにガンガン数式で攻めてみた。ほかの方法でもやっていることは同じ。まとめると…
①事前確率を主観的に指定する。
②調査データとして尤度を作っていく。
③ベイズの定理に基づいて、データを更新していく。
④事前確率によって事後確率がベイズ推定で求まる。
といったところか。
注意しておきたいのは、このベイズ推定は主観確率であり客観確率ではないということだ。 だから批判もあるが、MSやGoogle、Amazonといったような大手のIT企業がこのあたりを押さえていて、ベイズ・ラプラス統計学の歴史がよみがえっているのも事実である。ただし過信は禁物!
※感想
いかんせん加法定理と乗法定理を使ったので(面積図を使わず)、わかりにくくなった。面積図を使用したければ以下の参考書をぜひ。