2012年3月11日日曜日

統計学を拓いた異才たち

統計学の歴史に関する本。カール・ピアソンによる一般の確率分布の4つの母数(平均、分散、歪度、尖度)をデータから推定するのが、科学の仕事である、という1890年代の統計革命の開始から、現在のカーネマン・トヴァスキーの個人確率までの100年余り統計学や確率論の話題を、数式を用いず、いろいろな逸話を交えて説明した本です。数式を用いない以上、どうしても分かった気にならない部分もありますが、この本はいい本です。面白い。

特に興味深かったのは、フィッシャーが喫煙は肺癌の原因だと認めることはできないと、最後まで主張した点。彼の主張は、癌にかかったヒトを後から調べて煙草をすっていたからといって、肺がんの原因が癌とは言えない、というもの。もしかしたら、癌になる遺伝子があり、その遺伝子を持った人が煙草を好む傾向にあるのかも知れない。煙草が癌の原因であると主張したいなら、彼の開発した実験計画法を使わないとダメ。つまり、ヒトを多数集め、そのうちランダムに選んだヒトに煙草をすわせ、残りの人に吸わせずにいて、この二つの集団で癌になる比率に「有意」な差があるなら、煙草が癌の原因(のひとつ)であると科学的に主張できる。もちろん、こういう実験はなかなか難しい。実際の研究は、癌にかかったヒトとかかっていないヒトのデータを集めてきて、後付けの知恵で解析するもの。彼の主張は正しいです。後付けの知恵でいいなら、いくらでも自説に有利に証拠固めが可能なので。その点、アメリカでは「差別訴訟」で、統計学の結果を証拠採用するかどうかでもめているそうで、統計学者はフィッシャーの論理で反対しているとも。

あと、個人確率で関してカーネマン・トヴァスキーの研究をコルモゴロフ流の確率論で扱うなら、ヒトのもつ「確率」は5つの値しかもたない、というスペッスの理論も興味深いです。

1:きっと正しい
2:どちらかといえば正しい
3:正しいか間違っているか同等
4:どちらかといえば間違っている
5:きっと間違っている

の5段階でヒトは確率を把握する、という理論。たしかに、ヒトは降水確率60%と70%の差を認識しているとは考え難い。けれど、競馬のオッズの精度は1%。得票率x%の馬の勝率はx%という法則が得票率1%から60%のほぼ全域で成立する。ヒト一人ひとりではあやふやでも、情報にコストがかかり、かつ多数が参加すれば集団での確率の認識力は高くなるのでしょう。

最後の競馬の話は蛇足ですが、この本に書いていることを数式を交え、逸話や概念の丁寧な説明もある確率・統計の本を読みたいものです。



0 件のコメント: