2011年1月22日土曜日

キャプテンバギーの懸賞金はいくらか?



ワンピースで活躍するキャラクターの一人に「道化のバギー」ことキャプテン・バギーがいます。昨年行った投票実験のクイズの問題に、彼の懸賞金に関するものがありました。

問題:漫画「ワンピース」に登場する、バギー海賊団船長「道化のバギー」の懸賞金はいくら?(2010年9月1日現在)
            A.1300万ベリー    
            B.1500万ベリー

この問題に31人の学生さんに答えてもらったところ、正解したのは18人で正答率は約60%。もし、誰も正解を知らないなら正解する人の数は15,6人で、ゆらぎは3人程度なので、ゆらぎの範囲内ともいえるのですが、その点は置いておいて(31人というのがネック)、次のように考えるとします。答えを知っている人は20%で残りの80%はヤマカンで答えていると。すると、ヤマカンであたる確率は50%なので、答えを知っている20%と答えを知らない80%のうちの半分が正解して60%という正答率が出ることになります。

では、この二択のクイズを次のように行うとします。

(1)一人一人が解答
(2)前回までの解答結果をAに何票、Bに何票と教える。たとえば3番目の人には過去2人の投票結果を票数で教える

このとき、投票結果はどうなるでしょうか?そのときの投票の様子を示したのが次の図です。



毎回の投票の様子を折れ線の延びであらわしています。正しい選択肢に投票するとx軸に1ステップ、間違った選択肢に投票すると、y軸に1ステップ進みます。原点から出ている対角線は、ちょうど二つの選択肢の得票数がイーブンの状況を示し、もうひとつの対角線は31回投票後に到達しうる状態(x+y=31)を表しています。最初に伸びていく折れ線は前回までの投票結果を教えない状況での投票の様子を示しています。二つの選択肢の間でゆらいでいる様子がわかると思います。最初の二人が間違った選択肢を選んでいることに注意してください。

次に伸びていく折れ線は、(2)に書いたように、前回までの投票結果を教えた場合です。最初の一人は、参考にできる投票結果がないので、投票結果を教えない場合と同じように間違ったほうに投票します。二人目は、参照しない場合でも間違っていたのですが、教えた場合、最初の人の間違った答えを参照したので、おそらくより自信を深めて間違った選択肢を選びます。3人目の人は、参照しない場合は正しい選択肢を選んでいたのですが、今の場合は二人目までが間違った選択肢を選んでいるので、それに影響されて間違った選択を行う。この間違いの伝播が16人目まで続き、ひたすらy軸のほうに折れ線が進んでいきます。17人目に、やっと正解を知っている人が現れて、折れ線がx軸に1ステップ進むのですが、その時点で正解と不正解の得票数は1対16。それ以降の人々は、正解を知らなかったみたいで、全員が間違った選択肢を選び続けるようになります。(この結果を見ると、正解を知っていたのでは31人中1人で、残り30人は知らなかったことになり、20%80%という最初の評価にはすこし誤差があることがわかりますが。)

実験では、正解率が50%より高く、70%以下のクイズが全部で78問ありました。平均の正答率は60%で、この数字から正解を知っている人は20%、正解を知らない人は80%ということがわかります。正答率は50%より高いので、何も知らないで投票し、多数決で正解を推定すると100%正しい解答を選べたことになります。では、前回までに投票した人の投票結果を見せて投票させると、どうなるのか?そのときの正解率の分布を以前お見せしました。20%のところに小さなピーク、100%のところに大きなピークのある緑のヒストグラムです。では、このヒストグラムで正答率が50%未満のもの、つまり多数決を使うと間違った選択肢を選ぶことになるものがどれぐらあったかというと、16問。つまり2割強の比率で情報カスケードにより、選択を誤るわけです。



では、正解が知らない人がp%存在する(正解を知っているのは1-p%)とき、多数決で選択肢を選ぶと間違う確率はいくらなのでしょうか?論文の結果を示したのが、左の図です。αで間違う確率、つまり誤った選択肢の得票率が50%を超えてしまう確率を示しています。x軸は、無知な人々の比率。pが50%以下なら、その確率はセロなのですが、50%を越えるとゼロでなくなり、100%では確率50%で多数決が誤ることを教えてくれます。100%の場合は正解を知っている人が誰もいないので、誤る確率が50%になることは自明なのですが、無知な人が50%を超えると多数決で間違う確率が増加する様子は興味深いものです。特に50%での増加の様子は、情報カスケードが2次の相転移(確率の変化は連続で、その微分が不連続)であることを教えてくれます。

この式に、無知な人の比率が80%という値を代入します。すると、αは3分の1となり、3回に1回多数決が間違うことになります。実験では、78問中18問の2割強だったので、若干(?)少ない値となっていますが、その差が、投票人数が少ないこと(理論の結果は無限の人が投票する場合)からくるのは、サンプル数(78問)が少ないからなのか。それとも無知な人々の比率の推定がラフすぎるのか。私は、誤差の原因は論文のモデルがシンプルすぎだからと考えていますが、この実験結果の示唆する情報カスケード転移の本質を捉えていると考えています。

0 件のコメント: