2016年8月27日土曜日

オープンラボ「社会現象を物理で記述するには」II

オープンラボ「社会現象を物理で記述するには」の続きです

情 報カスケードでのヒトの選択をモデル化する方法です。多数のヒトが順番に、前のヒトの選択の情報を見ながら選択する確率法則を数式で表すのでした。 S=1,0でAが正しいと思うか、Bが正しいと思うかを、Ca,CbでA,Bを選んだ人数を表したとき、(S,Ca,Cb)の状況でAを選ぶ確率を

Pr(Aを選ぶ)=f(S,Ca,Cb)

と書きました。

選 択肢A,Bには何の情報もない場合、確率50%で正しいと仮定します。すると、このf(S,Ca,Cb)は対称性を持っていることが分かります。それは、 Aが正しいと思い、かつA,Bの選択者数が(Ca,Cb)の状況でAを選ぶ確率は、Bが正しいと思い、かつA,Bの選択者数が(Cb,Ca)の状況でBを 選ぶ確率に等しいというものです。Bを選ぶ確率はAを選ぶ確率を1から引いたものに等しいので、この対称性は

f(S=1,Ca,Cb)=1-f(S=0,Cb,Ca)

と 書くことができます。 物理では、系の持つ対称性を使って、法則の形に制限をつけますが、ここでは、A,Bの対称性からf(S,Ca,Cb)に制限をつけたわけです。A,Bの選 択肢が等価なことから来る対称性をZ2対称性と呼びます。この対称性を用いると、f(S=0,Cb,Ca)=1-f(S=1,Ca,Cb)なので、S=1 の場合のf(S,Ca,Cb)が計算できれば十分です。それでも2変数Ca,Cbの関数だと理解が難しいので、Ca+Cb=tの場合を考えてみます。つま り、すでにt人が選択を終え、t+1番目のヒトがどう選択するかです。S=1なので、Aが正しいと考えていますが、Ca=0だとt人中t人がBを選んでい るので、Aを選ぶ確率は小さいでしょう。そして、Caの増加とともにAを選ぶ確率が増加し、Ca=t/2ぐらいでほぼ1になるはずです。

で は、実験の説明です。選択肢A,Bを等価にしたいので、二つの選択肢A,Bを用意し、実験の最初にランダムに正解を決めます。つまり、A、Bが正解の確率 は50%で等しいです。そして、多数のヒトが順番に選択していきます。t+1番目の回答者はt人分の選択者数情報(Ca,Cb)を知った上で選択します が、正解に関する情報を誰も知らないままだと(Ca,Cb)に意味はなく、自分も情報がないのでランダムに選ぶことになります。正解の情報を人々に伝える 必要がありますが、情報カスケードの実験でよく使われる手法を採用します。選択肢A,Bを赤球・青玉が(2個、1個)、または(1個、2個)の合計3個 入った箱だとします。最初の正解XをA,Bからランダムに選びます。そして、実験参加者は箱Xni手をいれて玉を選び、その色を確認できるとします。も し、赤球だとすると、箱Aには2個、箱Bには1個赤球が入っていたので合計3個の赤球がありますが、Aから選ばれる確率は2/3、Bから選ばれる確率は1 /3なので、箱XはAである確率が2/3、Bである確率が1/3であることが分かります。逆に、青玉を引いた場合は箱XがAである確率が1/3,Bである 確率は2/3となります。この、3個中2個といった箱の中の玉の割り合いで回答者の情報をコントロールできるのがこの仕組みのよいところです。こうして、 実験参加者は確率2/3で正しい情報を持ち、その情報と(Ca,Cb)で選択することになります。赤玉を引いたら箱XはAだと推測してS=1、青球なら箱 XはBだと推測してS=0です。 

 箱 Xが200個あり、すでに63人が回答しています。63名は2013年の実施した実験に参加してくれた北里大生126名のうちの63名です。1人100回 回答したので、200個の箱に63人が回答するため126名に学生さんに被験者をお願いしました。実験参加の報酬は正解数に比例して謝金なので、まじめに 回答しています。この200問から100問を選んで回答することになります。実験ではタブレットを使って回答してもらったのですが。今回のオープンラボで はデータ解析まで行うので、パソコンを使います。回答画面が下図です。味もそっけもありませんが、実験を行うには十分です。

 真っ黒な画面は、Rのコンソールです。Rとはデータ解析やそのためのプログラムを開発する環境です。今回の実験ではRを使って実験を行い、データを取得・解析します。sourceコマンドでプログラムを実行します。すると、[1]の横に

[1] q=6/9, as 63-th subject you answer 100 questions

 とあり、実験状況を示しています。q=6/9とは、あなたの情報が正しい確率を表していて、q=2/3=6/9です。なぜ、q=2/3ではないかというと、他にq=5/9,7/9,8/9の情報の場合もあるからです。さらに画面を下がっていくと、

[1] Question No. 1 

と あり、問題番号1であることが分かります。その次の行があなたが引いたボールの色でblueなので「青玉」であることが分かります。その次の行があなたよ り前に回答した人々の選択の状況で、あなたが63番なので、62人のうち、10人がR,52人がBであることが分かります。箱A,箱Bの代わりに、赤球 (Red)の多い箱を箱R,青玉(Blue)の多い箱を箱Bとしてます。

最後の行で

Please choose, Red('R') or Blue('B') ? 

と表示され、 箱Rなら'R'か’r’、箱Bなら'B'か'b'をキーボードで押してリターンキーを押して回答します。全部で100問ですが、それほど難しい問題でもないので、次々回答していってください。毎回、回答後に正解か、不正解かが表示されます。

100問回答後に回答データを解析します。赤球のひとつひとつが回答を表しています。 解析では、f(S=1,Ca)の関数の形を仮定し、そのパラメータをデータで推定しています。データ解析の詳細は明日のオープンラボで解説します。

当日使ったスライドです。

 後日、このブログの内容は加筆・修正します。

0 件のコメント: