2016年8月27日土曜日

オープンラボ「社会現象を物理で記述するには」II

オープンラボ「社会現象を物理で記述するには」の続きです

情 報カスケードでのヒトの選択をモデル化する方法です。多数のヒトが順番に、前のヒトの選択の情報を見ながら選択する確率法則を数式で表すのでした。 S=1,0でAが正しいと思うか、Bが正しいと思うかを、Ca,CbでA,Bを選んだ人数を表したとき、(S,Ca,Cb)の状況でAを選ぶ確率を

Pr(Aを選ぶ)=f(S,Ca,Cb)

と書きました。

選 択肢A,Bには何の情報もない場合、確率50%で正しいと仮定します。すると、このf(S,Ca,Cb)は対称性を持っていることが分かります。それは、 Aが正しいと思い、かつA,Bの選択者数が(Ca,Cb)の状況でAを選ぶ確率は、Bが正しいと思い、かつA,Bの選択者数が(Cb,Ca)の状況でBを 選ぶ確率に等しいというものです。Bを選ぶ確率はAを選ぶ確率を1から引いたものに等しいので、この対称性は

f(S=1,Ca,Cb)=1-f(S=0,Cb,Ca)

と 書くことができます。 物理では、系の持つ対称性を使って、法則の形に制限をつけますが、ここでは、A,Bの対称性からf(S,Ca,Cb)に制限をつけたわけです。A,Bの選 択肢が等価なことから来る対称性をZ2対称性と呼びます。この対称性を用いると、f(S=0,Cb,Ca)=1-f(S=1,Ca,Cb)なので、S=1 の場合のf(S,Ca,Cb)が計算できれば十分です。それでも2変数Ca,Cbの関数だと理解が難しいので、Ca+Cb=tの場合を考えてみます。つま り、すでにt人が選択を終え、t+1番目のヒトがどう選択するかです。S=1なので、Aが正しいと考えていますが、Ca=0だとt人中t人がBを選んでい るので、Aを選ぶ確率は小さいでしょう。そして、Caの増加とともにAを選ぶ確率が増加し、Ca=t/2ぐらいでほぼ1になるはずです。

で は、実験の説明です。選択肢A,Bを等価にしたいので、二つの選択肢A,Bを用意し、実験の最初にランダムに正解を決めます。つまり、A、Bが正解の確率 は50%で等しいです。そして、多数のヒトが順番に選択していきます。t+1番目の回答者はt人分の選択者数情報(Ca,Cb)を知った上で選択します が、正解に関する情報を誰も知らないままだと(Ca,Cb)に意味はなく、自分も情報がないのでランダムに選ぶことになります。正解の情報を人々に伝える 必要がありますが、情報カスケードの実験でよく使われる手法を採用します。選択肢A,Bを赤球・青玉が(2個、1個)、または(1個、2個)の合計3個 入った箱だとします。最初の正解XをA,Bからランダムに選びます。そして、実験参加者は箱Xni手をいれて玉を選び、その色を確認できるとします。も し、赤球だとすると、箱Aには2個、箱Bには1個赤球が入っていたので合計3個の赤球がありますが、Aから選ばれる確率は2/3、Bから選ばれる確率は1 /3なので、箱XはAである確率が2/3、Bである確率が1/3であることが分かります。逆に、青玉を引いた場合は箱XがAである確率が1/3,Bである 確率は2/3となります。この、3個中2個といった箱の中の玉の割り合いで回答者の情報をコントロールできるのがこの仕組みのよいところです。こうして、 実験参加者は確率2/3で正しい情報を持ち、その情報と(Ca,Cb)で選択することになります。赤玉を引いたら箱XはAだと推測してS=1、青球なら箱 XはBだと推測してS=0です。 

 箱 Xが200個あり、すでに63人が回答しています。63名は2013年の実施した実験に参加してくれた北里大生126名のうちの63名です。1人100回 回答したので、200個の箱に63人が回答するため126名に学生さんに被験者をお願いしました。実験参加の報酬は正解数に比例して謝金なので、まじめに 回答しています。この200問から100問を選んで回答することになります。実験ではタブレットを使って回答してもらったのですが。今回のオープンラボで はデータ解析まで行うので、パソコンを使います。回答画面が下図です。味もそっけもありませんが、実験を行うには十分です。

 真っ黒な画面は、Rのコンソールです。Rとはデータ解析やそのためのプログラムを開発する環境です。今回の実験ではRを使って実験を行い、データを取得・解析します。sourceコマンドでプログラムを実行します。すると、[1]の横に

[1] q=6/9, as 63-th subject you answer 100 questions

 とあり、実験状況を示しています。q=6/9とは、あなたの情報が正しい確率を表していて、q=2/3=6/9です。なぜ、q=2/3ではないかというと、他にq=5/9,7/9,8/9の情報の場合もあるからです。さらに画面を下がっていくと、

[1] Question No. 1 

と あり、問題番号1であることが分かります。その次の行があなたが引いたボールの色でblueなので「青玉」であることが分かります。その次の行があなたよ り前に回答した人々の選択の状況で、あなたが63番なので、62人のうち、10人がR,52人がBであることが分かります。箱A,箱Bの代わりに、赤球 (Red)の多い箱を箱R,青玉(Blue)の多い箱を箱Bとしてます。

最後の行で

Please choose, Red('R') or Blue('B') ? 

と表示され、 箱Rなら'R'か’r’、箱Bなら'B'か'b'をキーボードで押してリターンキーを押して回答します。全部で100問ですが、それほど難しい問題でもないので、次々回答していってください。毎回、回答後に正解か、不正解かが表示されます。

100問回答後に回答データを解析します。赤球のひとつひとつが回答を表しています。 解析では、f(S=1,Ca)の関数の形を仮定し、そのパラメータをデータで推定しています。データ解析の詳細は明日のオープンラボで解説します。

当日使ったスライドです。

 後日、このブログの内容は加筆・修正します。

オープンラボ「社会現象を物理で記述するには」


今度の日曜(2016年8月28日)に大学のオープンラボとして、「社会現象を物理で記述するには」を行います。ヒトの従う物理法則を自分を被験者として実験を自分で行い、自分で自分のデータ解析を行って確認するものです。実験とデータ解析はRというデータ解析環境で実施します。ぜひ、参加して社会物理学という物理の新たな分野の研究の雰囲気を味わってください。

社会現象は多数のヒトの集まりの示す現象であり、集団挙動と呼ばれます。ヒトは他のヒトの影響を受け、そして自身も他のヒトに影響をあたえながら選択や行動を行い、社会現象となります。そのため社会現象を物理現象として扱うには、ヒトの選択や行動の従う物理法則を明らかにし、方程式で記述する必要があります。しかし、ヒトは自由意志に基づいて選択や行動を行うと考えられています。方程式のような決まった関係式でヒトを記述できるとは思えないかもしれません。ヒトはリンゴの木から落ちるリンゴとは根本的に異なると考えるのが普通です。しかし、ヒトは自由意志に基づいて選択・行動するといっても社会的動物であることで他人から影響を受けるため、その選択・行動は単純な法則に従い、方程式で書くことができます。

話を具体的にするために、選択を考えてみます。AかBのどちらかを選ぶ状況でヒトに法則性があるかどうかです。例えば、初めて訪れた観光地で道に迷ったとき、多くの人がすすむ方向に進んだりしないでしょうか?また、何軒かレストランがあるとき、情報が全くないなら、レストランのお客さんの数か多いかどうかを調べて、多いレストランに入ったりしませんか?このように、選択において十分な情報が不足しているとき、ヒトは他のヒトの選択や行動を参考にします。このようにして情報を得て選択・行動することを社会的学習と呼び、ヒトに限らず、群れをなす動物や社会性昆虫まで、多様な動物が行っています。親の世代から子の世代への有用な情報の伝達手法でもあります。ヒトは社会的学習によって文化を世代間で継承します。法律や慣習は他の人がそうするから従うのであって、多くの場合、それらの正しさとは関係ありません。また、学問は先人の得た有用な情報を先人の苦労を再度繰り返して自力で獲得するのでなく、教科書を学ぶことで効率的に行うものなので、究極の社会的学習ともいえます。

では、社会的学習にはどのような法則性があるのでしょうか?社会的学習は非常に一般的な抗y範囲にわたるテーマなので、話を明確にするために二拓のクイズに回答する場合を考えてみます。ただし、他人の選択の情報がないと社会的学習が行えないので、多数の人が一人一人順番に回答し、その回答結果を参考にして次のヒトが回答するものとします。最初のヒトは自分の情報だけで選択するしかありませんが、2番目のヒトは最初のヒトの回答を参考にできます。最初のヒトはAを選んだけれど、自分はBが正しいと思うからBを選択することも、自分の選択に自信がないなら最初のヒトの選んだAを選ぶことも自由です。3番目のヒトは最初の二人の回答を参考にして回答します。例えば、二人ともAだけれど、自分はBと思うからBを選択しても、自分もAが正しいと思うから最初の二人と同じくAを選ぶこともいろいろあるでしょう。

 すると、一般的な状況としては、自分が正しいと思う選択肢が過去の回答者の回答の多数派と一致するかしないかの二つのパターンになります。一致するなら自分の正しいと思う選択肢を選べばよいでしょう。もちろん、自分より前の回答者が嘘をついて間違った選択肢をわざと選んでることもあるでしょうから、多数派の選択肢だからと言って正しいとは限りませんが、わざと間違えると自分の正解の数も少なくなって損をするので、通常はないと考えてよいです。レストランの選択でも、わざわざまずい店に入って他のヒトを惑わせるのは、そのお店からお金でももらわない限りやらないものです。社会的学習は他人の選択による情報のフィルタリング機能を使っているのです。

問題は、自分の正しいと思う選択肢が多数派の選択肢とバッティングする場合です。この場合、自分の選択肢に自信があるなら、それを選べば問題ないでしょう。自分より前の10人の回答が8人A,2人Bといった状況でもBが正しいと自信があるならBを選ぶべきです。8人がAを選らんでいても、その8人すべてがAに自信があるかどうかは分かりません。一方、自分の選択肢に自信がない場合は微妙です。こうした場合、つまり自分の持っている情報が不確実なとき、ヒトは多数派を選ぶ傾向が強くなることが知られています。そして、そうした傾向を情報カスケードと呼びます。

カスケードというのは、Wikipediaによると、 連なった小さな滝である。建築分野では人工的に作ったものを指す。さらにその派生として連続したもの、数珠つなぎになったものを意味する言葉として各分野で用いられる。日本語でのカスケードはこの派生用法が主である。」とあります。情報カスケードの場合、なにが連続する・数珠つなぎになるのかといえば、二拓の選択が難しく、誰も確かな情報を持っていないため、一度多数派ができてしまうと、あとのヒトは確実な情報がないことが多いので、多数派の選択肢を選び続けるので、多数派の選択肢の連鎖が起きるからです。ただ、情報カスケードは「あくまでも傾向」なので、確実にヒトは多数派を選ぶといってはいません。そのため、連鎖はいづれ止まります。みなさんの前の100人のうち90人がA,10人がBだったとしても、Bにすこし自信があればBを選択することは結構あるでしょう。このため、情報カスケードの連鎖は壊れやすい脆弱なものと考えられています。

まとめると、① 多数のヒトが不確実な情報をもとに順番に選択する場合、少数派が正しいと思っても過去の回答の多数派の選択肢を選択する傾向がある。②あくまで傾向、平均的な話なのでヒトによって異なる。③一度、多数派が出来てしまうと、その多数派の選択肢の連鎖が続くので情報カスケードと呼ばれる。④多数派の連鎖はいづれ止まる。

これが情報カスケードです。不確実な情報といっても、あるヒトは正解を知っているかもしれませんし、あるヒトは情報が全くないこともあるでしょう。そうした情報の不均一性はあっても構いません。

では、この情報カスケードという法則を方程式で表しましょう。ニュートンの方程式は、どんな物体の運動でも成立する「力」と「加速度」「質量(物体の重さ)」の関係式でした。それは、物体に働く「力」は、「質量」と「加速度」の積に等しい」というものです。この関係式は「力」と「質量×加速度」を等号で結び付ける方程式として書くことができます。

 ニュートン方程式:質量×加速度=力

 この方程式を解くことにより、物体の運動を計算することができます。現在の物体の情報(位置と速度)があれば、未来の物体の情報を計算し、物体の運動の軌跡を描くことができるわけです。

一方、情報カスケードの場合、多数のヒトの平均的な法則=傾向なので、単純な関係式では書くことはできません。このような、平均的な話、傾向の場合、確率を使って法則を式で表します。Aを選んだ人数をCaとBを選んだ人数をCbとかき、かつAを正しいと思うか、Bを正しいと思うかを変数Sで表すとします。S=1はAが正しいと思う、S=0はBが正しいと思う状態です。そして(S,Ca,Cb)の状況でAを選ぶ確率をPr(Aを選ぶ)を関数f(S,Ca,Cb)で表すことにします。

Pr(Aを選ぶ)=f(S,Ca,Cb)

Pr()は()の中に書いたことが起きる確率(probability)を表しています。確率なので、同じ状況が多数回あったとしたときの()の中のことが起きる比率しか分かりません。この確率はヒトによって異なるでしょうが、情報カスケードでは多数のヒトが回答するので、多数のヒトの平均的な確率を使います。こうした法則を「確率法則」といいます。

(Ca,Cb)=(0,0)のとき、S=1ならAが正しいと思っているのでf(1,0,0)はほぼ1になるでしょう。また、S=0ならほぼゼロになるはずです。また、S=1で、Ca>Cbでもf(S,Ca,Cb)はほぼ1になり、S=0でCa一方、情報カスケードにおけるヒトの選択は、Ca>Cbのとき、Bが正しいと思ってもAを選ぶ傾向が強いというものだったので、

 もし、CaがCbより大きいなら、f(S=0,Ca,Cb)>f(S=0,0,0)

となります。しかし、物理は数値的に現在の状態から未来の状態を予言するものなので、不等式で確率法則を記述したのでは不十分です。実験を行ってヒトの振る舞いのデータを集め、それをもとにf(S,Ca,Cb)を決定する必要があります。

まとめると、①ヒトの場合は他のヒト、動物の場合は他の個体の影響を受けながら選択・行動する状況では、選択・行動は確率法則として記述できる。②確率法則は実験で決定する必要がある。

では、情報カスケード実験を行ってヒトの選択の法則を見てみましょう。