2011年1月19日水曜日

ニューラルネットとソーシャルネット


人の脳は神経細胞(ニューロン)がネットワークを組んで情報処理を行っている。1943年にマッカロ&ピッツは、ニューロンが興奮する(y=1)かしない(y=0)かをニューロンの膜電位xで記述するモデルを提案し、脳の情報処理の仕組みの解明が始まりました。ニューロンは、膜電位の変化に対応して興奮できる頻度に限界があり、大体1秒に10回といわれています。脳には140億個のニューロンがあるといっても、それらが並列に動作するとして1秒に処理できる回数は140億かける10回の1400億回。0.14TFLOPS(TFLOPS=テラフロップスは1秒に1兆回という単位)となります。一方、最近のスパコンはTFLOPSではなく、PFLOPS(ぺタフロップス)という単位で計算速度を示していて、それは1秒に1000兆回と、TFLOPSの1000倍。つまり、人の脳の計算速度はスパコンの1000分の1以下ということになります。ある意味で、脳は非常にのろい計算機なわけです。

マッカロとピットのモデルは、他のニューロンから入ってきた膜電位の変化を足し合わせて、それがある閾値βを超えると、ニューロンが興奮(発火)するというもの(左図参照)。つまり、各ニューロンで、他のニューロンからの入力の多数決をとり、自分が興奮するかどうかを決定する。そして、自分の状態の変化を他のニューロンに伝達する。そういうのを繰り返しているのがニューラルネットワークであるというモデルです。ニューロン間の信号の伝達は、シナプスと呼ばれる部分で化学物質を媒介とするためにどうしてものろくなってしまうわけです。

一方、のろいといえば、人のネットワークの情報処理も同じかもしれません。世界人口は2010年10月で69億だそうで、ほぼニューロンの数と同じぐらい。そして、人が社会において合意を行う方法として、民主主義の国家では多数決というルールを採用しています。つまり、人のネットワーク(ソーシャルネットワーク)とニューロンのネットワークは基本的に同じ仕組みで情報処理を行っている。人の場合は選挙や会議での多数決により、ニューロンの場合は膜電位の多数決により。選挙や多数決はそれほど迅速に行えないので、のろいのは脳と同じです。

今回、共同研究者のH氏が行った研究「Digital herders and phase transition in a voting model」は、マッカロとピッツのモデルで人が投票を行うとするならば、何が起こるのかというものでした。ただ、設定を極力単純化するために、人(ニューロン)は1度に1人しか投票しない。また、ニューロンの興奮するかしないかに対応して、賛成&反対のような二択への投票とする。賛成が正しいのか、反対が正しいのかは、難しい問題です。そこで、人は確率q正しい選択を行うとし、qは50%よりは大きいとします。これだけなら、単に確率qで正しい選択肢へ投票を行う問題なのですが、これに競馬の投票でも扱った無知な投票者も考える。彼らは無知なので、確率50%で二つの選択肢に投票するしかないのですが、彼らも正しい選択をする動機はあるので、なんとかしようとする。そこで、その投票者が投票する時点以前の投票結果を教えるものとします。このとき、無知な投票者は、その投票結果を参考にして投票するのが合理的(自分は無知なので)なのですが、前回のモデルとは異なり多数決を使うことにする。つまり、過去3人投票しているとして、2人が賛成1人が反対なら自分は賛成とするわけです。

こうした無知な投票者が比率pで存在するとすると何が起きるのか?pが小さい場合は、無知な投票者の正答率が上昇します。しかし、pがある値を超えると、正答率が低下をはじめ、pが100%での正答率50%まで単調に減少します。では、このある値を境にして何が起こっているのかというと、無知な人が増えると、たまたま過去の多数決が間違った場合、無知な人はそれを信じて間違った選択をするという悪いループに落ち込んでしまうのです。そういう状況下でも、正しい知識をもった人は確率qでがんばって投票しているのですが、いかせん無知な人が多くなっていて、彼らはヤミクモに多数決に従ってしまうために、選択肢を選びなおすことはできません。情報カスケードといわれる一度はまり込んだアリ地獄から抜け出せない状態です。



左の図は投票実験のデータです。x軸に無知な投票者の比率、y軸には投票者全体での正答率をプロットしています。赤い実線は理論モデルの厳密な計算結果(投票人数∞の場合)、緑の線は実験に合わせ31人投票する場合の結果を数値計算したもの。ピンクの点線は投票結果を参照しない場合です。青の+が実験データをプロットしたもの。実験の設定では、クイズの答えを知っている人は、正解に投票するので上記のq=1の場合に対応します。クイズの答えを知らない無知な投票者の比率が50%以下の場合、前回までに投票した人の投票結果を参考にすると正答率が90%近くになっています。しかし、無知な人の比率が50%を超えると、正答率は一気に下がり、誰も答えを知らない場合の50%を目指して急降下する。何も参照しない場合、無知な人々は50%の正答率しか持たないので、参照した場合は正答率が上昇していることがわかります。


この結果をみていると、他人の情報をあてにして自分の意思決定を行うことは、個人的には正答率を上げることにはつながるのでメリットはあるのですが、社会的にはデメリットしかないことがわかります。過去の投票結果を教えなければ、無知な人々は確率50%で投票するだけなので、ノイズにしかならず、確率qで正しい投票を行う人々が過半数を制します。しかし、過去の投票結果で情報共有すると、無知な人々が情報カスケードを引き起こし、正しい人々が下すのとは逆の選択を行う可能性が出てくるわけです。




次の図は、何も参照しない時の正答率が50%から70%(平均60%)のクイズに対し、正答率が情報共有の結果どう変化するかを示したものです。対応する無知な人々の比率は60%から100%未満(平均80%)ということになります。無知な人々が80%存在する場合、理論モデルの結果は全員が正解する100%の正答率のところと、無知な人々が全員間違って残り20%の正しい人々が頑張った正答率20%のところに分布はピークを持つことを予言します。投票実験では、200のサンプルのうち、対応するサンプル数は78で決して多くないのと、31人の結果なので、投票人数無限大のような鋭いピークとはなっていませんが、それでも正答率20%のところと80%のところにピークを持つことがわかります。

この結果は、情報共有さえしなければ、多数決で正しい答えに到達できたのに、他人の答えをみてしまったために、多数決をとると間違った選択肢を選んでしまうことを意味します。新聞などで支持率という他の人々がどう考えているかを公開することが果たしていいことなのか。他の人々のうち、ちゃんと物事を考えている人々の比率が多いなら問題はないのですが、そうでない場合は悲惨な選択を社会がしてしまう可能性を増やすことになるわけです。空気を読まない人々ばかりならいいのですが。

H氏の結果で個人的に驚いたのは、実はデジタルな投票者(無知な投票者が多数決に従う)の場合に相転移が起きることではなく、疎なネットワークが情報共有のメリットが最大となることなのですが、それは次に。

0 件のコメント: