2013年8月27日火曜日

熱力学から統計力学へ

物理学科2年次必修科目の「熱統計力学I」のテキストがようやく完成しました。昨年度のものをベースにしたので、今年は修正と構成の一部変更、および「熱統計力学演習」のための章末の演習問題の作成だけでしたが、それでもなかなか大変でした。


あとは、データ解析のテキストを年末までに再編集して、こちらはKindle本として販売にトライしてみようと思います。LatexからEPUBへの変換がなかなか難しく、簡単にはいきそうもないですが、「熱統計力学」とちがって、データ解析のテキストのニーズは多いと思うので、なんとかしたいと思います。

H26.10.22追記:平成26年度版をアップしました。講義で配布したものと同じです。必要な方はダウンロードしてご利用ください(購入ボタンとなっていますが、無料です。)。

 DLmarketで購入

2013年8月4日日曜日

木曾御嶽山


4大山岳宗教の山は、富士山、立山、白山と御嶽山。御嶽山の開山は7世紀初頭らしく、室町中期から修験者による参拝登山が盛んになったとか。そうした線香くさいイメージもあり、また中々遠いので、これまで登ったことはなかったのですが、「ひとつの山としては日本で最大の山塊である」という紹介や、「神様のカルテ2」で主人公がハルさんにつれられ美女平から御嶽山を眺め、小説の最後にいっしょに登ったことから、今回登ってみることにしました。

新宿から朝8時10分の高速バスに乗り木曽福島へ、そしてロープウェイ駅まで再度バス。7号目のロープウェイ駅から8号目の女人堂(金剛堂)までは徒歩で、ついたのが午後4時。そのまま山頂を目指し9号目半まで登ったものの、女人堂での宿泊予定だったため撤退。翌日は朝6時前から登り始め、8時前に登頂し、お鉢めぐりをして、二の池、三の池、雪渓を経て下山。11時55分のバスにのり、木曽福島からはJRで帰宅、と密度の高く、足には結構来た山登りでした。


2013年7月25日木曜日

自殺と結婚と経済物理学

B.M.RoehnerのEconophysics: challenges and promises An observation-based approachというテキストは「経済物理って物理なの?なぜ経済や社会現象を物理で研究するの?」という同僚や友人からの疑問に答えるためとのこと。

結論は、経済・社会現象は生命や脳といったホンモノの複雑系(Complex system)に比べれば、Complicated System(込み入った系)であり、なんとかなるはずである。こうした系の現象の難しさは、多くの要因が絡み合っているからであり、ある要因のみを切り出して、それが原因であることが示されれば、その原因にもどづくモデル化と異なる状況での予言と検証という物理学の研究手法が可能になる。その具体的な例としてあげているのが自殺と既婚率の関係。


左の表はさまざまな国、年代での既婚者と未婚者の自殺率の比を並べたもの。この表を見ると、誤差を含めても比はどれも1より上なので、未婚者の自殺率が既婚者のそれより高いことが分かります。男性の場合、平均2.3倍。では、この結果から、未婚であることが自殺の原因と結論できるのでしょうか?もちろんそんなことを主張できません。この表は未婚・既婚と自殺率の相関関係を述べたものであって、因果関係については何も分かりません。実際、未婚だから自殺しやすいのではなく、自殺しやすい人は性格的な問題やらなんやらで、結婚できないのかも知れません。これはフィッシャーが喫煙が肺がんの原因であるという因果関係を認めなかったのと同じ理屈です。煙草を吸ったから肺がんになったのではなく、肺がんになる人に煙草の好きな人が多いのかもしれません。

既婚・未婚と自殺率の因果関係を示すにはどうすればよいのか?理想的なのは、男性の集団をランダムに二つのグループに分け、一方は結婚禁止、もう一方は強制的に結婚させて、自殺率を計測し比較すればよい。これフィッシャーの実験計画法のアイデアなのですが、それは人道的に無理。では、どうするのか?そこで、Roehnerは、アメリカの鉄道建設に従事するために海を渡った中国移民の自殺率に目をつけました。その理由は、(1)中国移民での男性と女性の比率が最初は27倍から始まり、建設が進み時代が下がるとともに低下し最終的に1.02倍にまで低下したこと、(2)この移民集団の男性の未婚者は単に移民の中の女性の比率が低いから結婚できないだけの普通の男性の集団であることでした。つまり、実験としては理想的な環境となっているわけです。

すると、あとは既婚の男性と女性の自殺率、未婚の男性と既婚の男性の自殺率の比の3個のパラメータを用いたモデルで男女の比率に対して集団の自殺率を計算することは簡単です。その結果が次の図です。この図の中のモデルでは未婚男性の自殺率が既婚男性の自殺率の4.2倍として計算しています。図には、日本人の移民のデータ(赤丸)もプロットされていますが、日本人の場合、男女の比率のレンジが小さく、モデルの結果と合っているとは主張できません。一方、中国移民のデータ(星印)は、男女比の比率が1から6のレンジでモデルの結果と合っています。この結果、既婚・未婚が自殺の原因の一つであることが明確に示されたことになります。

テキストでは、この主張に対する反論として、(1)男女比率の低下と同時に移民が裕福になり、それが自殺率の低下の原因なのではないか、(2)同時期にアメリカの自殺率も低下したのではないか、があげられていますが、裕福な人の自殺率は高く、アメリカの自殺率に中国移民の自殺率と同じトレンドはないことから否定できるそうです。

このように、データをうまく使い、現象に関係する要因を一つだけ抜き出していくことで、因果関係に基づくモデル化が可能になり、予言か可能になる。

この話をある学生さんに話したら微妙なようでした。たしかに面白く話のネタにはなるのですが、物理の学生が目を輝かせて「僕もこうした研究をやりたい」と思うのかどうか?たぶん思わないでしょう。

研究の方向性として正しいけれどほとんどの場合無理。そもそも社会現象を記述するのに「物理」である必要があるのか?ビッグデータとさわいでいるのを見ると、因果関係なんかぶっとばして、相関関係だけで適当に予想するのがトレンド。複雑系の科学の目指した「要素に還元せず複雑なまま理解する」とはビッグデータの解析と予測のことではないのか?と最近思ったりもします。


2013年7月5日金曜日

WEBページのリニューアル

今学期はデータ解析・数値計算のテキストの執筆や、カリキュラム変更で旧カリと新カリがダブって大学院までいれると全部で5コマ。なにも出来ない状況だったのですが、前期も終わりに近づきようやくひと息つける状況になってきました。そこで、WEBページのリニューアルと採択された科研費の研究課題「実験経済物理学による社会的学習と集団知の創発過程の解明」のサイト、秋に実施予定の集団実験の予約サイトの構築を終えました。

後期も前期と同じく5コマあり、卒研生6名、院生1名の指導と集団実験で忙殺されそうですが、まずはサイトができてメデタシメデタシ。しかし疲れた。


2013年2月25日月曜日

Minority GameとCrowd-Anticrowd モデル I

今年の卒研のテーマのひとつとしてMinority Game(少数決ゲーム)を採用し、春頃から実験用サーバープログラムの開発と物理学科3年の選択科目「データ解析」の演習時間を用いた予備実験、そして北里祭での一般参加者による実験を行いました。その目的はタイトルにある、協力の創発がCrowd-anticrowdという仕組みで起きるのかを検証することでした。

Minotiry Game(少数決ゲーム)とは、2択の選択を複数の参加者で同時に行ってもらい、少数派の選択を選んだ参加者を勝ちとするものです。このゲームを同じメンバーで、毎回、過去の少数派の選択肢を周知するという情報だけをあたえて繰り返す。非常にシンプルなゲームであり、もともとはB.W. Arthurという経済学者がEl Farol Bar問題(1990)として定式化したものに由来します。人口100人の町にキャパシティー60人のEl Farolというバーがあり、人は今晩バーにいくかど家にいるかを決めるとする。バーにいって、バーの前にいる人数が60人以下ならバーにいって正解。61人を越えるなら家にいて正解。では、100人のうち60名がバーに、40名が家にという選択を実現するのはどうすればいいのか?これがEl Farol Bar問題。

経済学では人は他人の行動を含むあらゆる情報知り、すべての人が全知全能の存在として合理的に意思決定すると考える。しかし、Arthurは、人は限定合理的な存在であり、その限定合理性を「人は過去のパターンから予測し行動するものである」とモデル化しました。すると、簡単に60人がバーの前に現れるようになります。過去のバーの前の人数のパターン(昨日が48人、一昨日が72人など)に対し、今日の人数を予測するとします。その人数は0から100まで101パターンあります。100人の町の人の予想はその101パターンに「一様に分布する」ので、60人以下と予想する人は100人のうちの61/101の約60人となる。こうして均衡状態として約60人がバーの前に現れる状態が実現します。

これでEl Farol Bar問題は解決したように見えますが、そうではありません。実は、上記の解は無駄が非常に大きい。なぜなら、ある人がバーにいくかどうかは、その人の予測人数が60人以下の場合であり、確率は約60%。 人々は独立に予想するので、バーの前に現れる人数は100人が確率60%で独立にバーに現れる時の人数に等しく、期待値は60人ですが、ゆらぎは大体5名となります。つまり、毎回55名から65名がバーに現れ、5名分のキャパシティーが余ったり、バーのキャパシティーを越えたりする。つまり、60名ぴったりがバーに現れ、40名が家にいる状態には程遠いわけです。このように、バーの前に現れる人数の期待値が60名であることだけでは不十分で、ゆらぎを最小(可能ならゼロ)にすることが必要です?

そこで、こうした「ゆらぎ」まで含めてEl Farol Bar問題を考えるために導入されたのがMinority gameでした(D. Challet and Y.C. Zhang(1997))。そこでは、N人の参加者は0か1の二択を選び、選択者数が少ない選択肢を選んだら勝ちとする。また、参加者には過去M回のゲームでの少数派の選択肢の情報を与える。問題は、参加者が過去のパターンから有利なパターンを導き出しそれを利用し、参加者の中で少数派に属する人数を最大化(参加者が101人なら50人がベスト)し、ゆらぎを押さえられるかどうか、という点です。

D.Challet and Y.C.Zhan(1997)では、過去M回の少数派のパターンから次の少数派の選択肢を予想する予測モデルを各エージェントに複数持たせ、エージェントは自分の予想モデルのうち、もっとも勝数の多いものを用いるとします。この論文 以降、Minority gameの研究は爆発的に流行しました。2002年までの5年ほどの間に百以上がMinotiry gameを扱い、その結論は、エージェント数Nの集団に過去M回の少数派の選択肢の情報を与えたとき、Mが小さい場合は少数派の人数のゆらぎが大きく協力は起きない。けれど、Mを増やして2のM乗がNに近づくと、協力が起きてゆらぎが減少する。しかし、さらにMを増やすとゆらぎは増加に転じ、Mが十分大きなところではゆらぎの大きさはゲーム参加者がランダムに選んだ場合に一致するこというものでした。


左の図はN=9において、Mを増やしたときの多数派と少数派の選択者数の差の分散(ゆらぎの自乗)をNで割ったものをプロットしたものです。分散はエージェントがランダムに選択した場合Nとなり、Nで割ると1(緑の点線)になって都合がよいので、ゆらぎの大きさの目安として分散/Nを用います。図でM=1の場合、これは前回の少数派をエージェントに示した場合に対応しますが、その場合は1に近い。Mを2,3と増やしていくと分散は減少し、M=3では約0.3になっています。さらにMを増やすと分散は増加に転じ、Mが十分大きいところでは0.9程度になっています。 この結果でおもしろいのは、Mを増やすと、M=3まではエージェント間で協力が起こり、ゆらぎを抑える方向に改善しますが、あるしきい値を越えると協力が弱まり、状況が悪くなることです。

では、このゆらぎの非単調な振る舞いはどう理解すればよいのか。 Minority Gameでは、エージェントは予測モデルを持っています。可能な予測モデルの数は、過去M回の0,1の2のM乗個のパターンから0,1を出力する関数なので、2の2のM乗個であることが分かります。しかし、独立な予測モデルはそのうち2のM乗個のみであることは、予測モデル間の距離をハールメジャーで定義することで示すことができます。一方、エージェントの数はN。すると、2のM乗がNよりずっと小さい場合、似た予測モデルを持つエージェントが存在し、逆に2のM乗がNよりずっと大きい場合、N人のエージェントはお互いに異なる予測モデルを持つことになります。

後者の場合、N人のエージェントはお互いに独立に予測をするので、ランダムに選択するのと同じです。つまり、Nが2のM乗よりずっと小さい場合、分散/Nは1になります。この状態をUnder-crowded 相、ランダム相と呼びます。一方、Nが2のM乗よりずっと大きい場合、同じ予測モデルを持つエージェントが多数存在し、同じパターンには同じ予測モデルを用いるので多数のエージェントが同じ予測をしてしまいます。エージェントは極力他のエージェントと異なる予測を行って少数派になろうとするのですが、予測モデルがお互いに似すぎているため、それが不可能であり、多数派になることを避けられないのです(Crowd効果)。このとき、N人のエージェントの多数が一方の選択肢に集中し、もう一方の選択肢を選ぶエージェントがほとんどいないため、分散はNの自乗に比例した状態となります。この状態のことを Crowded 相と呼びます。



さらに、分散のM依存性は、2のM乗をNで割ったαというパラメータだけで決まります(左図参照)。Nが2のM乗よりずっと大きい場合、αは0に近く、Crowded相。分散/NはNに比例します。逆にαが大きい場合、Under-crowded相でエージェントはランダムに選択し、分散/Nは1になります。そして、この二つの相の間の変化は相転移であり、それが分散のα依存性の非解析性に反映しています。


こうして、予測モデルの空間の大きさとエージェント数Nの比αでMinotiry Gameの分散を理解することができます。では、Crowd-anticrowdモデルとはなにを説明するのか?また、人での実験結果はどうだったのか?それは次に。

2013年1月18日金曜日

基礎からのMySQL

2010年ごろから社会物理の実験をするようになり、最初はface-to-faceで人力で実験、2011年はeRubyでWEBプログラミングによりサーバーを構築してブラウザ経由で実験、そして2012年からはPHPでのWEBプログラミングへの変更と、毎年開発スタイルが変化してきました。サーバープログラムの開発ではCSVファイルでデータを読み書きしながら実験データを蓄積する手法でやっていたのですが、どう見てもスマートではない。たしかに、エラーが起こったときにファイルをすぐに開けば状況は把握しやすいのですが、そもそもエラーが起こることを前提としているのも問題。そこで、MySQLというデータベースへの移行を画策したのが昨年から。

2012年末に行った、「分割選択の実験」では、CSVファイルの読み書きによる古いシステムとMySQLによる新システムの二つのシステムを開発し、可能なら新システムを使う予定でした。研究協力者の日野君による開発は間に合ったようですが、テスト時間がとれず新システムの使用は断念し、古いシステムで実験は実施。しかし、今年からはすべてMySQLを用いたシステムに全面移行する予定です。

そこで、私もMySQLを勉強してみようと考え、読んでみたのがこの「基礎からのMySQL」(西沢)。
基礎からとタイトル通り、データベースをインストールから解説し、複数のスレッドを持った掲示板を作成するところまで解説してあります。わかりやすく、プログラムの解説も丁寧で、私にも理解することができました。PHPをしばらくさわっていなかったので、PHPの復習にもなり、HTMLの最低限の解説もあり、必要な知識はすべて書いてあります。この本一冊でPHPを学ぶとか、HTMLを学ぶのは無理かもしれませんが、データベースを全く知らないけれど、PHPやHTML、Apacheをすこしはかじったことがあるレベルの人なら、データベースを理解し、WEBプログラムとデータベースをどうつなげるのか、理解できると思います。

この本で得た知識をもとに、さっそく競馬データベースをいろいろいじってみようと思います。
非常にいい本です。おすすめです。

2013年1月6日日曜日

物性物理学

3年後期の電子物性論で来年度のテキストに指定しました。これまでは、岡崎先生のテキスト「固体物理学―工学のために」を使っていたのですが、いろいろ不満な点があり、いい本はないかと考えていたときに、簡単でちゃんと書いてある本として学生さんに教えてもらったものです。学生時代に塚田先生に直接習ったことはありませんが、どういう本を書かれるのかという興味もありました。

さまざまな格子でのバンドの計算が簡単なモデルをつかってしっかり書かれているのと、超伝導のBCS理論が、その真空の構造までキッチリ書かれている点がこの本の特色です。特に、後者のBCS理論の説明は、多くの本がギャップができる点を述べてお茶をにごして終わりみたいな点があるのですが、このテキストではいままで知らなかった点も書かれていて勉強になりました。(そのレベルで講義を担当するのはどうか、と自分でも思いますが。)

アマゾンで調べてみると、 黒沢先生の「物性論」を薦めるヒトが多いみたいなので、来年度の講義は、黒沢先生のも参考に超簡単な電子物性論の講義を行いたいと思います。

2013年1月5日土曜日

あけましておめでとうございます

本日1月5日(土)から始動。といっても元旦からプログラムを作っていたりで、単に仕事場が研究室か自宅かの違いでしかありません。しかし、家だと娘が元気で落ち着かないので、研究室はその点いいものです。(左の写真は、昨年のゴールデンウィークで訪れた高尾山から富士山を撮影したもの。)





 今年の目標は3つ。

 1:情報カスケードに関する社会物理実験をまとめ、競馬の経済物理に決着をつける。特に、没になっている論文をこれまでの実験結果をふまえてオッズの時系列データを解析し直しオッズの形成過程を理解したい。予測市場の研究とも絡めて、集団での情報の集約過程を自分なりに理解する。

2:競馬予想で人知に勝つ。 来年度の卒研生がプレ卒研の段階で6名存在し、そのうち5名が競馬予想に興味があるらしい(一人はニューラルネットのアルゴリズム)。それはそれでいいのですが、単にファアクターを増やす、馬のスコアの関数形を2次まで拡張、ニューラルネットの逆誤差伝搬を用いる、などという路線でどこまで競馬のオッズの予想精度迫れるか、も今年で終わりにしようと考えています。どこまで頑張ってもオッズに勝てないなら、その精度の差に「集団知」はあるのでしょう。そんなものはないことを示したい。

1、2の目鼻がついたら、競馬の物理で本にまとめたいと思います。読者をどこに設定するのか難しいですが。社会物理学なのか競馬予想なのか、 専門家向けなのか、一般向けなのか。

3:入江君と日野君に論文を書かせる。今年修士2年になる入江君、昨年後半から博士が欲しいと実験のサポートに入ってくれた昔の卒研生の日野君。私は修士論文とか博士論文はどうでもいいのですが、せっかくいっしょに研究をしているので、それぞれの主著者の論文を完成させたいと思います。(しかし、二人の英作文の能力は?頭が痛い。)

ということで、これまでと同じくジタバタする一年になりそうです。今年もよろしくお願いします。