
で、ここからが本題。課題として、地震の頻度分布のデータから、エネルギー分布がべき乗則に従うというGutenberg-Richter則が成り立っていることを示せというものが出されました。図が、x軸をマグニチュードM、y軸に地震の頻度(赤印)をプロットしたもの。べき則則でフィットする場合、ある大きさ以上の頻度という累積を使うほうがよいので、それも描(緑印)いています。グラフを見ても、累積にしないと地震規模の大きな端の部分は頻度が小さく、頻度分布のグラフはばらつく。一方、累積のほうは、ある規模以上の地震の数なので、そのばらつきが抑えられる。で、10のb乗に比例するとして、フィットした結果が直線で描かれています。このフィットで問題になるのが、どこをフィットするのかということ。図ではMが5以上、6以上、7以上でフィットしています。すると、6以上と7以上だとbの値がほぼ1で大体等しくなっているので、bは1と結論するわけです。
経済物理などの本に限らず、物理で社会現象を説明する本によくあるのがこの手のべき乗則の話。べき乗則に従うから、一見複雑に見える現象でもその本質は単純な物理法則で説明できるとか書いてある。じゃ、本当にべき乗則なのですか、と真剣に調べたのがニューマン:SIAM Review 51, 661-703 (2009)。例えば、上であげた富、地震の規模のほかに戦争の規模、インターネットの接続数、言葉の出現頻度など、ありとあらゆるデータに対し、べき乗則だとしたときのp値や、指数分布や対数正規分布などとどっちがよくデータに合うのかという比較を行ったものです。
すると、ほとんどのデータは「べき乗則とはいえない」という結論になる。上記の論文のp27にp値の表があって、それを見ると「地震は0」「富も0」。こんなプアなフィット(図の直線のフィット結果)が実現することはないから、べき乗則ではない。唯一、言葉の出現頻度はべき乗則で、地震や富はカットオフのあるべき乗則(つまり、あまり大きなところはべき乗則ではない)が妥当。他の多くのデータも、べき乗則に従っているといってもしいし、他の分布に従っているといってもいい微妙なものである、と。
In particular, the distributions for the HTTP connections, earthquakes, web links, fires, wealth, web hits, and the metabolic network cannot plausibly be considered to follow a power law; the probability of getting by chance a fit as poor as the one observed is very small in each of these cases and one would have to be unreasonably optimistic to see power-law behavior in any of these data sets.(p.23)
There is only one case -- the distribution of the frequencies of occurrence of words in English text -- in which the power law appears to be truly convincing, in the sense that it is an excellent fit to the data and none of the alternatives carries any weight.(p.26)
べき乗則に従うと厳密に主張できる系はほとんどない。一方、べき乗則に従うモデルはいくらでも作れる。こういう状況でべき乗則をもとに説得力のある議論ができるとは思えない、とH氏ならいいそうです。