らんだむな記憶

blogというものを体験してみようか!的なー

円周率×乱数×正規数

統計学入門 (基礎統計学) | 東京大学教養学部統計学教室 | 本 | Amazon.co.jpの第12章練習問題12.5を見るとちょっと面白い問題が載っている。
ちょっと端折ると以下のような内容である。

円周率$\pi = 3.14159265 \cdots$について、つぎのことを検定せよ。
自ら選んだ任意の連続100桁で、$0,1,\cdots,9$は等確率で出現しているか?

サブタイトルにもあるが、円周率の並びを乱数として考えているのだ。

この問題は、「正規数」と関連している。円周率は正規数なのでは?という予想と関連しているとも言える。
正規数 - Wikipediaにあるが、数$x \in [0, 1]$を無限小数展開$x = 0.a_1a_2a_3 \cdots$することを考える。この時、$n$桁目までの$0,1,\cdots,9$の出現頻度を観測し、$n \to \infty$とした場合に、各々が$\frac{1}{10}$に収束するような "珍しい" 数を正規数と呼ぶことにする。
ところが残念なことに、確率論の教科書が教えてくれるのは、$[0, 1]$のほとんどすべての数は正規数であり、珍しいどころか普通のことだと言うのだ。正確には、$[0, 1]$上のLebesgue測度で正規数全体の集合を測ると測度1だ、という主張だ。とは言え、測度0というのは、かなり大きい可能性もあって、ありとあらゆる分数がなす集合も測度0なので、直観的な「ほとんどすべての」とは異なるかもしれない。数学的な用語としての「ほとんどすべての」だ。

まぁ、ともかくも、適当な数列を調べると確率的には正規数チックでもおかしくないよねということで、円周率を適当な数列=乱数列$\{a_j\}_{j=1}^n$とみなして「適当な100桁を抽出して$0.a_1 a_2\cdots a_{100}$と並べると、正規数のごとき振る舞いはしてないかね?」ということを検定でチェックするのがこの問題ということだ。結構な頻度でそういう振る舞いになっているという結果になるのだろうな、と予想される。