らんだむな記憶

blogというものを体験してみようか!的なー

t分布への道 (1)

結局 t 分布とは何なのかを気の赴くままに追いかけてみたい。

大体共通して出てくるであろうツールとしては「正規分布に独立に従う確率変数の和は再び正規分布に従う」といったもののように思われる。

その前に [1] p.162, [4] p.47 を参考に独立同分布な確率変数の和の分布が標準正規分布へと法則収束するということを扱う中心極限定理を掲載する。

中心極限定理

$\{X_i\}_{i=0}^\infty$ を i.i.d. とし $E[X_1] = \mu$, $V[X_1] = \sigma^2$ とする。この時
\begin{align}
\lim_{n \to \infty} P \left(a \leq \frac{\sum_{i=0}^n X_i - n\mu}{\sigma \sqrt{n}} \leq b \right) = \frac{1}{\sqrt{2\pi}} \int_a^b \exp \left(- \frac{x^2}{2} \right) dx
\end{align}

が成立する。${}_\square$

期待値と分散がある程度既知と見做せる賭け事があるとすれば、無作為に試行する場合 $n$ 回試行後の損益は期待値の $n$ 倍に分散に適当な数を掛けたものを足し引きすればある程度見積れるということである。

この定理は $\{X_i\}$ が従う分布が何であれ沢山かき集めると正規分布で近似できることを主張するものである。ところが $\{X_i\}$ がもともと正規分布に従っている場合には、沢山かき集めなくても 2 つの変数の和の分布も正規分布であることが分かる。つまり、$X$ と $Y$ が独立に正規分布 $N(\mu,\sigma)$ に従うとした時、
\begin{align}
\frac{X + Y - 2\mu}{\sigma \sqrt{2}} \sim N(0,1)
\end{align}

が成立する。これを正規分布の再生性と呼ぶ。([1] p.151, [2] p.78, [3] p.73)
証明は [1], [2] のような比較的優しい教科書では省略されてしまうようだ。というのも中心極限定理の証明を含め、正規分布の再生性についてもその証明には確率変数の分布の Fourier 変換であるところの特性函数を用いた証明がたぶん標準的なものであろうが、特性函数の導入は統計学の入門書にとっては幾分脱線となるからであろう。

後の都合のために中心極限定理の式を書き換えておく。
\begin{align}
\lim_{n \to \infty} P \left(a \leq \frac{\frac{1}{n}\sum_{i=0}^n X_i - \mu}{\sigma / \sqrt{n}} \leq b \right) = \frac{1}{\sqrt{2\pi}} \int_a^b \exp \left(- \frac{x^2}{2} \right) dx
\end{align}