らんだむな記憶

blogというものを体験してみようか!的なー

t分布への道 (6)

大分終盤であるので、ここで [1] p.201, [2] p.114 を眺める。標本平均の分布を考えるにあたって母分散が未知の場合に t 分布が登場する。$X_1, \cdots, X_n \sim N(\mu,\sigma^2)$ i.i.d. とする。この時、統計量 $\frac{\bar{X} -\mu}{\sigma/\sqrt{n}}$ を扱えないという事情がある。なお、$n$ さえ大きければ、t分布への道 (1) - らんだむな記憶で触れた中心極限定理により標準正規分布 $N(0,1)$ に近似的に従っていると考えてしまっても良い。 そこまで $n$ が大きくない場合には母分散のところに標本から計算される不偏分散 $s^2$ を代入した統計量 $T = \frac{\bar{X} -\mu}{s/\sqrt{n}}$ と用いることになる。ここまで見てきた一連の話のゴールはこの $T$ が自由度 $n-1$ の t 分布に従うことを見ることである。

さて、最後の式を変形することで、
\begin{align}
T &= \frac{\bar{X} -\mu}{s/\sqrt{n}} \\
&= \frac{\bar{X} -\mu}{\sigma/\sqrt{n}} \Big/ \frac{s}{\sigma} \\
&= \frac{\bar{X} -\mu}{\sigma/\sqrt{n}} \Big/ \sqrt{ \frac{(n-1)s^2}{\sigma^2} \Big/ (n-1) }
\end{align}

を得る。ここで $Z = \frac{\bar{X} -\mu}{\sigma/\sqrt{n}}$, $Y = \frac{(n-1)s^2}{\sigma^2}$ とおく。つまり $T = \frac{Z}{\sqrt{Y/(n-1)}}$ とする。実はこの時 $Z$ と $Y$ は独立に分布する。また $X_k \sim N(0,1)$ とt分布への道 (5) - らんだむな記憶で求めた正規分布の特性函数に注意して
\begin{align}
E[\exp (it Z)] &= \prod_{k=1}^n E[\exp \left(i \frac{t}{\sqrt{n}} \frac{X_k - \mu}{\sigma } \right)] \\
& = \prod_{k=1}^n \exp \left(- \frac{(t/\sqrt{n})^2}{2} \right) = \prod_{k=1}^n \exp \left(- \frac{t^2}{2n} \right) = \exp \left(- \frac{t^2}{2} \right)
\end{align}

を得る。これは標準正規分布の特性函数であるので、Lévy の反転公式から $Z \sim N(0,1)$ が従う。

ここで t 分布の定義を [1] p.202, [2] p.89, [3] p.89 を参考に書き下すと以下のようになる。

t 分布

$Z$ と $Y$ を独立な確率変数とし $Z \sim N(0,1)$, $Y \sim \chi_m^2$ とする。この時、$T = \frac{Z}{\sqrt{Y/m}}$ が従う確率分布を自由度 $m$ の t 分布と呼び $t_m$ で表す。

$Z = \frac{\bar{X} -\mu}{\sigma/\sqrt{n}}$ とした時、 $Z \sim N(0,1)$ であることは今しがた確認したばかりであるので、後は $Y = \frac{(n-1)s^2}{\sigma^2}$ が $Y \sim \chi_{n-1}^2$ であることを確認すれば統計量 $T = \frac{Z}{\sqrt{Y/(n-1)}}$ は $T \sim t_{n-1}$ であるということになる。