らんだむな記憶

blogというものを体験してみようか!的なー

統計勉強ノート(2)

電車の中でぼんやり読みつつ。

変動係数(coefficient of variation) = 標準偏差 / 平均値

ある程度平均値が0から離れていないとあかんよな、これだと。

中央値, 最頻値, 四分位数。

5数要約 = 最小値, 第1四分位数, 中央値(第2四分位数), 第3四分位数, 最大値

箱ひげ図 = 5数要約の可視化。ひげの長さは四分位範囲の1.5倍くらいにしちゃうことも。

相関係数 $r_{xy} = \mathrm{Cov}(x,y)/ \sigma(x) \sigma(y)$ これは、Schwarzの不等式より、-1から1の範囲の値になる。

偏相関係数:
\begin{equation}
r_{yz\cdot x} = \frac{r_{yz} - r_{xy} r_{xz}}{\sqrt{1-r_{xy}^2} \sqrt{1-r_{xz}^2}}
\end{equation}
これは、改訂版 日本統計学会公式認定 統計検定2級対応 統計学基礎 | 田中豊, 中西寛子, 姫野哲人, 酒折文武, 山本義郎, 日本統計学会 | 本 | Amazon.co.jpでも統計学入門 (基礎統計学) | 東京大学教養学部統計学教室 | 本 | Amazon.co.jpでも導出は端折られている。
ものによっては、$r_{yz | x}$という記号を使っているが、こちらのほうが良いように感じる。