中心と散らばりの活用

1変数データ 2-4 | キーワード:偏差・z得点・標準化・変動係数・指数化・偏差値

学習目標

標準化(z得点)によって異なる単位・スケールのデータを比較できるようになる。変動係数と指数化の意味と計算を習得する。

1. 偏差

偏差
\[\text{偏差}_i = x_i - \bar{x}\]

重要な性質:偏差の総和は必ず0。

偏差の総和
\[\sum_{i=1}^{n}(x_i-\bar{x})=0\]

2. 標準化(z得点)

異なる単位・スケールのデータを平均0・標準偏差1に変換する操作。

z得点
\[z_i = \frac{x_i - \bar{x}}{s}\]

標準化後の性質:平均=0、標準偏差=1、分散=1

偏差値は z 得点の応用:偏差値 = 10z + 50。平均が50、標準偏差が10のスケール。

3. 変動係数(CV)

単位の異なるデータのばらつきを比較するための相対的指標。

変動係数
\[\text{CV} = \frac{s}{\bar{x}} \times 100\%\]
平均が0や負の値になる変数には使えない。

4. 指数化

ある基準時点の値を100として相対的な大きさを表す方法。

指数
\[\text{指数}_t = \frac{y_t}{y_{\text{基準}}} \times 100\]

例:消費者物価指数(CPI)は基準年の物価水準を100として各年を表す。

5. 例題

【例題 5-1】z得点による比較

Aさんは数学(平均70, 標準偏差10)で84点、英語(平均60, 標準偏差15)で81点。どちらの成績が相対的に高いか。

解答
数学:\(z=(84-70)/10=1.4\)
英語:\(z=(81-60)/15=1.4\)
どちらも \(z=1.4\) で同じ相対的位置
【例題 5-2】変動係数による比較

工場A(重量):平均100g、標準偏差5g。工場B(長さ):平均20cm、標準偏差2cm。相対的ばらつきを比較せよ。

解答
工場A:\(\text{CV}_A=5/100\times100=5\%\)
工場B:\(\text{CV}_B=2/20\times100=10\%\)
工場Bの方が相対的ばらつきが大きい。単位が異なるので標準偏差を直接比べることはできない。
【例題 5-3】偏差値の計算

試験(平均60, 標準偏差12)でTさんが72点を取った。偏差値を求めよ。

解答
\(z=(72-60)/12=1.0\)、偏差値 \(=10\times1.0+50=\mathbf{60}\)

6. 練習問題

問題 1

データ:10,20,30,40,50(平均=30)の各偏差を求め、偏差の合計が0になることを確認せよ。

問題 2

Bさんは国語(平均55, 標準偏差8)で71点、理科(平均65, 標準偏差20)で97点。どちらが相対的に高い成績か。

問題 3

2015年を基準(=100)として2020年の指数が120のとき、この間の変化率を求めよ。