標本分布①(大数の法則・中心極限定理)

確率モデル 6-4a | キーワード:標本平均・標準誤差・チェビシェフ・大数の法則・中心極限定理・正規近似

学習目標

標本平均の期待値・分散、チェビシェフの不等式、大数の法則、中心極限定理を理解する。二項分布の正規近似と連続修正も習得する。

1. 標本平均の期待値と分散

標本平均の分布
\[E[\bar{X}]=\mu,\quad V[\bar{X}]=\frac{\sigma^2}{n},\quad \text{標準誤差(SE)}=\frac{\sigma}{\sqrt{n}}\]
標準誤差(SE)は母集団の標準偏差を \(\sqrt{n}\) で割ったもの。n が大きいほど小さくなる(推定精度が上がる)。

2. チェビシェフの不等式

チェビシェフの不等式
\[P(|X-\mu|\ge k\sigma)\le\frac{1}{k^2}\]

分布の形によらず成立する普遍的な不等式。例:\(k=2\) のとき \(P(|X-\mu|\ge2\sigma)\le1/4=25\%\)。

3. 大数の法則

大数の法則
\[\bar{X}\xrightarrow{P}\mu\quad(n\to\infty)\]

標本サイズを大きくすると、標本平均は母平均に確率収束する。コインを投げる回数を増やすほど表の割合は0.5に近づく。

ギャンブラーの誤謬:「ずっと裏が出たから次は表が出やすい」は誤り。独立試行では過去の結果は次に影響しない。

4. 中心極限定理(CLT)

中心極限定理
\[\frac{\bar{X}-\mu}{\sigma/\sqrt{n}}\xrightarrow{d} N(0,1)\quad(n\to\infty)\]

母集団の分布が何であっても、\(n\) が十分大きければ標本平均 \(ar{X}\) の分布は正規分布に近づく。目安:\(n\ge30\)。

5. 二項分布の正規近似と連続修正

二項分布の正規近似
\[Z=\frac{X-np}{\sqrt{np(1-p)}}\approx N(0,1)\]
連続修正(連続性補正)
\[P(X\le k)\approx P\!\left(Z\le\frac{k+0.5-np}{\sqrt{np(1-p)}}\right)\]

6. 例題

【例題 16-1】中心極限定理の適用

平均50、標準偏差10の母集団から \(n=100\) の標本を取る。(1) \(\bar{X}\) の期待値と SE (2) \(P(\bar{X}\ge51)\)(\(P(Z\ge1)=0.1587\))

解答
(1) \(E[\bar{X}]=50\)、SE \(=10/\sqrt{100}=\mathbf{1}\)
(2) \(P(\bar{X}\ge51)=P(Z\ge(51-50)/1)=P(Z\ge1)=\mathbf{0.1587}\)
【例題 16-2】チェビシェフの不等式の適用

平均50、標準偏差5の分布。\(P(40\le X\le60)\) の下限をチェビシェフの不等式で求めよ。

解答
\(k=2\)(\(k\sigma=10\))なので \(P(|X-50|\ge10)\le1/4=0.25\)
よって \(P(40\le X\le60)\ge1-0.25=\mathbf{0.75}\)

7. 練習問題

問題 1

母平均72、母分散36の母集団から \(n=9\) の標本を取る。(1)\(\bar{X}\) の期待値とSE (2)\(P(\bar{X}\le74)\)(\(P(Z\le1)=0.8413\))

問題 2

中心極限定理の重要性を「母集団の分布」と「標本サイズ」の観点から説明せよ。