学習目標
仮説検定の基本的な考え方、p値・帰無仮説・対立仮説・両側/片側検定の設定、第1種・第2種の過誤と検出力を正確に理解する。1. 仮説検定の基本的な考え方
「帰無仮説 \(H_0\) が正しいと仮定したとき、得られたデータがどれくらい稀か」を確率で評価し、帰無仮説を棄却するかどうかを判断する。
裁判のアナロジー:帰無仮説=「被告は無罪」。証拠(データ)が十分でなければ無罪(棄却できない)。
2. 検定の手順
- \(H_0\) と \(H_1\) を設定する
- 有意水準 \(\alpha\) を決める(慣習的に5%または1%)
- 検定統計量を計算する
- 棄却域または \(p\) 値を求める
- 結論を述べる(\(H_0\) を棄却する/できない)
「帰無仮説を棄却できない」=「帰無仮説が正しい」ではない。証拠が不十分なだけ。
3. p値(p-value)
p値:帰無仮説が正しいと仮定したとき、観測されたデータと同じか、それ以上に極端なデータが得られる確率。
- \(p < \alpha\):有意水準 \(\alpha\) で \(H_0\) を棄却(統計的に有意)
- \(p \ge \alpha\):\(H_0\) を棄却できない
p値の誤解:p値は「\(H_0\) が正しい確率」ではない。「\(H_0\) のもとでデータが得られる確率」。また統計的有意性と実務的重要性(効果量)は別物。
4. 両側検定と片側検定
| 種類 | 対立仮説 | 棄却域 |
|---|
| 両側検定 | \(\mu\ne\mu_0\) | 両側に各 \(\alpha/2\) |
| 右片側検定 | \(\mu>\mu_0\) | 右側のみ \(\alpha\) |
| 左片側検定 | \(\mu<\mu_0\) | 左側のみ \(\alpha\) |
片側検定の方が同じ \(\alpha\) でも棄却しやすい(棄却域が片方に集中)。ただし方向の根拠が必要。
5. 第1種・第2種の過誤・検出力
| \(H_0\) が真 | \(H_0\) が偽 |
|---|
| \(H_0\) を棄却 | 第1種の過誤(\(\alpha\)) 偽陽性 | 正しい判断(検出力 \(1-\beta\)) |
| \(H_0\) を棄却しない | 正しい判断 | 第2種の過誤(\(\beta\)) 偽陰性 |
検出力 \(= 1-\beta\):\(H_0\) が偽のとき正しく棄却できる確率。標本サイズを増やすと検出力は上がる。
6. 例題
【例題 21-1】p値の解釈
検定結果 \(p=0.03\)、有意水準 \(\alpha=0.05\)。次のうち正しいものはどれか。
①\(H_0\) が正しい確率は3% ②有意水準5%で \(H_0\) を棄却できる ③効果が実務的に重要であることが示された ④有意水準1%でも \(H_0\) を棄却できる
解答
正解:②①誤:p値は「\(H_0\) が正しい確率」ではない。②正:\(p=0.03<\alpha=0.05\)。③誤:統計的有意性と実務的重要性は別。④誤:\(p=0.03>\alpha=0.01\)。
【例題 21-2】過誤の解釈
新薬の治験で「新薬は有効」を \(H_1\) とする。第1種・第2種の過誤がそれぞれ起きたときの実際の意味を述べよ。
解答
第1種の過誤(\(\alpha\)):薬が実際は無効なのに有効と誤判断→
無効な薬を承認(偽陽性)。
第2種の過誤(\(\beta\)):薬が実際は有効なのに検出できない→
有効な薬を承認しない損失(偽陰性)。
7. 練習問題
問題 1
両側検定と片側検定を同じ \(\alpha\) で行うとき、どちらが棄却しやすいか。理由も述べよ。
解答
片側検定の方が棄却しやすい。両側検定では棄却域が両側に各 \(\alpha/2\) ずつ配分される。片側検定では片側に \(\alpha\) 全部が集中するため棄却域の境界値が低くなり棄却しやすい。例:\(\alpha=0.05\) で両側 \(z=\pm1.96\)、右片側 \(z=1.645\)。
問題 2
\(\alpha=0.05\) で検定し \(p=0.04\) で \(H_0\) を棄却した。このとき犯している可能性がある過誤の種類と確率の上限を答えよ。
解答
第1種の過誤を犯している可能性がある。\(H_0\) を棄却したので、もし \(H_0\) が真であれば第1種の過誤。その確率の上限は有意水準 \(\alpha=0.05\)(
5%)。
問題 3
標本サイズを大きくすると検出力が上がる理由を標準誤差の観点から説明せよ。
解答
n が大きくなると標準誤差 \(\sigma/\sqrt{n}\) が小さくなり、検定統計量の値が大きくなる。同じ差でも統計量が大きくなるため \(H_0\) が偽のときにより確実に棄却域に入るようになり、第2種の過誤 \(\beta\) が下がって検出力 \(1-\beta\) が上がる。