学習目標
標本サイズ・標本誤差・偏りの源を理解し、系統・層化・クラスター・多段抽出法の特徴と使いどころを習得する。1. 標本調査の基本概念
- 標本サイズ n:大きいほど標本誤差が小さくなる
- 標本誤差:不可避のランダム誤差。\(\propto 1/\sqrt{n}\)
- 非標本誤差(バイアス):設計・実施上の問題。n を増やしても解消されない
2. 各種標本抽出法
2.1 単純無作為抽出法
各個体を同じ確率で選ぶ基本的な方法。くじ引きや乱数表を使用。
2.2 系統抽出法
リストを一定間隔(k個置き)でサンプリング。
リストに周期性がある場合、特定のパターンに偏る危険がある。
2.3 層化抽出法
母集団を層(グループ)に分け、各層から無作為抽出。
少数派グループを確実に含められる。同じ n でも単純無作為抽出より精度が高い場合が多い。
2.4 クラスター抽出法
複数のクラスター(塊)から一部を選び、選ばれたクラスターを全数調査。
調査コストを削減できる。ただし精度は低下する傾向がある。
2.5 多段抽出法
複数段階で抽出を繰り返す。例:都道府県→市区町村→世帯。大規模調査で多用。
3. 例題
【例題 11-1】抽出法の選択
(a)全国高校生の学習習慣調査で予算が限られ、できるだけ少ない学校で多くの生徒を調査したい。(b)都市部・農村部・山間部で生活習慣が大きく異なるため、各地域から一定数確保したい。
解答
(a)
クラスター抽出法:学校(クラスター)をまとめて調査することで移動コスト削減。
(b)
層化抽出法:都市・農村・山間部の3層に分けて各層から一定数抽出。各地域が確実に代表される。
【例題 11-2】標本誤差と標本サイズ
\(p=0.45\) のとき (1) \(n=1000\) での95%水準の標本誤差 (2) 標本誤差を半分にする標本サイズ
解答
(1) \(1.96\sqrt{0.45\times0.55/1000}=1.96\times0.01573\approx\mathbf{3.08\%}\)
(2) 標本誤差は \(1/\sqrt{n}\) に比例するため、誤差を半分にするには \(n\) を
4倍(=4000)にする。
4. 練習問題
問題 1
系統抽出法の最大の問題点を説明せよ。
解答
周期性によるバイアス。母集団リストに周期性がある場合(例:毎週月曜に発注→7件置きにサンプリング→常に月曜のみ選ばれる)、特定のパターンに偏る。
問題 2
層化抽出法の利点を単純無作為抽出法と比較して2つ述べよ。
解答
①
少数派グループの確実な確保:人口の5%の農山村地域も一定数サンプリングできる。
②
精度の向上:同質な個体が同じ層に属するため層内分散が小さく、推定精度が上がる。
問題 3
非標本誤差(バイアス)の具体例を2つ挙げ、それぞれの解消方法を述べよ。
解答
①
選択バイアス(例:ネット調査で高齢者が除外)→無作為抽出・訪問調査を採用。
②
無回答バイアス(例:健康意識が低い人が回答しない)→追跡調査の実施・不回答者の特性調査。