標本調査と無作為抽出

収集法 5-2 | キーワード:標本サイズ・標本誤差・系統・層化・クラスター・多段抽出法

学習目標

標本サイズ・標本誤差・偏りの源を理解し、系統・層化・クラスター・多段抽出法の特徴と使いどころを習得する。

1. 標本調査の基本概念

母比率推定の標本誤差(近似)
\[\text{標本誤差}\approx 1.96\sqrt{\frac{p(1-p)}{n}}\quad(95\%\text{信頼水準})\]

2. 各種標本抽出法

2.1 単純無作為抽出法

各個体を同じ確率で選ぶ基本的な方法。くじ引きや乱数表を使用。

2.2 系統抽出法

リストを一定間隔(k個置き)でサンプリング。

リストに周期性がある場合、特定のパターンに偏る危険がある。

2.3 層化抽出法

母集団を層(グループ)に分け、各層から無作為抽出。

少数派グループを確実に含められる。同じ n でも単純無作為抽出より精度が高い場合が多い。

2.4 クラスター抽出法

複数のクラスター(塊)から一部を選び、選ばれたクラスターを全数調査。

調査コストを削減できる。ただし精度は低下する傾向がある。

2.5 多段抽出法

複数段階で抽出を繰り返す。例:都道府県→市区町村→世帯。大規模調査で多用。

3. 例題

【例題 11-1】抽出法の選択

(a)全国高校生の学習習慣調査で予算が限られ、できるだけ少ない学校で多くの生徒を調査したい。(b)都市部・農村部・山間部で生活習慣が大きく異なるため、各地域から一定数確保したい。

解答
(a)クラスター抽出法:学校(クラスター)をまとめて調査することで移動コスト削減。
(b)層化抽出法:都市・農村・山間部の3層に分けて各層から一定数抽出。各地域が確実に代表される。
【例題 11-2】標本誤差と標本サイズ

\(p=0.45\) のとき (1) \(n=1000\) での95%水準の標本誤差 (2) 標本誤差を半分にする標本サイズ

解答
(1) \(1.96\sqrt{0.45\times0.55/1000}=1.96\times0.01573\approx\mathbf{3.08\%}\)
(2) 標本誤差は \(1/\sqrt{n}\) に比例するため、誤差を半分にするには \(n\) を4倍(=4000)にする。

4. 練習問題

問題 1

系統抽出法の最大の問題点を説明せよ。

問題 2

層化抽出法の利点を単純無作為抽出法と比較して2つ述べよ。

問題 3

非標本誤差(バイアス)の具体例を2つ挙げ、それぞれの解消方法を述べよ。