No.17016 層化無作為抽出の母集団推定について  【北島】 2012/06/07(Thu) 15:17

ご相談させて下さい。
ある統計調査の結果を査読しているのですが層化抽出での母集団推定について教えてください。下記は簡略化した例です。

・A市(10の区からなる)の市民を母集団としたライフスタイルや意識などの調査
・母集団の名簿は各区にあり,A市民全体の統一された名簿がない
・各区には区民名簿があり,閲覧し無作為抽出することができる

A市の総人口と各区ごとの人口は既知なので,その人口構成比に一致するようにサンプルサイズ2000を10区ごとに比例配分し,各区の名簿からその人数を系統抽出によって無作為に対象者としてあります。
(第1区の人口がA市の10%なら第1区からは200人無作為にサンプリング,第2区の人口がA市の8%なら第2区からは160人無作為にサンプリング)

こ の場合,各区ごとのデータを別々に見るならば完全な無作為抽出によるデータですが,A市全体のデータとして見た時,2000サンプルから母集団を推定する には何か特別な手順が必要なのでしょうか。それともきちんと比例配分されていればA市から無作為抽出したものと同様に考えて構わないのでしょうか。

お手数おかけしますがよろしくお願い致します。

No.17017 Re: 層化無作為抽出の母集団推定について  【青木繁伸】 2012/06/07(Thu) 17:17

全市の名簿が1つになっていてそこから無作為抽出する場合,各市でのサンプルサイズが完全に全市における各区の人口割合に比例しないことになるだけでしょう。
また,全市の名簿が1つといっても区ごとに分冊されているので,区ごとの名簿が各区にあるか市の一箇所にあるかの違いだけで,サンプリング上の違いもほとんどないでしょう。

No.17022 Re: 層化無作為抽出の母集団推定について  【北島】 2012/06/07(Thu) 20:48

ありがとうございます。
社会調査は層化抽出が多いので,常々疑問に思っておりました。

「区」のように,明らかに層化した区分ごとに傾向が違うデータ(例えば区ごとに住人の経済格差や支持政党や世帯人数など傾向が違うはず)をひとまとめにして全体推定に使えるのかどうか,よくわからなかったので,安心いたしました。

もう一歩踏み込みたいのですが,

A 各区ごとに分冊された名簿から比例配分したサンプルを無作為抽出
B 市全域のごちゃ混ぜの名簿(現実にはまずないと思いますが)から2000抽出

では全域の推定にはどちらが有利なのでしょうか。
感覚的にはAのほうが分散は小さくなりそうに思えますが,理屈がわかりません。 

No.17023 Re: 層化無作為抽出の母集団推定について  【青木繁伸】 2012/06/07(Thu) 21:00

なんらかの条件下でサンプリングしたという情報をその後の解析に利用することは可能です。
ただ,この場合にはそのような情報はほんの少ししか影響しないと思いますけど。

● 「統計学関連なんでもあり」の過去ログ--- 045 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る