No.12581 無作為抽出?  【初心者】 2010/05/07(Fri) 10:38

海外のある農村の調査で戸籍簿などが手に入らず母集団についての情報がない状況で,時間の都合から,100世帯に対し,世帯主の年齢や家計などの情報を集めました。
その後,悉皆調査を実施して全世帯が300世帯であることがわかり,またそれら世帯の世帯主の年齢も判明しました。

このような場合,
1.選ばれた100世帯が母集団を代表しているのか検定することはできますか?
2.1.の結果「代表している」ことがいえた場合,無作為抽出した100世帯ということはできますか?

よろしくお願いいたします。

No.12583 Re: 無作為抽出?  【青木繁伸】 2010/05/07(Fri) 10:48

どのような特性を考えた場合に調査した100世帯が,全300世帯を代表しているというかを考える必要があるで しょう。しかし,それより前に,100世帯が300世帯を代表しているかどうかは,母集団(300世帯)の統計データがわからないと,代表しているかどう かもわからないですよね。つまり,例えば100世帯の世帯主の年齢を考えたとき,300世帯全部の世帯主の年齢が分からないと比較できないでしょうという ことです。家計データについても同じ。年収,食費,教育費 etc. 何にしても,比較する相手のデータ(300世帯のデータ)がないと,比較できません。結局,調査できなかった200世帯について追加調査をすれば,結局の 所悉皆調査をすることになります。

No.12585 Re: 無作為抽出?  【初心者】 2010/05/07(Fri) 17:27

青木先生

早速のお返事ありがとうございました。

舌足らずな,説明となってしまったのですが,
・標本調査(n=100)世帯主の氏名,世帯主の年齢,家族構成,家計,職業,学歴等のデータ
・悉皆調査(n=300)世帯主の氏名,世帯主の年齢のデータ
を持っています。ただし,標本調査を実施した時点では,母集団を把握する手段がなく,無作為抽出は行えませんでした。

標本調査が先行してしまい,母集団から標本を無作為抽出して詳しい調査を行うことができませんでした。

そこで,
300世帯の世帯主の年齢を階層化したものの分布と,
100世帯の世帯主の年齢を階層化したものの分布を,
比較して,この分布に差がないことを理由に,
標本が母集団を代表しているとして,
無作為抽出した場合と同じように統計的分析を実施することは可能でしょうか?

なお,母集団について年齢以外の属性などを追加調査することは,きわめて困難です。

お手数おかけいたしますが,
よろしくお願いいたします。

No.12586 Re: 無作為抽出?  【青木繁伸】 2010/05/07(Fri) 19:08

あなたの調査したいいろいろな事柄が,年齢によってのみ規定されると仮定できるなら,母集団と標本の年齢構成が同じということで標本が母集団を代表しているということはできるでしょう。しかし,たいていは年齢だけでは決まらないのでは?
そ れよりは,あなたが100世帯を選んだ手順をよく振り返り,とくに有意抽出になってはいないということを示した方がよいのではないでしょうか。たとえば村 の中心部だけでサンプリングしたのなら偏った標本といえるでしょうけど,周辺部も含め何箇所かを選び,そこからなるべくランダムに選んだとか。家構えの立 派そうな所を選んだなんてことはないんでしょうからね。

No.12588 Re: 無作為抽出?  【初心者】 2010/05/07(Fri) 19:35

青木先生

おっしゃるとおり,年齢によってのみ規定される属性となると,かなり少なくなります。記述的方法も取り入れつつ進めたいと思います。
ご丁寧にごご回答いただきありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 043 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る