★ 抽出標本数の決定法 ★

 110 抽出標本数の決定法  TOM  2003/01/17 (金) 15:48
  111 Re: 抽出標本数の決定法  青木繁伸  2003/01/17 (金) 16:42
   112 Re^2: 抽出標本数の決定法  TOM  2003/01/17 (金) 17:48
    114 Re^3: 抽出標本数の決定法  青木繁伸  2003/01/17 (金) 18:30
     115 Re^4: 抽出標本数の決定法  TOM  2003/01/17 (金) 19:17
      117 Re^5: 抽出標本数の決定法  青木繁伸  2003/01/17 (金) 19:55
      116 Re^5: 抽出標本数の決定法  青木繁伸  2003/01/17 (金) 19:48
       136 Re^6: 抽出標本数の決定法  TOM  2003/01/20 (月) 09:14
        137 Re^6: 抽出標本数の決定法  TOM  2003/01/20 (月) 09:23
    113 Re^3: 抽出標本数の決定法  青木繁伸  2003/01/17 (金) 18:26


110. 抽出標本数の決定法  TOM  2003/01/17 (金) 15:48
30万枚の水田を母集団として,いもち病の「発生圃場率」を推定する場合,最低どのくらいのサンプル数が必要か考えています。手元の統計学の本(応用統計ハンドブック第1版,養賢堂)を見て,離散変量に対する単純無作為抽出法(p712)かと思うのですが,サンプル数の決定の計算では,予備調査での発生率だけが変数となり,あとはtー分布表と,目標精度で決まるように読めます。信頼度95%,目標精度5%とすると,予備調査の発生率が50%の時に,必要サンプル数が最大の384個(補正なし)となり,母集団の大きさや予備調査のサンプル数,分散等がいくつであろうと,これ以上は必要無いということになるのでしょうか?非常に変な感じがしますが。ちなみに現在は200から300程度のサンプル数で調査しています。私の誤解でしょうか。または良い方法,参考書等あったらご教示下さい。

     [このページのトップへ]


111. Re: 抽出標本数の決定法  青木繁伸  2003/01/17 (金) 16:42
母数を推定(検定)するときに使えるのは,標本だけです。
標本の大きさ,その精度だけが結果に影響を与えます。
構成員数1万の母集団からであろうと,構成員数100万の母集団であろうと,実際にそこから大きさ100の標本を採ったとき,後者から取った標本の方が正確とか不正確ということはないです。
予備調査の標本の大きさや分散(精度)は,母数を推定するもとになるわけで,これは母数の推定に影響を与えます。予備調査の標本の大きさが小さいとか精度が悪いと真値からずれる確率が高くなり,そのようなずれた値から推定された母数が真値からずれる確率は当然高くなります。しかし,所詮,こ母数を推定するときに使われる数値は母数の非常に大まかな値であって,必ずしも予備調査をして得られるものでなくてもいいわけです。似たような状況で行われた他の調査結果でもいいし,正確に同じ項目でなくてもいいし,直感やいい意味で当てずっぽうでいいわけです(どんなに高くてもこれくらい,どんなに低くてもこれくらいという値を使って,実際に計算される標本サイズを評価すればよい)。

#標本数と標本の大きさの使い分けに注意!

     [このページのトップへ]


112. Re^2: 抽出標本数の決定法  TOM  2003/01/17 (金) 17:48
迅速なご回答有難うございました。対象が,例えば作物の草丈のような連続変量の平均値の推定の場合は,事前調査の分散が影響するのでわかるのですが,私の場合のように,「発生圃場率」の場合,個々のデータは,発病しているかしていないかの2通りしかないので,離散変量になるかと思います。元の質問であげた「応用統計ガイドブック」では,その場合のサンプル数の算出に使う変数は,予備調査の発生率だけでのようです。離散変量の場合は分散が意味を持たないのはわかるのですが,そうなると予備調査のサンプル数も影響しないわけで,それでも良いというのが良くわからないのですが。

     [このページのトップへ]


114. Re^3: 抽出標本数の決定法  青木繁伸  2003/01/17 (金) 18:30
>離散変量の場合は分散が意味を持たないのはわかるのですが,そうなると予備調査のサンプル数も影響しないわけで,

離散変量とおっしゃっているのは,あり・なしの変数ですね。その場合でも,サンプルサイズに意味はあります。(あり・なしに 1, 0 という数値を割り当てて平均値と分散などを求めて比較してみてください)
母比率 π, サンプルサイズ n のとき,標本比率の平均はπ,標準誤差は sqrt(π(1-π)/n) です。n が大きくなると標準誤差は小さくなります。
そうでなくては,世論調査で3000人を対象にしたりしないで30人くらいですませたいでしょう?

サンプルサイズの決め方については
http://aoki2.si.gunma-u.ac.jp/lecture/Kentei/sample-size.html
も,参照してみてください。

#サンプル数というのは標本数というのとおなじですね。
#標本の大きさを表すには,サンプルサイズといわないといけません。

     [このページのトップへ]


115. Re^4: 抽出標本数の決定法  TOM  2003/01/17 (金) 19:17
何度もすみません。

> 母比率 π, サンプルサイズ n のとき,標本比率の平均はπ,標準誤差は sqrt(π(1-π)/n) です。n が大きくなると標準誤差は小さくなります。
> そうでなくては,世論調査で3000人を対象にしたりしないで30人くらいですませたいでしょう?

標準誤差の違いが,算出される必要標本サイズに影響するのでしょうか?

> サンプルサイズの決め方については
> http://aoki2.si.gunma-u.ac.jp/lecture/Kentei/sample-size.html
> も,参照してみてください。

この中の「母比率の区間推定のとき」になると思うのですが,ここでの例題同様,信頼率95%,精度10%の場合,計算すると
p=0.5の時,n=96.04が最大値になるでいいですよね。
その96が,この信頼率と精度の場合は,母集団の大きさや予備調査のサンプルサイズに関係なく,本調査で必要なサンプルサイズの最大と考えてしまって良いのでしょうか?つまり私の調査では96あるいは97圃場調査すれば良いということになるのでしょうか?

     [このページのトップへ]


117. Re^5: 抽出標本数の決定法  青木繁伸  2003/01/17 (金) 19:55
全く別の観点からあなたの質問にコメントします。

「いもち病の「発生圃場率」」がどのように定義されるのか,私はよく分かりませんが,

稲熱病が発生した・しなかったという観測をするときの「単位」はなんでしょうか。「田圃一枚」でしょうか?広さは無視するのでしょうか。隣接する田圃はどのように取り扱うのでしょうか。隣の田圃に影響を受けない程度にばらついた田圃を考えるのでしょうか。
言ってみれば,「30万枚の水田を母集団」とかはどういう母集団か,その構成要素(ケース)は何かと言うことです。標本はどのように採るのかと言うことでもありますが。
田圃の中の一株でも稲熱病にかかれば,その田圃の稲熱病の発生有りとなるのでしょうか。

     [このページのトップへ]


116. Re^5: 抽出標本数の決定法  青木繁伸  2003/01/17 (金) 19:48
> 標準誤差の違いが,算出される必要標本サイズに影響するのでしょうか?

よく読んでください。
最初の113の回答にちゃんと書いてあります。
それいこう,ああだこうだというから,話が発展しているだけです。
(私も答えていて,あなたが何がわからないと言っているのか分からなくなりました)

> p=0.5の時,n=96.04が最大値になるでいいですよね。
> その96が,この信頼率と精度の場合は,母集団の大きさや予備調査のサンプルサイズに関係なく,本調査で必要なサンプルサイズの最大と考えてしまって良いのでしょうか?


母集団の大きさには関係しないと最初にかきました。それは理解できましたか?
予備調査のサンプルサイズにも関係しません。予備調査のサンプルサイズはそこで入れる0.5とかの精度に関係するだけです。

p=0.5のときに必要なnは最大になるに決まっています。

> つまり私の調査では96あるいは97圃場調査すれば良いということになるのでしょうか?

そういうことでしょう。
もし,母比率が0.5より離れている場合には,0.1よりも精度が高くなるというだけです。最低でも精度0.1は保証されるという意味ではあなたの解釈は正しいです。

     [このページのトップへ]


136. Re^6: 抽出標本数の決定法  TOM  2003/01/20 (月) 09:14
返事が遅くなってすみません。
いもち病の発生圃場率はこの場合は,圃場単位で,発生した,しないだけです。
隣接圃場等は無関係で,圃場ひとつひとつが独立となります。

実際の調査は
1圃場につき50株の全ての葉を観察し,
その葉のうち何%が発病しているか(発病葉率)を調査します。
その発病葉率が0.1%以上の圃場を「発生圃場」として,
それが30万圃場の中で何%あるか(発生圃場率)
を推定したいわけです。
そのために必要な調査圃場数はいくつかということが今知りたいことです。

前にも書きましたが,現在200〜300圃場調査してますので
十分と考えていいようです。
大変勉強になりました。有難うございます。

     [このページのトップへ]


137. Re^6: 抽出標本数の決定法  TOM  2003/01/20 (月) 09:23
付けくわえますと
1枚1枚の圃場は独立で
隣の圃場には影響されないということを前提にしています。
単純無作為抽出とした場合ということかと思います。

もちろん実際にはそうではありませんが,
あまりにも条件が複雑になるので,
単純化して想定した場合,いくつの圃場を調査すればいいか
いうのが今知りたいことです。

     [このページのトップへ]


113. Re^3: 抽出標本数の決定法  青木繁伸  2003/01/17 (金) 18:26
> 予備調査のサンプル数も影響しないわけで,

予備調査のサンプルサイズは,予備調査によって推定される母数の推定値(の推定値とでもいったらいいのか)の精度にちゃんと影響します。

しかし,その数値は所詮,大まかな目安程度にしか使われないので,そんなに目くじらを立てる必要がないということです。

だって,予備調査で数千ものサンプルサイズが必要なら,いきなり本調査やるのと変わらないではないですか。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 023 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る