★ N=<30の根拠 ★

9766. N=<30の根拠 ひろき 2006/04/04 (火) 13:16
└9767. Re: N=<30の根拠 青木繁伸 2006/04/04 (火) 15:20
 └9775. Re^2: N=<30の根拠 ひろき 2006/04/04 (火) 18:25
  └9776. Re^3: N=<30の根拠 青木繁伸 2006/04/04 (火) 18:52


9766. N=<30の根拠 ひろき  2006/04/04 (火) 13:16
初歩的な質問をさせて下さい。

(1)クロス表を読む場合Nが30サンプル未満の場合,参考数字として読みますが,これの根拠はどこにあるのでしょうか。

学生時代,とある分布の曲線がN=1から2,3,4...とふやしていくと,30あたりで正規分布に近くなるという説明を受けましたが,仔細を忘れてしまいまして。「T分布が」なのでしょうか。

(2)またリサーチを行った時に,とある会社から「最近は価値観も多様化していることですし,N=<50とか100以上で読んだ方がいい」と言われました。皮膚感覚的には納得するのですが,統計的な根拠はあるのでしょうか。

宜しくご教授お願いいたします。

     [このページのトップへ]


9767. Re: N=<30の根拠 青木繁伸  2006/04/04 (火) 15:20
上の方でお願いしているところですが,丸付き数字は使わないでください。

> (1)クロス表を読む場合Nが30サンプル未満の場合,参考数字として読みますが,これの根拠はどこにあるのでしょうか。

参考数字として読むというのはどういうことなんでしょうか。
N がサンプルサイズを表すのなら,そもそもそういうサイズで行った調査自体の意味が薄れてしまうと言うことですか。

「読む」ということに,検定も含まれ,その結論の意味を考えるということなら,サンプルサイズに依存しない検定法を取ればよろしいでしょう。

> 学生時代,とある分布の曲線がN=1から2,3,4...とふやしていくと,30あたりで正規分布に近くなるという説明を受けましたが,仔細を忘れてしまいまして。「T分布が」なのでしょうか。

大文字の「T分布」というのは小文字の「t分布」の記憶違いでしょうが。
サンプルサイズを大きくしていけば,標本平均の分布などは正規分布に近づきますね。
しかしまあ,二項分布だってサンプルサイズを大きくしていけば正規分布に近づきます。


> (2) またリサーチを行った時に,とある会社から「最近は価値観も多様化していることですし,N=<50とか100以上で読んだ方がいい」と言われました。皮膚感覚的には納得するのですが,統計的な根拠はあるのでしょうか。

これも,「読む」ということの意味が定義されていないので,私にとっては意味不明なのですが,サンプルサイズが100 とかでは,まだまだ不十分ではないかと思います。

     [このページのトップへ]


9775. Re^2: N=<30の根拠 ひろき  2006/04/04 (火) 18:25
青木様,早速のご返信ありがとうございます。

> 丸付き数字は使わないでください。
大変失礼致しました。基本的なマナーですね。

> > (1)クロス表を読む場合Nが30サンプル未満の場合,参考数字として読みますが,これの根拠はどこにあるのでしょうか。
>
> 参考数字として読むというのはどういうことなんでしょうか。
> N がサンプルサイズを表すのなら,そもそもそういうサイズで行った調査自体の意味が薄れてしまうと言うことですか。

サンプルサイズ自体は2000とか3000はとっているのですが,その
切り口として(例:性別で男性)見た場合の話です。
リサーチ会社のレポートのクロス表の多くには,切り口のトータル数の所に「N<30なので参考数字」などという注釈があります。

> > (2) またリサーチを行った時に,とある会社から「最近は価値観も多様化していることですし,N=<50とか100以上で読んだ方がいい」と言われました。皮膚感覚的には納得するのですが,統計的な根拠はあるのでしょうか。
>
> これも,「読む」ということの意味が定義されていないので,私にとっては意味不明なのですが,サンプルサイズが100 とかでは,まだまだ不十分ではないかと思います。

こちらも,その切り口のサンプル数が,という意味です。
曖昧な言葉を使ってしまい申し訳ありません。

     [このページのトップへ]


9776. Re^3: N=<30の根拠 青木繁伸  2006/04/04 (火) 18:52
> サンプルサイズ自体は2000とか3000はとっているのですが,その
> 切り口として(例:性別で男性)見た場合の話です。
> リサーチ会社のレポートのクロス表の多くには,切り口のトータル数の所に「N<30なので参考数字」などという注釈があります。

母数の推定精度のことを言っているのでしょうね。
n=30 のとき,標本比率が50%のとき,母比率の95%信頼限界は0.3129703〜0.6870297 ですからね。
nが4倍 n=120 で
0.4073693〜0.5926307 と,やっと精度が倍(区間が半分)になるわけですから。どの程度の精度を必要とするかがちゃんと定義されていないと n がいくつ必要かなどは議論できませんね。

テレビの視聴率は関東は600世帯ですが,視聴率が 10% のときには,0.07718021〜0.12684307ですから,0.1%の差で一喜一憂することがどういうことなのかなどと,よく嗤われるわけです。

母比率が 10% で,それを ± 1% で推定するには,3458 ほどのサンプルが必要になります。± 0.1% で推定するにはなんと,345732必要になる。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 037 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る