「統計学関連なんでもあり」の過去ログ--- 041

No.06416　小集団のサンプルサイズの求め方　　【相談者】　2008/04/25(Fri) 10:54

小集団のサンプルサイズの求め方についての素朴な疑問です。

例えは，信頼水準95％，標準誤差の許容限度を5％以内で無限母集団の母比率pを推定するとして，必要な標本数は，

http://aoki2.si.gunma-u.ac.jp/lecture/SampleSize/pconf.html

などにもあるように，サンプルサイズn＝1.96^2/0.05^2*p(1-p)　（1）式

で，安全側をみてp(1-p)が最大になる0.5をとると，

n=1.96^2/0.05^2*0.5*0.5=384

となります。

この時，対象とする母集団Nが1万以下のような場合
有限母集団修正係数N/(N+n-1)　（2）式
を，上で求めたサンプルサイズに掛けてサンプルサイズを小さくすることができます。

有限母集団修正係数をかけると，母集団Nが2という非常に小さな集団の場合でもサンプルサイズを求めることができます。

もっとも，母集団Nが小さくなり，大体30を切ったぐらいから母集団とサンプルサイズの大きさはほぼ等しくなります。

長くなりました。ここまでが前置きです。

素朴な疑問ですが，（1）式はあくまで，無限母集団を想定した正規分布から導かれたものであって，いくら（2）式を用いて値が求められるからといって，例えば，母集団が30未満くらいの小標本に（1）式×（2）式でサンプルサイズを求めても良いものなのでしょうか。

標本調査をする人が，全て国民全体を対象としているわけではなく，小さな集落や教室，職場など数十人程度の集団を対象に調査をしたいというニーズも大きいと思います。

サンプルサイズについての本をみてもこの点に直接触れられているものをみかけないと思いましたので質問させていただきました。

御回答をよろしくお願いします。

No.06417　Re: 小集団のサンプルサイズの求め方　　【青木繁伸】　2008/04/25(Fri) 12:13

母集団が30未満というのは，母集団（また，標本）の定義自体がちょっとおかしい
母集団が100程度なら，全数調査すればよい（標本調査する意味がない）
計算できるということと，それに意味があるというのは別のこと

そういう理由で「この点に直接触れられているものをみかけない」のでしょう

No.06418　Re: 小集団のサンプルサイズの求め方　　【相談者】　2008/04/25(Fri) 13:34

早速の御回答ありがとうございます。相談して良かったです。もうしばらく相談に乗ってください。

>計算できるということと，それに意味があるというのは別のこと

全く同感です。

本に関してですが，例えば，森田優三，久次智雄，1993年，『新統計概論』，日本評論社の推定，検定の箇所には，n≦30，またはn≦50ならばt分布を用いるという記述がいくつかあるのですが，サンプルサイズを求める箇所では何も触れられていません。

この他，いくつかの類書をみても（1）式×（2）式で母集団が50のサンプルサイズが50などと例示しているものがあります。

計算自体は間違っていないのですが，母集団が数十程度の集団に無限母集団の正規分布から求められた（1）式×（2）式を用いて良いものなのか，疑問がありますし，全数調査をしようとしても，100％の回収率が得られなかった場合にその調査結果をどのように評価するのか分かりません。

標本調査の専門家は，この点あまり気にしないのかなとも思います。

例えば30位の集団なら，全数調査を試みることは当然可能です。しかし，アンケート調査などでは，一般に100％回収するのは困難です。100％の回収ができなければ，結果的には標本調査と同じと考えます。

修正係数を用いた場合でも，母集団が30未満くらいだと，母集団≒サンプルサイズとなり，この結果からも，母集団が小さい場合は，母集団と同じだけのサンプルを集めよということが示唆されます。

しかし，小集団の場合，現実に母集団と同じだけのサンプルが集められなければサンプルサイズを求める時に前提にした信頼水準，標準誤差を使うのは問題だと思いますし，この場合の信頼水準，標準誤差はどうなるかという素朴な疑問を感じます。

コメントをお願いいたします。

No.06419　Re: 小集団のサンプルサイズの求め方　　【青木繁伸】　2008/04/25(Fri) 13:57

段落内で改行しないように注意してください。

> 全数調査をしようとしても，100％の回収率が得られなかった場合にその調査結果をどのように評価するのか分かりません。

全数調査でなくて標本調査でも，回収率が低いのは当たり前といってよいことです。郵送アンケート調査などだと，50%を切ることも珍しくありません。そのような場合，データ解析ができないとお考えですか。そんなことないですよね。回収率と解析の妥当性は無関係です。回収率が50%と予想できるなら，必要数の倍のアンケート用紙を郵送すればよいだけのことです。問題とするべきは，回答の偏りですね。回収されたアンケートの多くが調査に好意的な人からのものである等と言ったときには大問題です。

> 100％の回収ができなければ，結果的には標本調査と同じと考えます。

それは極端です。30人に調査して，29人からしか回答が得られなかったとして，確かに全数調査ではないけど，標本調査でもないですよ。

> 母集団が30未満くらいだと，母集団≒サンプルサイズとなり，この結果からも，母集団が小さい場合は，母集団と同じだけのサンプルを集めよということが示唆されます。

全数調査すればよいのです。

> 母集団と同じだけのサンプルが集められなければ，サンプルサイズを求める時に前提にした信頼水準，標準誤差を使うのは問題だと思いますし

そもそも，全数調査に近い場合に，誤差もへったくれもないわけです。得られるのは母数にきわめて近い真値なのですから。

最初に書いたように，30ほどの母集団というのはちょっとおかしいと思いませんか。
たとえば，ある小学校6年生の一つのクラスというのを母集団と考えると，何にもできなくなりはしませんか。たとえば，そのクラスのあるテストの平均値が60 点だったとすると，それは母平均ですから，日本全国の6年生のテストの平均値が65点だとしても，「5点の差がある」というだけで，その差が有意な差かどうかなんて議論にならない。日本全国の6年生を母集団と見て，そのクラスを標本（確かに無作為標本ではないかも知れないが，たまたまその小学校に通学していると見れば（かなり無理はあるが）無作為でないとは言えまい）と見なければ，標本統計が行えない。

No.06420　Re: 小集団のサンプルサイズの求め方　　【相談者】　2008/04/25(Fri) 15:06

コメントありがとうございます。引き続きよろしくお願いします。

>30ほどの母集団というのはちょっとおかしいと思いませんか。

統計学の教科書的な常識では，母集団30というのはおかしいと思います。
直接的には，先ほどの森田他のテキストの「n≦30，またはn≦50ならばt分布」という記述で母集団30の場合どうなるのだろうという疑問を持ちました。
また，実際のアンケート調査では，無限母集団を想定することの方が常識的でない場合もあると思います。ある集落の人口が50人として，その50人の平均的な意見を聞きたいというような場合，その集落の人口を無限と考えるのは，感覚的に難しいです。

>郵送アンケート調査などだと，50%を切ることも珍しくありません。そのような場合，データ解析ができないとお考えですか。そんなことないですよね。回収率と解析の妥当性は無関係です。

この点は理解しているつもりです。
ただ対象が100で全数調査したとしても，回収率が50％なら，手元にある調査票は50で，それなら事前の標本設計の有無は別にして，結果的には標本調査をしたのと変わらないのではと思ったのです。
また，標本調査なら，計算で求められたサンプルサイズ÷想定回収率で，発送数を求めることができますが，全数調査でそれをすると，発送数が対象とする母集団の数を上回ってしまいます。強制的にアンケートを回収するわけにもいかないので，一口に全数調査と言っても，実際に全数を集めるのは困難です。

>それは極端です。30人に調査して，29人からしか回答が得られなかったとして，確かに全数調査ではないけど，標本調査でもないですよ。
>そもそも，全数調査に近い場合に，誤差もへったくれもないわけです。得られるのは母数にきわめて近い真値なのですから。

なるほどと思いました。

つまり，こういうことでしょうか。
無限母集団からの標本比率が正規分布に従うということから（1）式×（2）式は求められ，信頼水準や標準誤差の許容限度を管理した上で，標本数を求めることができる。
実際の調査では，母集団は有限だが，その数が数千程度あれば，無限母集団と考えて問題ない。しかし，だんだん対象の数が小さくなってくると，（1）式 ×（2）式で求められるサンプルサイズ≒対象母集団の数となってきて全数調査に近くなる。この時点で，標本調査としての信頼水準とか標準誤差といったものは意味を失ってしまう。

しかし，母集団の数に近いサンプルサイズを得ることが出来れば，当初，想定された信頼水準や標準誤差の精度を下回らない程度の全数調査に近い結果を得ることが出来る（この部分証明無し）。逆に言うと，それくらいのサンプルサイズが確保できるよう努力しないといけない。

話しは少し変わりますが，先ほどの森田他のテキストの「n≦30，またはn≦50ならばt分布」から考えると，母集団が数十程度であれば，正規分布からではなくt分布から導いたサンプルサイズを求める式があるのかなとも思いますが，浅学のためよく分かりません。そのような式はあるのでしょうか。

それと，信頼水準を固定して（1）式や（2）式にnを与えると，nが数十程度の小さな値であっても標準誤差を求めることができます。また，標準誤差を固定して信頼水準を求めることができます。nが数十の場合でも，こうした計算をしてもよいものなのでしょうか。

コメントをよろしくお願いいたします。

No.06423　Re: 小集団のサンプルサイズの求め方　　【青木繁伸】　2008/04/25(Fri) 15:37

> ある集落の人口が50人として，その50人の平均的な意見を聞きたいというような場合，その集落の人口を無限と考えるのは，感覚的に難しいです。

ですから，無限母集団だなんて考える必要ないんですってば。
たんに，標本。

> 一口に全数調査と言っても，実際に全数を集めるのは困難です

ですから，可能な限りデータを集めればよいだけです。

> （1）式×（2）式は求められ，信頼水準や標準誤差の許容限度を管理した上で，標本数を求めることができる。

そんなことする必要がないんです。

> 母集団が数十程度であれば，正規分布からではなくt分布から導いたサンプルサイズを求める式があるのかな

パワーアナリシスでは，ちゃんと t 分布と非心 t 分布を用いて計算していますよ。そもそも，母集団が数十などという状況は仮定しない。必要なサンプルサイズがいくつかを計算する。

> 森田他のテキストの「n≦30，またはn≦50ならばt分布」

今はコンピュータで正確な計算ができるので，n が大きいときは正規近似，小さいときは正確な方法等という使い分けはしません。常に正確な方法を使うだけです。

> nが数十の場合でも，こうした計算をしてもよいものなのでしょうか。

あなたがまだ，母集団にこだわるならコメントしませんが，パワーアナリシスでは n （私は他の人と同じく，n を母集団のサイズではなく，サンプルサイズの意味で使いますが）が大きかろうが小さかろうが，パワーを計算しますよ。パワーを固定すれば検出可能な差の大きさとか。

No.06424　Re: 小集団のサンプルサイズの求め方　　【相談者】　2008/04/25(Fri) 16:08

貴重なコメントありがとうございます。

やはり，入門書的な解説で天下り式に式を用いるだけでは，理解が難しいようです。パワーアナリシスについて勉強してみます。

最後に，サンプルサイズの決定という問題意識でパワーアナリシスを勉強する場合の，今後の道しるべとなるようなコメントをいただければ幸いです。

No.06425　Re: 小集団のサンプルサイズの求め方　　【青木繁伸】　2008/04/25(Fri) 23:16

新しい方法を説明している本を読むこと。
近似式や簡便法を説明しているものは捨てるべし。
最新の方法を採用している統計ソフトを使うべし。

No.06448　Re: 小集団のサンプルサイズの求め方　　【相談者】　2008/04/30(Wed) 13:10

青木先生。先日は親切に御指導いただきましてありがとうございます。

先日私は，どういうわけか「正規分布→無限母集団」という考えにとりつかれてしまい変な質問をしてしまいました。よく考えてみると「標本平均は正規分布する」ということだけを考えれば良いのであって，例え50人の集落にアンケート調査をする場合でも，そこからランダムに抽出された標本の平均値は正規分布すると考えれば良いのでした。

また，全数調査を実施しても全ての標本が得られないと標本調査と同じなどと言ってしまいましが，考えてみれば，100の集団に対しランダムに抽出して50の標本が回収できた場合と，全数調査して調査拒否によって50の標本しか回収できなかった場合では，標本平均の分布の性質が違ったものとなり，ランダムな場合は正規分布するが，調査拒否の場合の標本平均がどんな性質を持つかは一般には明らかではないのでした。

非標本誤差のことを理論的に述べるのは難しいので，とりあえず「対象とする集団が100程度の時は全数調査をする。標本が全数回収できない場合，その結果には非標本誤差のみが含まれ，標本誤差は含まれない。よって信頼水準や検出力などは考えられない」と考えることにします。

先生のアドバイスを基に，検出力の説明がある最近の本でも勉強してみました。

http://aoki2.si.gunma-u.ac.jp/lecture/SampleSize/pconf.html

の（2）式の意味がようやく分かりました（つもりです）。

先生にとっては訳のわからない質問だったと思いますが，おかげさまで，次のステップに進むことができました。どうもありがとうございました。今後ともよろしくお願い申し上げます。