No.02628 有限母集団における区間推定の信頼確率について  【さんちゃん】 2007/02/07(Wed) 00:20

教えてください。無限母集団から標本を無作為抽出して母平均を区間推定するとき,母集団が正規分布していない場合でも,標 本規模を50以上とれば標本平均が正規分布に近づくので区間推定できると認識しているのですが,母集団が有限母集団で,標本規模に近い(例えば母集団 103に対して標本規模100のような)場合も,標本平均は正規分布に近づき,95%などの区間推定が可能なのでしょうか。といいますのも,信頼区間と母 平均の関係を様々な条件で検証的にいろいろシミュレーションしたい(勉強等のため)場合に,上のような母平均が既知の母集団(103のデータからなる)を 人工的に作っておいて,ExcelのVBAで標本規模100の標本を抽出するとき,全ての標本(103個から100個取る組合せ)で信頼区間を計算させ, その区間に母平均が入る回数をカウントさせることが短時間でできるため便利だと考えたのですが,このような母集団のデータ数が標本規模にあまり近いケース では標本平均が正規分布に近づかないとなると無意味だなと思いまして… ただ,実際にこれをExcelのVBAで計算してみると,95%信頼区間にはほぼ 95%くらいの確率で母平均が入ってくれるのでいいのかなとも思うのですが,理論的には母集団が標本規模に近すぎるとだめなのでしょうか?よろしくお願い します。

No.02630 Re: 有限母集団における区間推定の信頼確率について  【青木繁伸】 2007/02/07(Wed) 10:46

標本平均が正規分布に近づいていくのは,サンプルサイズにだけ依存しますよね。母集団のサイズには依存しません。

母平均の区間推定の式として,無限母集団のものを使うのが妥当かどうかは,疑問ですが。
たとえ使ったとして,103から100を抽出するという標本調査では,その区間推定は必ず(100%)母平均を含むかも知れませんね。
母分布が一様分布の場合で,抽出ではなく 103C100 の全ての組み合わせでやってみると
> t0 <- qt(0.025, 99, lower.tail=FALSE)
> t0 <- c(-t0, t0)
> set.seed(12345) # 追試で同じ乱数系列を出すために
> x <- runif(103) # ここを rnorm 等にしても,同じ結果になる
> mu <- mean(x) # 母平均
> m <- combn(103, 3) # 103 から 3 を取り出す組み合わせ
> res <- apply(m, 2, function(i) { z <- x[-i]; mean(z)+t0*sqrt(var(z)/100)})
> sum(apply(res, 2, function(r) return(r[1]>mu || r[2]<mu)))
[1] 0 # 母平均を含まない場合の数

No.02644 Re: 有限母集団における区間推定の信頼確率について  【さんちゃん】 2007/02/07(Wed) 22:47

ご教授,ありがとうございます。
やはり,母集団には依存しないのですね。
有限母集団の修正係数は,
(N-n)/N ただし,N:母集団のデータ数,n:標本サイズ(規模)
と いうことらしいので,先生のRのコードにこの修正係数で補正してやってみたら以下のようになり,母平均を含まない場合の割合は, 8022/176851*100=4.536%になりました。まあ,ほぼ95%の信頼区間が確認できたと思います。これで,大きな母集団について検証した いとき,このN:103,n:100の母集団と標本で簡単に実験できます!

> t0 <- qt(0.025, 99, lower.tail=FALSE)
> t0 <- c(-t0, t0)
> set.seed(12345)
> x <- runif(103)
> mu <- mean(x)
> m <- combn(103, 3)
> res <- apply(m, 2, function(i) { z <- x[-i]; mean(z)+t0*sqrt((103-100)/103*var(z)/100)})
> sum(apply(res, 2, function(r) return(r[1]>mu || r[2]<mu)))
[1] 8022 # 母平均を含まない場合の数

Rは,さすがですね。計算も速いですし。

● 「統計学関連なんでもあり」の過去ログ--- 040 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る