★ 母集団分布と標本集団分布の差 ★

8129. 母集団分布と標本集団分布の差 ぶるひる 2005/10/28 (金) 21:54
└8147. Re: 母集団分布と標本集団分布の差 cricket 2005/10/31 (月) 19:46
 └8152. Re^2: 母集団分布と標本集団分布の差 ぶるひる 2005/10/31 (月) 21:56
  └8156. Re^3: 母集団分布と標本集団分布の差 cricket 2005/11/01 (火) 12:46
   └8159. Re^4: 母集団分布と標本集団分布の差 ぶるひる 2005/11/01 (火) 19:32
    └8161. Re^5: 母集団分布と標本集団分布の差 青木繁伸 2005/11/01 (火) 19:58
     └8164. Re^6: 母集団分布と標本集団分布の差 ぶるひる 2005/11/01 (火) 22:03
      └8165. Re^7: 母集団分布と標本集団分布の差 青木繁伸 2005/11/02 (水) 09:08
       └8173. Re^8: 母集団分布と標本集団分布の差 ぶるひる 2005/11/02 (水) 19:12


8129. 母集団分布と標本集団分布の差 ぶるひる  2005/10/28 (金) 21:54
はじめまして。母集団分布と標本集団分布の差について質問させてください。
 正規分布する母集団 P(x) (= [1/(√(2π)σ)]・exp[-(x-m)^2/(2σ^2)])から無作為に抽出したn個の標本が,確率密度関数 PS(x)(もちろんサンプリングの度に変わる)のように分布したとします。このとき,例えば「何パーセントの確率で,ε1<|P(x)-PS (x)|<ε2」などと言えるものでしょうか

     [このページのトップへ]


8147. Re: 母集団分布と標本集団分布の差 cricket  2005/10/31 (月) 19:46
>確率密度関数 PS(x)(もちろんサンプリングの度に変わる)のように分布したとします。

意味がわかりません。

     [このページのトップへ]


8152. Re^2: 母集団分布と標本集団分布の差 ぶるひる  2005/10/31 (月) 21:56
> >確率密度関数 PS(x)(もちろんサンプリングの度に変わる)のように分布したとします。
>
> 意味がわかりません。

失礼しました。「確率密度関数」は間違いです。抽出した標本が,確率変数xについて,度数分布f(x)のように分布したとして,∫f(x)dx=1になるよう規格化したときのf(x)を「確率密度関数」と呼んでしまったのでした(このf(x)が,先のPS(x)です)

     [このページのトップへ]


8156. Re^3: 母集団分布と標本集団分布の差 cricket  2005/11/01 (火) 12:46
文字通り解釈するなら,シミュレーションするのが手っ取り早そうですね。本当に質問内容は正しいですか?

標本分布の平均値や標準偏差が母集団に比べてどんな関係にあるかなら,教科書を読めば載っていますよ。

     [このページのトップへ]


8159. Re^4: 母集団分布と標本集団分布の差 ぶるひる  2005/11/01 (火) 19:32
イメージが漠然としたままで質問してしまいましたので,問い方が悪かったかもしれません。
 「母集団が正規分布f(x)するとする。これからN個の標本を抽出したとき,x=xiである標本数がniだったとして,f(xi)の○○パーセント信頼区間はどうなるか?」のように質問するべきでした。
 ところで今日,集団遺伝学のノートを見ていたところ,「N個の遺伝子を調べ,そのうち,目的とする対立遺伝子数がniだったとき,この対立遺伝子の頻度(期待値はni/N)の95パーセント信頼区間の上限は,
 [(χ+2ni)+√(χ[χ+4ni*(N-ni)/N])]/(2N+2χ) 
 ただし,χ:自由度1,確率0.05のカイ二乗値(=3.841)」という記述を見つけ,これが私の知りたかったことの半分(上限だけなので)だと思いました。
 この記述のオリジナルを今探しているところです。どうもありがとうございました。

     [このページのトップへ]


8161. Re^5: 母集団分布と標本集団分布の差 青木繁伸  2005/11/01 (火) 19:58
>  「母集団が正規分布f(x)するとする。これからN個の標本を抽出したとき,x=xiである標本数がniだったとして,f(xi)の○○パーセント信頼区間はどうなるか?」のように質問するべきでした。

正規母集団からの標本が x=xi を採るような標本は理論的には 0 ですよねぇ。少なくとも N 個(たとえば100個)中,ni(たとえば十数個)もあるわけはない。

>  ところで今日,集団遺伝学のノートを見ていたところ,「N個の遺伝子を調べ,そのうち,目的とする対立遺伝子数がniだったとき,この対立遺伝子の頻度(期待値はni/N)の95パーセント信頼区間の上限は,
>  [(χ+2ni)+√(χ[χ+4ni*(N-ni)/N])]/(2N+2χ) 
>  ただし,χ:自由度1,確率0.05のカイ二乗値(=3.841)」という記述を見つけ,これが私の知りたかったことの半分(上限だけなので)だと思いました。

最初からそう聞けばよかったのです。
変な用語の使い方をすると,訳が分からなくなります。
この理論が仮定している母集団は正規分布ではありませんし。

頻度の信頼限界は(当然,上下),多くの統計学の教科書に書かれています。
http://aoki2.si.gunma-u.ac.jp/lecture/Hiritu/bohiritu-conf.html
などを見ても良いでしょう。
なお,頻度の信頼限界は,カイ二乗分布(や正規分布)を用いる近似法ではなく,二項分布(F分布,ベータ分布に帰着)に基づく方法を使う方がいいです。

     [このページのトップへ]


8164. Re^6: 母集団分布と標本集団分布の差 ぶるひる  2005/11/01 (火) 22:03
青木先生,ご返答ありがとうございます。

> 正規母集団からの標本が x=xi を採るような標本は理論的には 0 ですよねぇ。少なくとも N 個(たとえば100個)中,ni(たとえば十数個)もあるわけはない。

おっしゃるとおりです。数々の不適当な表現の意を汲んでいただきありがとうござます。 (^_^;)

> この理論が仮定している母集団は正規分布ではありませんし。

これもおっしゃるとおりです。質問の中の正規分布は不要な前提した。

> なお,頻度の信頼限界は,カイ二乗分布(や正規分布)を用いる近似法ではなく,二項分布(F分布,ベータ分布に帰着)に基づく方法を使う方がいいです。

それはなぜでしょうか?

     [このページのトップへ]


8165. Re^7: 母集団分布と標本集団分布の差 青木繁伸  2005/11/02 (水) 09:08
> なお,頻度の信頼限界は,カイ二乗分布(や正規分布)を用いる近似法ではなく,二項分布(F分布,ベータ分布に帰着)に基づく方法を使う方がいいです。
>
> それはなぜでしょうか?

先に示したページを読めば分かるでしょうが,それが「正確な方法」だからです。

     [このページのトップへ]


8173. Re^8: 母集団分布と標本集団分布の差 ぶるひる  2005/11/02 (水) 19:12
特に標本数が小さい場合は,正規分布に従わなくなるから,ということでしょうか。
どうもありがとうございました。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 035 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る