No.12968 母集団における属性の出現割合の差について  【中島】 2010/07/04(Sun) 14:11

はじめまして。いつも参考にさせていただいています。
以下の件で質問させていただいてもよろしいでしょうか。

十分大きい母集団(要素数 N 個)から n 個の標本を非復元抽出しました。
個々の要素には a, b, c 3つの属性のうち何れか一属性が必ず与えられるとします。

母集団の中で属性a, b, cをもつ要素の割合を P(a), P(b), P(c) [P(a) + P(b) + P(c) = 1] とし,
標本集団の中で属性 a, b, c をもつ標本の度数を n(a), n(b), n(c) [n(a) + n(b) + n(c) = n] とします。

ここで,観測した n(a), n(b), n(c) の値から,帰無仮説 "P(a) = P(b)" を検定したいと思います。用いるべき検定及び,統計ソフトR 上で用いる関数名をご教示願えませんでしょうか。

No.12969 補足です  【中島】 2010/07/04(Sun) 14:19

"P(a) = P(b) = P(c)" ではなく,"P(a) = P(b)" の検定をしたく思います。

No.12973 Re: 母集団における属性の出現割合の差について  【青木繁伸】 2010/07/05(Mon) 04:26

例えば,[賛成],[反対],[無回答]というような場合に,「無回答」には関心がなく,[賛成]と[反対]が同 数であるかどうかを検定するような場合だと,単純に「[無回答]と答えたものを除いて,「賛成」と[反対]が同数」の検定を行うでしょう。[賛成]か[反 対]であっても,回答したくないから[無回答]になる場合もあり,本来[賛成]と[反対]では[無回答]になる可能性(確率)が違うとはいっても,その違 いは観察(説明)できないので,やはり[無回答]を除いて検定するしかないでしょう。

No.12975 早速のご回答有難うございます  【中島】 2010/07/05(Mon) 11:23

おっしゃるとおり,[無回答]--P(c)-- には関心がありません。
この場合,以下のような理解でよろしいでしょうか。

===================================================================
[無回答] は最初からカウントせず,標本集団を最初から

[賛成]: 頻度 n(a)
[反対]: 頻度 n(b)

のみに限定。

命題: "母集団の賛成率 P(a) が 反対率 P(b) を上回る" を検証したければ,

帰無仮説 "[賛成] = 50 %" を検定 --[母比率の検定]の片側検定-- する。

http://aoki2.si.gunma-u.ac.jp/lecture/Hiritu/bohiritu-test.html
の [3.正規分布に近似する方法] のご説明に従えば,統計量 Zo を求めるにあたり,
πo = 0.5, n = n(a) + n(b), p = n(a) / [n(a) + n(b)]
とすればよいのですね。
===================================================================

今朝PCを開くとすでにご回答をいただいていたので驚きました。
本当に頭が下がります。

No.12977 Re: 母集団における属性の出現割合の差について  【ひの】 2010/07/05(Mon) 14:44

>http://aoki2.si.gunma-u.ac.jp/lecture/Hiritu/bohiritu-test.html
>の [3.正規分布に近似する方法] のご説明に従えば,統計量 Zo を求めるにあたり,
>πo = 0.5, n = n(a) + n(b), p = n(a) / [n(a) + n(b)]
>とすればよいのですね。

 いや,このケースでは二項検定が最も適切で正確です。

No.12979 二項検定を用いることについて  【中島】 2010/07/05(Mon) 15:21

ひの様:
コメントをいただき有難うございます。
ひの様のおっしゃることの理解,以下のようでよろしいでしょうか。

================================================================
標本数が十分大きく母比率 p が小さくなければ,母比率pの二項分布は
正規分布で近似できる。とはいえ,今の時代 PC の計算速度が速い。
それゆえ,たとえ標本の数 n が多くとも
[3.正規分布に近似する方法] をあえて行うメリットはない。
ゆえに,二項検定が原理に忠実で適切かつ正確である。
================================================================

No.12981 Re: 母集団における属性の出現割合の差について  【ひの】 2010/07/05(Mon) 15:40

そういうことです。Rなら関数があるから簡単でしょう(私は使っていないので分かりませんが)。
母集団が有限なら二項検定も正確な方法とは言えませんけれど,母集団は十分に大きいということなので問題ないでしょう。

No.12986 Re: 母集団における属性の出現割合の差について  【中島】 2010/07/05(Mon) 17:14

ひの様:
おっしゃることがクリアーに分かりました。ありがとうございます。

No.12991 Re: 母集団における属性の出現割合の差について  【青木繁伸】 2010/07/06(Tue) 18:00

あ,関数は binom.test です(漸近検定は chisq.test で,二カテゴリーの場合の適合度の検定として)

No.12992 ありがとうございました。  【中島】 2010/07/06(Tue) 18:15

青木様・ひの様
Rスクリプトを作ってみたところ,大変上手くいきました。
このたびのご指導に深謝いたします。

● 「統計学関連なんでもあり」の過去ログ--- 043 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る