No.13191 検定の棄却域について  【初心者】 2010/07/30(Fri) 19:59

初歩的な疑問です。
よく以下のような説明を見かけます。

『(例)コインを20回投げたときに14回表が出た。コインに歪みがないといえるか。

20回のコイン投げで表の出た回数をXとすると,Xは二項分布Bi(20,p)に従う。
歪みがないということは,p=1/2であるということである。
→仮説をp=1/2とする。
→仮説が正しいなら,P(X>=14)=0.0577であり,14回以上表がでる確率は0.0577となる。
→両側検定で有意水準を5%とすると,P(X>=14) > 0.025 となる。
→p=1/2という仮説は棄却されない』

ここで疑問なのはなぜ14回表が出たとあるのにP(X=14)ではなくP(X>=14)と不等号で確率を考える必要があるのかがわかりません。

No.13192 Re: 検定の棄却域について  【青木繁伸】 2010/07/30(Fri) 21:57

母比率が 0.5 なら,図の青で示したような部分はよく起こることでしょう。対して,赤い部分はあまり起こらないでしょう。14回だけ表が出るというのだけではなく,14回以上表が出るということですよね。


No.13193 Re: 検定の棄却域について  【初心者】 2010/07/30(Fri) 23:22

早速のお返事ありがとうございます。
ただ,その説明では正直納得することができませんでした。

たしかに青い部分に比べて赤い部分はあまり起こらないことは理解できます。
しかし,X=14の確率は小さいことも言えるわけですから,なぜこのことをもって棄却してはいけないのでしょうか?

そもそも「14回表が出た」という事象しか生起していないのに,「14回表が出る確率」ではなく,「14回以上表が出る確率」に話をすり替えていることに違和感を感じます。

No.13195 Re: 検定の棄却域について  【青木繁伸】 2010/07/31(Sat) 00:19

> しかし,X=14の確率は小さいことも言えるわけですから,なぜこのことをもって棄却してはいけないのでしょうか?

では,こういう事を考えてみてください。

コインを2000回投げました。1000回表が出ました。1000回表が出る確率は dbinom(1000, 2000, p=0.5) = 0.01783901 です。0.01783901 < 0.025 だから,帰無仮説を棄却してよいですか?

> 話をすり替えていることに違和感を感じます

話をすり替えているわけでもないし,違和感を感じるのは個人の自由ですから,どうしようもないですね。

No.13196 Re: 検定の棄却域について  【初心者】 2010/07/31(Sat) 13:14

再度のご回答ありがとうございます。

検定の理論は一応,一通りは知ってはいます。ただ,初心者が抱くような素朴な疑問を突き詰めて考ればどうなるか,を私も知りたいと思って質問した次第です。

不愉快な気分にさせていたのでしたらお詫び致します。

>コインを2000回投げました。1000回表が出ました。1000回表が出る確率は dbinom(1000, 2000, p=0.5) = 0.01783901 です。0.01783901 < 0.025 だから,帰無仮説を棄却してよいですか?

試行回数を無限大にすれば連続分布に近づき,1つの値をとる確率は0になるためにこういう矛盾が生じることは理解できます。

ではこう考えればどうでしょうか。

『有意水準を試行回数に依存して設定すればよい。有意水準を20回のときは0.05,
2000回のときは0.0005(数値は適当です)と設定すれば1000回表が出た場合に棄却されない,と。』

No.13197 Re: 検定の棄却域について  【青木繁伸】 2010/07/31(Sat) 14:31

> 試行回数を無限大にすれば連続分布に近づき,1つの値をとる確率は0になるために

試行回数 2000 は有限で,1000 回表が出る確率は 0 ではないですし。

> 有意水準を試行回数に依存して設定すればよい

試行回数が10回のときはいくつ?11回のときはいくつ?12回のときは?…999回のときは?
どうやって設定するかの基準はどうするのでしょう?母比率の検定のときと独立2標本の平均値の差の検定の場合は当然設定値は別なんでしょうね?一元配置分散分析の場合もまた別?

No.13198 Re: 検定の棄却域について  【知ったかぶり】 2010/08/01(Sun) 09:16

帰無仮説のもとで,期待値を中心として確率の総和が「1-有意水準」となる事象の集合Aを考えます.実際に観察された事象が,集合Aに含まれていた場合,帰無仮説を採択します.これが検定という手続きです.

>なぜ14回表が出たとあるのにP(X=14)ではなくP(X>=14)と不等号で確率を考える必要があるのか

これは上記のことを反対側から見ただけです.すなわち,観察された事象よりも期待値から遠い事象の集合における確率の総和が,有意水準を越えていた場合は,観察された事象は集合Aに含まれる,ということです.

No.13199 Re: 検定の棄却域について  【初心者】 2010/08/01(Sun) 21:08

>知ったかぶり 様
ご説明ありがとうございます。

>これは上記のことを反対側から見ただけです.すなわち,観察された事象よりも期待値から遠い事象の集合における確率の総和が,有意水準を越えていた場合は,観察された事象は集合Aに含まれる,ということです.

この言葉どおりに考えるならば,「観察された事象よりも期待値から遠い事象の集合における確率の総和」ということからP(X>=14)ではなく,P(X>14)と等号を含めないのが正しいとなりませんでしょうか?

● 「統計学関連なんでもあり」の過去ログ--- 043 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る