No.02548 F検定について  【えり】 2007/01/31(Wed) 14:06

エクセルでF検定(危険率5%)を行った際に得られた結果に
疑問点があったので教えていただきたいのですが,

      ?         ?
平均     165.4667    150.2667
分散     1592.8133    46.9733
観測数     3.0000     3.0000
自由度     2.0000      2.0000
観測された分散比 33.9089
P(F<=f) 両側   0.0573
F 境界値 両側  19.0000

この様な結果が得られた場合,
F値>F 境界値
P値>0.05
となり,
F値>F 境界値では帰無仮説が棄却されるのに対し
P値>0.05では,帰無仮説が棄却されません。

その場合,分散は等しいと判断するのでしょうか?
それとも等しくないと判断するのでしょうか?
初歩的な質問で申し訳ございませんが教えていただければ
幸いです。宜しくお願い致します。


No.02552 Re: F検定について  【takahashi】 2007/01/31(Wed) 16:16

手元のExcelでは片側でしか出てこないんですが,
お示しになった結果は変ですね。

F(2,2)=33.9089であれば,両側では確かに0.0573となります。
F境界値両側というのは意味不明で,おそらく正しくは下限0.026,上限39でしょう。

従って,分散は(両側検定で)等しい(異なるとは言えない)ということになります。
ちなみに,19というのは5%水準で片側で検定したときに上側の境界値です。

ただ,仮想のデータだとは思いますが,サンプルサイズが3ずつでのF検定にどれ程意味があるのかは良くわかりません。

No.02554 Re: F検定について  【にゃんちゅう】 2007/01/31(Wed) 18:21

>サンプルサイズが3ずつでのF検定
であるなら,自由度が違ってきます。=FINV(0.05,1,4)=7.708647421
です。
この計算はちゃんと分析ツールを使った物なのでしょうか?

No.02555 Re: F検定について  【takahashi】 2007/01/31(Wed) 18:47

分散分析ではなくF検定ですので,自由度は合っていると思いますよ。

No.02556 Re: F検定について  【青木繁伸】 2007/01/31(Wed) 18:58

Excel のバグが絡んでいるので,非常にわかりにくくなっています。
この件については,
http://aoki2.si.gunma-u.ac.jp/Hanasi/excel/index.html
の,ftest 関数,分析ツールの F検定 に関する項を見ておいてください。
バグは,バージョンによるほか,あるバージョンではftest は直っているが分析ツールの方は直っていないなど,フォローし切れません。

No.2548 については,「両側」と書いてあるのは,等分散性の検定においては意味的に両側(つまり,一方の分散が大きいときも小さいときもあるという意味で)です が,F分布の棄却領域という意味では片側です。つまり,自由度が(2,2)のF分布で,観察された分散比である 33.9089 より大きな値を取る確率は表示されている確率の半分つまり =FDIST(33.9089,2,2) = 0.02864599 です。これは第一群の分散が第二群の分散より大きい方向での確率。反対に,第一群の分散が小さい方向での確率は = 1-FDIST(1/33.9089,2,2) = 0.02864599 です。両方合わせて,分散が等しくはないという対立仮説における有意確率が表示されている 0.0573 ということです。
ですから,これは Excel の記述はちょっとへんかもしれないけど(変でないとも言えるが)正しいということです。
所与の平均値と分散を持つデータを生成することができますが,それによって生成されたデータを R で検定すると以下のようになります(Excel と同じですね)。
> var.test(g1, g2)
二群の等分散性の検定
データ: g1 と g2
F = 33.9089, 第1自由度 = 2, 第2自由度 = 2, P値 = 0.05729
さ て,F境界値 両側というのも誤解を招きやすい書き方で,これは自由度(2,2) で F 値が19より大きい値を取る確率が 0.05 である数値です。ですから,上の考え方とは矛盾していて,等分散性の検定を両側検定として行うときの限界値は takahasi さんのいうとおり,=FINV(0.975,2,2) = 0.026 と =FINV(0.025, 2, 2) = 39 です。そして,F値としては1より大きい方を取るという考え方に従うなら,限界値は 39 の方を表示すべきです。
そもそも,P値を出すのなら,限界値などを表示する必要はないのですが,そこが恐ろしいところです。要するに,何にも考えないでプログラムを書いている。

ちんたら書いているうちに にゃんちゅう さんからもコメントが入りましたが,にゃんちゅう さんは,二群のデータに対して一元配置分散分析を適用したときの F 値の限界値を述べられたのではないかと思いますがどうでしょう。

そもそも,そのような誤解を生むのも,「F検定」などという呼び方をするからです。
F 分布を使う検定を全て「F検定」と呼ぶのはやめましょう。
2群の等分散性の検定,一元配置分散分析,,,などなど,何をやっている検定かわかる呼び方をしたいとおもいます。

No.02559 Re: F検定について  【青木繁伸】 2007/01/31(Wed) 19:36

念のために私の Excel で確認してみましたけど,両側のところに書かれている数値は以前の(バグのあったときの)ままでした。
えり さんの Excel のバージョンは?Windows 版と Macintosh 版でも違うかも知れないけど。

fig


No.02560 Re: F検定について  【えり】 2007/01/31(Wed) 19:40

みなさん,親身にご相談にのっていただき本当にありがとうございました。
統計に関しては勉強不足で,みなさんから回答が非常に勉強になりました!

青木先生からご指摘いただいた,Excelのバグに関しては事前に参考にさせていただき,
「P(F<=f) 両側」の値を私の方で2倍にして「0.0573」という数値を入れた状態で今回
ご相談させていただきましたが,Excelによる統計には,私のような素人には落とし穴が
たくさんあるようなので気をつけなくては!と思いました。

非常に解りやすいご説明をいただきありがとうございました。
また不明な点等ありましたらそのときは何卒宜しくお願いいたします。

No.02561 Re: F検定について  【えり】 2007/01/31(Wed) 19:46

>青木先生
私の使用しているエクセルは2000なので,青木先生がお示しになった表,
そのものが私のエクセルに出ていました。
ただ,事前に青木先生からご指摘いただいた「エクセルのバグ」を参考に
していたため,私の方でP値を2倍にしてしまいました。

かえって質問の内容が不明確になってしまい,申し訳ございませんm(__)m

No.02562 Re: F検定について  【ランタロウ】 2007/01/31(Wed) 20:06

結局のところ,この検定結果から2グループの分散は等しいの?等しくないの?

No.02563 Re: F検定について  【青木繁伸】 2007/01/31(Wed) 20:14

F = 33.9089, 第1自由度 = 2, 第2自由度 = 2, P値 = 0.05729

ゆえ,「両群の分散は等しい」という帰無仮説は採択され,「両群の分散は等しくないとは言えない」というのが結論です。

● 「統計学関連なんでもあり」の過去ログ--- 040 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る