No.04945 t検定とF検定について教えていただきたいことがあります。  【さくら】 2007/12/06(Thu) 17:42

はじめまして,さくらと申します。
統計は少しだけ習いましたが,初心者同然のものです。
t検定とF検定について教えていただきたいことがありまして,投稿させていただきました。
統計を行いたいのは,実験群10名と統制群9名といったような,対象の数が異なるt検定です。
実験群と統制群に別れているため,対応のないt検定を行おうと思い,まず最初にExcelでF検定(FTEST)を行ったところ,値が0.008616になりました。
こ こで疑問に思ったのが,この結果で,ExcelのFTESTはp値が出ると思うのですが,p<0.05となり,非等分散が成り立つと決めてしまって よいのでしょうか?帰無仮説は2群の差は等しくないということだと思うのですが,間違っていたらご指摘をお願いします。
以上が成り立つと仮定して,分散が等しくないと仮定した対応のないt検定を行いました。
ExcelでTTESTを行ったところ,0.03227819と出ました。
その後,excelの分析ツールでやったところ,違うp値が出ました。
この場合,たぶんTTESTの方のp値を採択すればよいと思うのですが,間違いでしょうか?先生方の書かれていたAspin-Welchのt検定を行いきちんとしたt値を出したいと思ったのですが,その場合は,どのように計算すればよいのかが分かりませんでした。
もうひとつt検定でp<0.05,t値がt分布表の値より大きかったとき,有意差ありとすればよいのでしょうか?
長文乱文申し訳ありません。お答えいただけると大変助かります。
これからもお体にお気をつけてがんばってください。
それでは失礼いたします。

No.04946 すみません!  【さくら】 2007/12/06(Thu) 17:48

投稿タイトルが切れていました。申し訳ありません。
t検定とF検定について教えていただきたいことがあります。
というのがタイトルです。すみませんでした。
また質問させていただくときは短文にするように気をつけます。

No.04948 Re: t検定とF検定について教えていただきたいことがあります。  【波音】 2007/12/06(Thu) 18:04

> ここで疑問に思ったのが,この結果で,ExcelのFTESTはp値が出ると思うのですが,p<0.05となり,非等分散が成り立つと決めてしまってよいのでしょうか?

2群の等分散性の検定の帰無仮説は「2群の母分散は等しい」というものですから,求めたp値が0.05よりも小さいのなら,仮説は棄却されるということです。すなわち,「2群の母分散は等しくない」といえるということです。

http://aoki2.si.gunma-u.ac.jp/lecture/Average/bunsan1.html

> たぶんTTESTの方のp値を採択すればよいと思うのですが,間違いでしょうか?

私はExcelのTTEST()という関数を使ったことがないので,これがどういう値を返してくれるのか分かりませんが,分析ツールの「分散が等しくないと仮定した2標本による検定」がウェルチの検定にあたるものです。
> X1 <- c(78, 70, 66, 76, 78, 76, 88, 76)
> X2 <- c(76, 72, 60, 72, 70, 72, 84, 70)
> t.test(X1, X2, var.equal = FALSE)

Welch Two Sample t-test

data: X1 and X2
t = 1.222, df = 13.978, p-value = 0.2419
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-3.021516 11.021516
sample estimates:
mean of x mean of y
76 72
これと同じデータでExcelの「分散が等しくないと仮定した2標本による検定」をやってみると同じであることが確認できます。

> もうひとつt検定でp<0.05,t値がt分布表の値より大きかったとき,有意差ありとすればよいのでしょうか?

簡単にいってしまえば,求めたp値が0.05よりも小さければ帰無仮説を棄却,求めたt値が表の値よりも大きければ帰無仮説を棄却,ということです。この辺りのことは参考書できちんと確認した方が安全だと思いますよ。

また,こちらのページも参考にされるとよろしいと思います。

http://aoki2.si.gunma-u.ac.jp/lecture/BF/index.html

No.04949 Re: t検定とF検定について教えていただきたいことがあります。  【青木繁伸】 2007/12/06(Thu) 18:44

等分散を仮定しない平均値の差の検定(いわゆるt検定)をExcelでやるときはご注意。
TTEST関数と分析ツールが出すP値,正しいのはTTEST関数が出すP値。
以下を参照のこと。
http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc019/098.html

ただし,TTEST関数は,P値しか出さないのがけちくさい。
Excelは使わないのが吉。

No.04950 Re: t検定とF検定について教えていただきたいことがあります。  【青木繁伸】 2007/12/06(Thu) 19:10

4948 波音さん
フォローありがとうございます

> これと同じデータでExcelの「分散が等しくないと仮定した2標本による検定」をやってみると同じであることが確認できます。

ですが,Excelの馬鹿野郎は,4949に書いたように,インチキな答えを出しております。
自由度が14と書かれているのが,だめさ加減を表しております。
分析ツールで等分散を仮定した場合と仮定していない場合の検定を横に並べて表示して比較すると,愕然とします(^_^;)

図はクリックすると原寸に拡大表示できます


No.04953 Re: t検定とF検定について教えていただきたいことがあります。  【波音】 2007/12/06(Thu) 22:23

> 自由度が14と書かれているのが,だめさ加減を表しております。

実は統計学を始めてから,(たぶん)今回初めて分析ツールでt検定をしてみたのですが,これはほんとにヒドイですね。(なぜ投稿した際に気づかなかったのか・・・?)

私は運よく,統計学を始めて間も無く青木先生のwebサイトにたどり着いて「Excelはひどいというお話」(http://aoki2.si.gunma-u.ac.jp/Hanasi/excel/)を見ていたので,最初からExcelには目もくれずRを使っていましたが,いざこうして犯行現場を目撃すると実感として「やはりExcelはやめておこう」となりました。

Excel,,,使わなくて良かった!!という感じですね。

No.04958 Re: t検定とF検定について教えていただきたいことがあります。  【さくら】 2007/12/07(Fri) 12:49

>波音様
はじめまして,お返事遅くなってしまい申し訳ありません。
お返事ありがとうございます。
F検定での帰無仮説まったく間違っていましたね(^^;)
まったく逆でした。言ってることちぐはぐでしたね,すみません。
とりあえず,FTESTではp<0.05となった場合に帰無仮説は棄却できて,
「分散が等しくない」ということになる。ということで,いいでしょうか?
t検定では,p<0.05であればいいのですね。とりあえずTTESTを信じてみようと思います。
ありがとうございました。
>青木先生
はじめまして,お返事ありがとうございます。遅くなってしまい申し訳ありません。
とりあえずあまりExcelは信用しないことにします。
TTESTの値を信じればいいのですね。ありがとうございます。
分析ツールでやるとどうしても自由度が合わないので,困っています。
実験群8と統制群7の場合,自由度は13になると思うのですが,なぜか,
7と出てきてしまいます。何が原因なのか良く分かりません。
とりあえずTTESTを信じようと思います。
ありがとうございました。
それでは失礼します。

No.04959 Re: t検定とF検定について教えていただきたいことがあります。  【青木繁伸】 2007/12/07(Fri) 13:14

> 実験群8と統制群7の場合,自由度は13になると思うのですが,なぜか,7と出てきてしまいます

分析ツールは信じない」ということなら当面はよいとして,なぜ違う値になるのか,差し支えなければ,データを掲示していただければチェックできます。

No.04961 Re: t検定とF検定について教えていただきたいことがあります。  【さくら】 2007/12/07(Fri) 20:41

何度も申し訳ありません。
波音様,丁寧なご指摘ありがとう御座いました。
せっかくお返事いただいたのに,失礼な振る舞いですみません。
今回返信を遅らせていただいたのは,とりあえず,
なぜ自由度が7になるのか原因を解明していただけたらと思い,
表の一部を掲示させていただきます。
S1	31	114
S2 36 61
S3 27 35
S4 39 90
S5 61 138
S6 35 45
S7 43 152
S8 69
このように,実験群8と統制群7の2群が独立した対応なしのt検定です。
なぜか分析ツールを使うと自由度が7になります。
分析ツールも使うのが初心者ですので,よく理解していないのが現状です。
下記に結果を載せます。
t-検定 : 分散が等しくないと仮定した2標本による検定	
変数 1 変数 2
平均 42.625 90.71428571
分散 218.2678571 2101.904762
観測数 8 7
仮説平均との差異 0
自由度 7
t -2.657087266
P(T<=t) 片側 0.016302309
t 境界値 片側 1.894578604
P(T<=t) 両側 0.032604618
t 境界値 両側 2.364624251
なぜこの自由度が7になってしまうのかがよく分かりません。
ご教示いただけるとありがたいです。
何度も何度も本当に申し訳ありません。
それでは失礼致します。

No.04962 Re: t検定とF検定について教えていただきたいことがあります。  【青木繁伸】 2007/12/07(Fri) 21:46

ですから,分析ツールの等分散を仮定しないt検定は信じないと宣言したばかりじゃないですか(^_^;)
http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc019/098.html
見ませんでしたか?4950にも書いてますよ。
分析ツールの分散が等しくないときのt検定は,本来小数つきの自由度を整数に丸めて,それでp値を出すものだから,いい加減な値になると。混乱のもとだから,えくせるは使うのやめた方が良いですよ。
それに,「実験群8と統制群7の場合,自由度は13になると思うのですが」というのは,等分散を仮定するときのt検定における自由度の計算法(n1+n2-2)でしょう?二重に間違えていますよね。等分散を仮定しないときの自由度の計算式は見たことがないのでしょうか?
http://aoki2.si.gunma-u.ac.jp/lecture/Average/t-test.html
にある式ですが(この記事の終わりに添付しておきますが)
> x
[1] 31 36 27 39 61 35 43 69
> y
[1] 114 61 35 90 138 45 152
> t.test(x, y)

Welch Two Sample t-test

data: x and y
t = -2.6571, df = 7.09, p-value = 0.03223
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-90.77589 -5.40268
sample estimates:
mean of x mean of y
42.62500 90.71429
で,自由度はたまたま7に近い値ですが,7という整数値ではありません。df = 7.09 です。

R が有料の統計ソフトならまだしも,*無*料*なんですから,*腐*れ*え*く*せ*る*なんか捨てて,R信者になるというのは,そう悪い選択ではないと思いますが?


No.04966 Re: t検定とF検定について教えていただきたいことがあります。  【さくら】 2007/12/08(Sat) 15:12

こんにちは,青木先生お返事ありがとう御座います。
本当に申し訳ありません。
分析ツールのデータを信じないと書いた後,もしかしたらなにかデータの中に問題があるのかと思い,データを載せさせていただいたしだいです。
丁寧なご指摘本当にありがとう御座います。
自由度の求め方の件も,きちんと確認させていただきました。
少し複雑ですが,頑張ってみようと思います。
ちょうどこの検定を行なう前に,ある先生から,青木先生がおっしゃった,等分散を仮定した自由度を求める式<(n1-1)+(n2-1)又は(n1+n2-2)>で,非等分散を仮定したときの自由度を求めると教わったので,そのやり方だと思い込んでおりました。
違っていたのですね,申し訳ありません。
Excelは役に立たないことは充分心得たのですが,なにぶんExcelでやれという指令が出ているので,Excelでやるしかないようです(^^;)
最初にこれを言っておかなければいけませんでしたね。
すみません。
それでもやはりRの導入は考えております。
基本は指令どおりExcelでやるしかないと思いますが,Excelと比較させるという意味でも,役立つのではないかと思いますので。
Rについて調べさせていただいたところ,インストールの環境にも対応しているので大丈夫でした。
Excelだとわけが分からなくなってきてしまったので,Rできちんとした値を調べて,比較することにしました。
なにぶん学生(私)の書くレポートなので,計算過程を載せろとまでは言われていないので,比較し,間違っていないと判断した結果を載せるだけで大丈夫だと思います。とりあえずTTEST,FTEST(一応)とRをやりながら頑張りたいと思います。
何から何まで,本当に申し訳ありませんでした。
もしかしたらまた悩んだら書き込みさせていただくかもしれません。
その時もご教示いただけるとありがたいです。
ご迷惑をお掛けして申し訳ありません。
波音様も本当にありがとう御座いました。
それでは,失礼致します。

No.04977 Re: t検定とF検定について教えていただきたいことがあります。  【青木繁伸】 2007/12/08(Sat) 19:45

> Excelでやれという指令が出ているので

ご愁傷様です。

ひょっとして,その指令を出したのは,ゲイツ先生?

● 「統計学関連なんでもあり」の過去ログ--- 041 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る