「統計学関連なんでもあり」の過去ログ--- 038

No.00330　t検定＆F検定　　【かわ】　2006/06/14(Wed) 15:31

こんにちは，t検定の結果の読み方で質問です

危険率5％を前提です。
A群と，B群にさがない事を言うのにt検定とF検定を使用しようと思っています
エクセルで簡単にやりたいのでこの検定が適当かと判断しました。

t検定の結果が，
5％以下だと，差が有る
5％～95％は，差が有るとはいえない，又は差がないともいえない
95％以上で，差が無いと思って良いのでしょうか？

又，F検定の結果では，
分散比が1だと，確率が0．5みたいなので
47．5％～52．5％が差がないと見ていいのでしょうか？

No.00331　Re: t検定＆F検定　　【青木繁伸】　06/06/14(Wed) 15:55

> t検定の結果が，
> 5％以下だと，差が有る
> 5％～95％は，差が有るとはいえない，又は差がないともいえない
> 95％以上で，差が無いと思って良いのでしょうか？

検定についての文書を読む必要があります。
用語の使い方も整理する必要があります。
http://aoki2.si.gunma-u.ac.jp/lecture/Kentei/kentei.html
を参照のこと。

有意確率（P値）が 0.05 以下のときに，帰無仮説を棄却する。差があるといえる。
そうでないときは，帰無仮説を採択する。差がないとはいえない。
それだけです。「差がない」という結論は出せません。
http://aoki2.si.gunma-u.ac.jp/lecture/Average/t-test.html
を参照のこと。

> 分散比が1だと，確率が0．5みたいなので
> 47．5％～52．5％が差がないと見ていいのでしょうか？

そういうことではありません。

F検定とは何をする検定をさしているのでしょうか？
Excel であるから，二群の等分散の検定でしょうか。
FTEST 関数と分析ツールの「F-検定: 2標本を使った分散の検定」にはご注意を。バグがありますからね。
バージョンとの関係があったり，一筋縄ではいきません。
http://aoki2.si.gunma-u.ac.jp/Hanasi/excel/index.html
を参照のこと。
例題をやってみてちゃんと正しい答えが出ているかどうか確かめましょう。
できれば，Excelを使わないのが吉。

使うとして，ちゃんと正しい答えが出るバージョンだとして。
これも同じく，
有意確率が 0.05 以下なら，帰無仮説を棄却。等分散ではない。
そうでないなら，帰無仮説を採択。等分散でないとはいえない。
http://aoki2.si.gunma-u.ac.jp/lecture/Average/bunsan1.html
を参照のこと。

(1,2,3,4,5) という5個の測定値と，(3,2,6,9,4)という5個の測定値があったとき，
分散が等しいかどうかの検定を行って，有意確率（P 値）が 0.301543147 でなければ，使った Excel はバグ持ちです。

以下の，R での結果を参照のこと
> var.test(c(1,2,3,4,5), c(3,2,6,9,4))
二群の等分散性の検定

データ:  c(1, 2, 3, 4, 5) と c(3, 2, 6, 9, 4) 
F = 0.3247, 第1自由度 = 4, 第2自由度 = 4, P値 = 0.3015
対立仮説: 分散比は，1ではない ←念のため。これは検定の結果を表明しているのではない
　　　　　　　　　　　　　　　　検定結果は P値 > 0.05 ゆえ，「等分散でないとはいえない」ということ
95 パーセント信頼区間:  0.03380440 3.11835386 
標本推定値: 
   分散比 
0.3246753 

No.00335　Re: t検定＆F検定　　【かわ】　06/06/14(Wed) 16:55

ざっくり読んでみたのですがやっぱり良く分かりません。
とりあえず，有意確率が0．95以上でも同じと言えるわけではないんですね？

同じであると言いたい場合はどうすればよいのでしょう？
t検定のいろいろなサイトを見てみましたが，対立仮説を差がないとしている場合しか見つけれませんでした。

ご教授願います。

「F-検定: 2標本を使った分散の検定」のP値は，0.150772でした，バグ持ちですね。バージョンは2000です。

No.00336　Re: t検定＆F検定　　【会社員】　06/06/14(Wed) 17:27

t検定でp＞0.05となり「差がない」という帰無仮説が棄却されなかった場合は，
「差がない」ということではなく「差があるとは言えない」ということだと思います．

積極的に同等性を示すためには90％信頼区間を求めたりするのではなかったでしょうか．
うろ覚えで申し訳ありません．

No.00337　Re: t検定＆F検定　　【R初心者】　06/06/14(Wed) 17:32

横レスです。

＞同じであると言いたい場合はどうすればよいのでしょう？

知ってる限りで言うと，「同じである」と言える統計解析手法はありません。
この辺りは確かに歯がゆいんですが，そう言った理由もあって，検定から情報量基準をベースとした「より良い」モデル選択に数理統計学はシフトして来ているのです。
有名どころではAIC(赤池情報量基準)があるんですが，如何せん「エクセルで簡単にやりたい」との事なんで，ちょっとこれはムリでしょうね。

この辺に興味があるんでしたら共立出版の「情報量統計学」

http://www.kyoritsu-pub.co.jp/

のp.117～p.122辺りに詳しい記述があります。

＞t検定のいろいろなサイトを見てみましたが，対立仮説を差がないとしている場合しか見つけれません

キチンと調べてみましたか?
それは対立仮説の方じゃなくって帰無仮説の方じゃないですか?

No.00338　Re: t検定＆F検定　　【R初心者】　06/06/14(Wed) 17:42

＞F-検定: 2標本を使った分散の検定」のP値は，0.150772でした

Microsoft Excelの場合は「両側F-検定」の出力が「片側F-検定」の出力になっています。
ですから出力結果を2倍にする事で暫定的な計算ミス回避が出来ます。

この場合のP値は2×0.150772で0.301544辺りでしょうね。
これで青木先生がRで計算してくれたP値とほぼ一致するでしょう。

詳しくは

http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc006/400.html

に記述があります。

No.00340　Re: t検定＆F検定　　【かわ】　06/06/14(Wed) 18:32

＞「同じである」と言える統計解析手法はありません。
そうですか。実は，仕事で会社の偉いさんが，何か変化点があった時に，品質に差がないか，t検定とF検定を使って示せと決めたのです。
よって，一社員の私は，同じであると言う為に，t検定とF検定を使うしかありません。

ちょっと弱いですが，有意確率（P値）が 0.05 以上で，差があるとは言えないので品質に変わりはありません。と結論づけるのが妥当でしょうか？

No.00341　Re: t検定＆F検定　　【R初心者】　06/06/14(Wed) 18:57

＞実は，仕事で会社の偉いさんが，何か変化点があった時に，品質に差がないか，t検定とF検定を使って示せと決めたのです。

なんかこう言う話が多いですね・・・・・・。
本当は青木先生に助言を求めるべきなのでしょうが・・・・。
多分その上司のお方自身があまり統計を理解していないんでしょうね。
よって検定結果の至極適当な解釈でも彼を誤魔化せるだろう，と言うのはそれこそ「統計的に有意」です(笑)。
しかし本当はこう言う誤解と言うか誤用が多いと言うのは憂うべきなんですが・・・・・・。

もし良心の呵責があるのでしたら，会社員氏が示唆なさっているように，「区間推定」に切り替えるように助言すべきだと思います。

No.00342　Re: t検定＆F検定　　【かわ】　06/06/14(Wed) 19:50

検定以外に本当に必要な評価はしてあるので，検定で明らかな差がない事がいえるだけでもいいような気がしてきました。

とりあえず区間推定の勉強ですね。

皆様，ありがとうございました。

No.00347　Re: t検定＆F検定　　【DISIR】　06/06/15(Thu) 01:07

同じというためには，これ以上差があったら差があるとする値が必要になります。例えば新製品と旧製品で10を超えたら差ありとするということです。これで判定基準ができるので，後は90なり95％なりの信頼区間がこれ超えるかどうかを見ます。有意水準というのはこれを超えたら，偶然だということを否定できないということです。t検定とF検定というのを言われたというのは，品質管理の方面で，旧製品の表示値の大きさとバラツキが安定してる際に，同じ精度であることを，F検定で確認したうえで，t検定を行い，差があるようであればどの位の差が生じているのか吟味しようという方法のことではないでしょうか。

No.00348　Re: t検定＆F検定　　【かわ】　06/06/15(Thu) 02:34

私の悩みは，同じであるを言いたい時，どうすればよいか？です。

DISIRさんの意見では，やはり，差があるを前提では無いでしょうか？

Aという設備で生産していて，その出来栄えが，ある平均値とバラツキを持っていて。それが，正しいとします。その後，Aと全く同じ仕様のBという設備を買い，Bで生産した結果を評価したい時，Aと同じ平均値とバラツキであり問題なしとしたいのです。

差がある or 差があるとはいえないで，検定するのではなく。
同じ or 同じとはいえないで，検定したいのです。

＞差があるようであればどの位の差が生じているのか吟味しよう
の場合は，前者のような気がします。どうでしょうか？

その点信頼区間は，Aの信頼区間にBが入っていれば，変わっていないと言っていいような気がします。

No.00349　Re: t検定＆F検定　　【Hiro】　06/06/15(Thu) 06:13

色々と論議されていますが，
やはり結論は，同じであるとは断言する事は出来ないでしょうね。

ただ，あくまでも参考であり，非常に荒っぽい事ですが，
そして，その使える場によりますが，n=10以上で25%の有意水準で検定しても対立仮説が有意にならない場合は，同じであろうと言っても良いかもしれません。

もう一つ
訳のわからない上司には，管理図を書いて（これも群分け，検討する特性値によりますが）見せるのが良いかも知れません。その時の管理限界は1σで書いて下さい。25%であれば1.15σ位なのですが，，，それで管理状態の判定が出来るのなら同じと言えるかもしれません。（絵に描くから判り易いでしょうし，どうせその上司は管理図も知らないでしょうから管理限界の値を3σから1σにしても判らないでしょう）

No.00366　Re: t検定＆F検定　　【韮澤】　06/06/16(Fri) 12:06

結論を統計学のみに求めるから，いけないのではないでしょうか?
おそらく，適切な答えのストーリーは，
(1) AとBでは，品質に差が出ない様，色々手を打っています。(製品を作る技術上・品質管理上の意味で)
(2) 統計分析した結果，「差があるとは言えない」との結果を得ています。
(3) だから，品質は同じです。(これは，会社としての判断ですね。)

No.00379　Re: t検定＆F検定　　【Hiro】　06/06/17(Sat) 01:50

ここの論議とは，離れてしまいますが，No.366に関して
私は，実務者の立場で次のように考えています。

統計手法は固有技術との融合が絶対条件と思っています。統計手法の数学的興味に関しては数学者，統計学者に任せておけば良いと思います。

そして，実務者は
1．固有技術の結果を裏付けるのに統計手法を用いてその論理をより確実に立証すること。
2．固有技術と統計手法の両面から，アクションすること，アクションさせる事が目的であって，それが具体的アクションにつながらない結果を導くのは，その解析，分析がまだまだ不完全であると言える。
3．そして，アクションするか否かの判断は，その為のコストなどから経営的観点から統計，固有技術から無関係の場で判断すればよい事である。

N0.366の番号とは対応していませんが，以上が私の考え方の基本です。
このページの統計数値とは離れた内容ですが悪しからず。