「統計学関連なんでもあり」の過去ログ--- 039

No.00753　二項検定の記述について　　【山田】　2006/07/28(Fri) 14:31

こんにちは。度々で申し訳ないのですが，教育関係なので，あまり統計に詳しくなく二項検定を使った研究がなかなか見当たらないのでお尋ねします。二項検定で有意差が出たのですが，
1　論文の記述にはp＜0.05とだけ記せばいいのでしょうか。t検定のように検定統計量は示さなくて良いのでしょうか。もし，必要なら，何をどのように記述すればよろしいのでしょうか。
2もし，記述の必要があれば，エクセルで検定をしましたのですがP値は載っているのですが，検定統計量らしきものは乗っていません。求める方法があれば教えていただきたいのですが。
何卒，宜しくお願いいたします。

No.00754　Re: 二項検定の記述について　　【青木繁伸】　2006/07/28(Fri) 15:58

二項検定と言うことは，母比率の検定ということですね？
どのようなデータに対して行ったのでしょうか。そのときの母比率は？

例えば，ある10円玉が裏表等しく出るということを実験し，検定したときのことを考えると，

10回投げて3回表が出た。というときの3回がまさに検定統計量ですね。
検定は，「10円玉を10回投げると3回表が出た。裏も表も半々に出る（表が出る確率が 0.5）という帰無仮説のもとで二項検定を行ったところ，有意確率が0.3438となり，帰無仮説は採択された（裏表の出方が異なるとは言えなかった）」ということになるでしょう。

R でやると，
> binom.test(3,10,p=0.5)

	Exact binomial test

data:  3 and 10 
number of successes = 3, number of trials = 10,
p-value = 0.3438
alternative hypothesis: true probability of success is not equal to 0.5 
95 percent confidence interval:
 0.06673951 0.65245285 
sample estimates:
probability of success 
                   0.3 

No.00755　Re: 二項検定の記述について　　【山田】　2006/07/28(Fri) 16:29

お返事ありがとうございます。詳細差をかいておりまして申し訳ございませんでした。（Rでできるのですね。知りませんでした。エクセルで苦労してやりました）二項検定は，二つのグループABに，2通りのやり方で教え，その効果を比較しました。問題6問中6問とも，A の平均点が高かったのでサンプル数6で出現数6で，二項検定で有意差がでました。ABに違いがあるということで，論文を書こうと思うのですが，その場合， P値以外に書く必要はあるのでしょうか。（t検定のようにt(33，11）＝0．88）のように。教えていただければ幸甚に存じます。宜しくお願いいたします。

No.00756　Re: 二項検定の記述について　　【青木繁伸】　2006/07/28(Fri) 16:43

> 問題6問中6問とも，Aの平均点が高かったのでサンプル数6で出現数6で，二項検定で有意差がでました

そのような分析は，ちょっとおかしいですよ。A,Bいずれがすぐれているのも半々で，それを6回（6問）判定したということですから，10円玉を投げる例と似ていると言えば言えますが，データが持つ情報をかなり捨てていますね。どちらかが優れていると判定したのは平均値からだけですから，極端なことを言えば，平均値が 0.01 違ってもどちらかが優れていることになりますね。それでは統計学的に意味があるとは言えないでしょう。

A,B は何例ずつですか？問題はそれぞれ，点数が付いているのですか，それとも，正誤だけですか？

No.00757　Re: 二項検定の記述について　　【山田】　2006/07/28(Fri) 17:42

お返事ありがとうございます。実はこの実験は双方に差がなく，苦しんでいたところ，ある人に，二項検定を使ってみたらと，進められて使ったら有意差が出ましたので，それで書き進めております。その人の論によれば，本当なら，3問3問になるはずなのに，6対0になるので，効果に違いがあると書いていいということなのですが，，，。

＞A,B は何例ずつですか？

Aの個体数が，19，Bの個体数は14です。それぞれ，2群は等質とみなしております。（プレテストでt検定で差がありませんでしたので）

＞問題はそれぞれ，点数が付いているのですか，それとも，正誤だけですか？

問題は，正誤です。一問1点です。一問につき，平均点がAが0．8，
Bが0．6というように，平均点の高いか低いかで，判断し，Aが全問平均点が高いということで，二項検定にかけたのですが，，，，。

他にいろいろやって有意差がでなかったのですが，二項は無効なのでしょうか。
何度も申し訳ございません。宜しくお願いいたします。

No.00758　Re: 二項検定の記述について　　【青木繁伸】　2006/07/28(Fri) 19:22

そのようなデータに対して，二項検定をやっても意味がありません（というか，他の人を納得させる根拠になりません）。
各質問ごとに正解率に統計学的に有意差がないのに6つの結果を合わせたとたんに有意になるというのは，うさんくさいですよね。
有意差を求めて，あれこれ小細工をするのはやめましょう。
実験計画を立ててからデータを採りましょうというのは，この際言わないことにします。
例1　6問の正解率
　　A群 0.6,  0.8,  0.7,  0.8,  0.8,  0.9
　　B群 0.61, 0.81, 0.71, 0.81, 0.81, 0.91
例2　6問の正解率
　　A群 0.6,  0.8,  0.7,  0.8,  0.8,  0.9
　　B群 0.9,  0.95, 0.9,  0.9,  0.95, 0.99
どちらも，B群の平均値がA群より大きいですが，例1の場合と例2の場合が同じだと思う人はそうはいないでしょう。

http://aoki2.si.gunma-u.ac.jp/R/type-of-test.html
にある，実験データの説明をご覧いただくのがよいのですが，
ASB タイプ（混合計画または SPFp・q デザイン）ということになるわけでしょうが，例数が不揃いと言うことで面倒なことが生じるでしょうね。

6問は全くタイプの異なる質問なのでしょうか。6問の正解数ということで0～6点というような点数で評価してもかまわない種類のものなのでしょうか。
そのようなものでしたら，試験の成績の二群の比較ということで，t検定も可とは思いますが。

No.00759　Re: 二項検定の記述について　　【山田】　2006/07/28(Fri) 19:34

青木先生

お返事ありがとうございました。うさんくさいのは反論できません。先生に教えていただいたt検定を早速やってみます。ありがとうございます。

No.00760　Re: 二項検定の記述について　　【青木繁伸】　2006/07/28(Fri) 19:44

念のために言っておきますが，合計点でt検定をやっても，たぶん有意差はないと思いますよ。

実験をやって論文を書こうという場合，有意な結果が出て欲しいのは山々ですが，実験計画が不十分な場合には，かっこいい有意な結果は出ない場合も多いです。

例数が不十分なために有意にならないのか，そもそも仮説に誤りがあったのか，良く見極めるべきでしょう。

前者の場合には，差の区間推定などを中心に論文を書くのがよろしいでしょうね。
後者の場合は，ご愁傷様としかいいようがないですが。

No.00761　Re: 二項検定の記述について　　【山田】　2006/07/28(Fri) 20:56

青木先生　アドバイスありがとうございます。被験者数が少ないということは確かです。可能なら，区間推定を中心に書ければと思っております。ただ，区間推定という言葉を今日はじめて区耳にしました。少し区間推定について勉強したいと思います。Rのホームページで調べたのですが，信頼区間という項目に当てはまるのではと思いました。ただ，7項目あるので，どれがあてはまるのかわからないのですが，母比率なのか母区間なのか，よくわからないのですが，今わかったことは，被験者数が少ないので有意差がでないということを証明するためにもう1回分析するということなのでしょうか。（ちんぷんかんぷんなことを申し上げているかもしれません。もう少し自分で調べて質問するのが筋かと思いますが参考となるホームページがございましたらアドバイスしていただけたら幸甚に存じます。宜しくお願いいたします。

No.00762　Re: 二項検定の記述について　　【山田】　2006/07/28(Fri) 21:53

青木先生　お世話になります。今自分で調べたところ，少しづつわかってきました。一部を見て全体を推定するということなのですね。いろいろな手法があるのですね。何度もありがとうございました。ちんぷかんぷんなことを言って申し訳ないので，もう少し自力で調べてみます。いろいろ教えていただきありがとうございます。また，お聞きすることがあるかもしれませんが，そのときは宜しくお願いいたします。本当にありがとうございました！

No.00767　Re: 二項検定の記述について　　【山田】　2006/07/29(Sat) 00:59

青木先生　度々申し訳ございません。なんとかホームページをいろいろ見ていましたら母平均の差の区間検定までたどりつきました。その結果

信頼度 95%
下限値 -0.673304727
上限値 3.146988938

平均値の差自由度 t値 P値(両側確率) t(0.975)
A,B 1.236842105 31 1.320609217 0.19629881

という結果が出ました。（マイナスが出ましたのは，プレポストテストの伸びの平均のためマイナスが出ています。問題数は6問です。）

実はもうひとつまったく異なる課題をあたえていたのですが，（これは平均もほとんど差がなく二項でも有意差がでませんでしたので，述べなかったのですが）問題数は13問あります。

信頼度 95%
下限値 -1.605483793
上限値 2.176912364

平均値の差自由度 t値 P値(両側確率) t(0.975)
A,B 0.285714286 31 0.308121322 0.760050934

過去ログから，信頼区間が広いほど信頼できるという知見を得ました。信頼区間が広くなるのは，例数が少ないことに原因がある可能性があることもわかりました。

ただ，信頼区間が広い狭いというのは何と比べているのでしょうか。この場合，どちらも広いと考えてよろしいでしょうか。そして，これは被験者数がすくないことに起因すると述べてもよろしいのでしょうか。本当にお忙しいところ何度も質問して申し訳ございませんが教えてくだされば有難いです。宜しくお願いいたします。

No.00768　Re: 二項検定の記述について　　【青木繁伸】　2006/07/29(Sat) 08:00

> 信頼区間が広い狭いというのは何と比べているのでしょうか

平均値の差そのものでも同じことなんですが，実質的にその差をどのように評価するかという基準に比較しての話なので，一概にはいえません。

6問の合計値の平均値にしても，1点の差がどのような意味があるのかは，あなた（および関係者）が決めるべきことなんですね。1点の差でも全く意味がないのか，0.1の差でも意味があるのか。

> 信頼区間が広いほど信頼できるという知見を得ました

誤解されていないと思いますが念のため。
信頼区間が広いほど，信頼度は高い（逆に言えば信頼度を高くすると，信頼区間は広くなる）ということです。
結果としては，一定の信頼度（95%とか）のもとでは，信頼区間は狭いほどいいのです。
また，平均値の差の信頼区間が0を含むということは，平均値の差がないという帰無仮説が採択されることと同じです。
信頼区間の上限値（下限値も）がどの程度であるかというのを，評価対象に加えようということです。

No.00769　Re: 二項検定の記述について　　【山田】　2006/07/29(Sat) 09:53

青木先生　アドバイスありがとうございました。

> 信頼区間が広いほど信頼できるという知見を得ました　

これは私の書き間違いです。申し訳ございません。信頼区間が狭いほど信頼できると書いたつもりでした。ご指摘ありがとうございました。

信頼区間が広いか狭いか自分で判断するとのこと，教えていただきありがとうございます。したがって「問題数13問」を「課題1」，「問題数6問」を課題2とすると，課題1では問題数が13問あるのでのびの平均点の差は0点から13点までの可能性があるが，信頼区間は-1.605483793から 2.176912364であることから，信頼区間は狭いと判断できる。したがって課題1は例数が少ないと判断できず，t検定で有意差はみられなかったことから，2グループに効果の差はなかったといえる。しかし，課題2の場合問題数は6問で平均点の伸びの差は0点から6点までの可能性があるのに，信頼区間は -.673304727から 3.146988938までである。これは，課題1に比べ，明らかに信頼区間が広いといえる。したがって，課題2に関しては問題数がすくないことにより， t検定で有意差がみられなかったと判断できる。今後問題数を増やし，再検証する必要がある。
というふうに記述すればよろしいのでしょうか。何度も申し訳ないのですが，アドバイスいただければ幸いです。宜しくお願い申し上げます。

No.00776　Re: 二項検定の記述について　　【青木繁伸】　2006/07/29(Sat) 18:15

> 課題2に関しては問題数がすくないことにより，t検定で有意差がみられなかったと判断できる

問題数を増やすのではなく，対象者数を増やすのです。
問題数を増やすのは，測定精度を高める効果があることになるでしょう。

No.00779　Re: 二項検定の記述について　　【山田】　2006/07/29(Sat) 19:09

青木先生　教えていただきありがとうございました。点数の伸びの平均点で検定しているので，問題数の差は関係なかったということに気づきました。
課題Aと課題Bは被験者数はどちらも同じなんですが，課題1は被験者が少なくなくて，課題2は被験者が少ないということに，矛盾を感じましたが，課題Aに関しては，信頼区間が狭いので，t検定の結果をそのまま採用できるが，課題Bに関しては，信頼区間が広いことから，被験者数を増やし再検証する必要があるということなのですね。
わかりました。やっと頭がすっきりしました。何度も詳細に教えていただきありがとうございました。感謝しております。また，質問することがあるかもしれませんが，そのときは宜しくお願いいたします。ありがとうございました！