「統計学関連なんでもあり」の過去ログ--- 042

No.10072　繰り返しのあるカイ二乗検定？　　【アーダン】　2009/06/16(Tue) 17:11

お世話になります。レフェリーからのコメントに関する質問です。
確率・統計は中学生の頃から苦手です。長文です。すみません。

行動学の実験です。1匹のオスに2匹のメスを同時に提示して，
それぞれのメスへの求愛回数を調べました。
オスにとって2匹のメスが等しく魅力的ならば，
求愛回数の比は50:50になるだろうし，
そうでなければこの帰無仮説はカイ二乗検定により
棄却されるだろうとの予測です（二項検定の方が良いでしょうか？）。

メスは4系統（A, B, C, D）使い，6通りすべての組み合わせ
（A-B, A-C, A-D, B-C, B-D, C-D）を各オス（計8匹）に提示しました。
48（8匹x6通り）の実験結果をそれぞれカイ二乗検定するとともに，
各組み合わせにおける95%信頼区間を計算し，図に示しました。

結果は，一種類のメス（例えばD）が他のメスよりも魅力的である，
すなわちオスの求愛をより頻繁に受けることを示唆しているようでした。
つまり，そのメスを使用した時（A-D, B-D, C-Dの組み合わせ）に限り，
50:50の帰無仮説はより頻繁に棄却され，95％信頼区間も50:50から外れるのです。

この結果に対するレフェリーのコメントは，
「同じオスを3つ以上の異なる条件で使い回しているんだから，
repeated measurement ANOVAを使え。」
でした。

このコメントは妥当でしょうか？私の理（誤）解では，結局ANOVAは，
「異なる組み合わせで測定した平均値（？）を比較」する手法ですので，
本来の趣旨「50:50から外れる組み合わせがあるかどうか」からずれてしまうと思うのです。
仮にすべての組み合わせで50:50から外れていた（例えば70:30）ら，
メスのモテかたに違いはあるはずですが，組み合わせ間では違いが検出されないわけですし。

また，もし妥当であるならば，「どのような値」をrepeated measurement ANOVAに
用いれば良いでしょうか？すなわち，A-Bの組み合わせで得られた平均値は
70:30とも30:70とも計算できますので，A-B, A-C, A-D間，
もしくはB-A, B-C, B-D間での比較は同時に出来そうですが，
6通り同時にはいずれにせよ検定できない気がしているのです。

つたない文章ですみません。もし質問の意図がおわかりいただけた場合には，
易しめにご教授いただけたら幸いでございます。よろしくお願いします。

No.10132　Re: 繰り返しのあるカイ二乗検定？　　【アーダン】　2009/06/18(Thu) 17:46

あのぅ・・・，他の方のご質問ではホットな議論＆明確なお答えをいただけているのに，
私の質問（だけ？）がどなたにも相手にしていただけないのはとても悲しいでごんす（泣）。

その理由として，
1．質問が長すぎる／意味不明
2．こんな簡単なこと聞くなばかやろう／既出／てめーで勉強しろ
3．質問者（私）の態度が無礼
4．実験のデザインが悪すぎる／統計の問題じゃない
5．無視／いじめ
6．一生懸命解答を考えてくださっているところ
7．アーダンなら一人クリアだろ
を考えてみたんですが，実際の所いかがなものでしょう？

個人的には，Termiteさんの2009/06/06(Sat) 16:19 No. 10004に似ていると思うんです。
私の実験には更に繰り返しが入っているのがややこしい（？）原因だと思いますが。

ちなみに実際の論文では，後続の実験により実際にDがモテることを確かめており，
この実験（スクリーニング）の段階では統計差が出ようと出まいとじぇんじぇん構わないんです。
それにかみついてきたレフェリーは，まあ相当に（私程度に）頭が弱いんだろうと思ってますが，
ガシガシ反論を用意する前に統計学をよくご存じの方々のご意見を伺いたかったんですよね・・・。

まあいいです。放置プレイ，どうもありがとうございました（泣）。

No.10133　Re: 繰り返しのあるカイ二乗検定？　　【みかん】　2009/06/18(Thu) 18:31

RMANOVAでやるなら
----- AB-AC-AD-BC-BD-CD
No.1
No.2

No.8

のような表を作って，それぞれのデータ-は比率の大きいほうで小さいほうを割った値にすれば，Dを含む組み合わせはそれ以外のものよりも有意に小さいという結果を出すことが可能かもしれません。なぜなら，二つの比率が等しいなら8匹の平均は1に近づくはずだからです。実験デザインがあまり理解できていないので的外れな回答かもしれません。ほかの方の意見も待ってみてください。

RMANOVAを使わないなら，K群の比率の差の検定でもいいと思いますが。（Dを含まないデータを除くことになるかもしれないが。）

回答がないことについて，お気持ちはわかります。査読委員とのやり取りに関する重要な質問ですから余計でしょうね。しかし，掲示板のトップに書いてあるように，回答の有無や妥当性は保障されていません。また，回答する側は時間と労力を無料で提供するわけですから，回答があればラッキー，というくらいに思うのがいいかなと思います。

No.10134　Re: 繰り返しのあるカイ二乗検定？　　【TU】　2009/06/18(Thu) 19:27

>ちなみに実際の論文では，後続の実験により実際にDがモテることを確かめており，
この実験（スクリーニング）の段階では統計差が出ようと出まいとじぇんじぇん構わないんです。それにかみついてきたレフェリーは，まあ相当に（私程度に）頭が弱いんだろうと思ってますが，

その論文を読んでないのでなんともいえませんが，この文章だけ読んでいると別にレフェリーの頭が弱いように思わないのは私だけでしょうか？

というのも，もし仮に実験1の分析方法に誤りがあって，実験1ではDは他に比べて特にモテてないということが明らかになったとしましょう(そしてレフェリーはこれを疑っている)。すると，トータルであなたの論文は，Dのモテっぷりは再現性がないことを示している可能性があるわけでしょう。後続実験がどれだけストリクトに統制が利いていて，どれだけそちらのほうが信頼できるのかはわかりませんが，一つの実験で結果が出ててもう一方の実験で結果が出てないとすれば，普通にそう思うでしょう。

あくまで，ご質問されてる実験の分析手法が間違っていて，Dのモテっぷりが証明されなかったときの話です。ですから，この段階でレフェリーの頭がどうこう，というのは待っておきましょう。もしこちらが間違っていたら，後続実験がどうこうなんていっても説得力が幾分か欠けるでしょう。

No.10136　Re: 繰り返しのあるカイ二乗検定？　　【知ったかぶり】　2009/06/18(Thu) 23:25

＞私の質問（だけ？）がどなたにも相手にしていただけないのはとても悲しいでごんす（泣）。
＞その理由として，

8.どうしたら良いのかわからん．
というのもあります．

目的：メス4系統の「魅力」の違いを明らかにする．
前提：メスの「魅力」はオスの求愛回数によって評価できる．

であるとすれば，メス4系統に対するオスの求愛回数を同じ条件で測定し，求愛回数に系統間差があるか否かを検定すれば良い，ということになります．非選択条件（メス1系統のみをオスに提示する）では，差が出にくいと考えられる場合は，メス4系統を同時にオスに提示して，選択可能な条件で各系統に対する求愛回数を測定すれば良いでしょう．
しかるに，アーダンさんの実験では，メスを（4系統いっぺんにではなく）2系統ずつ提示しているので．各系統に対するオスの求愛回数は，系統の組み合わせの影響を受ける可能性があります（つまり同じ条件で求愛回数を測定したとはいえない）．このような場合にどう処理したら良いのか，残念ながら私にはわかりません．

No.10137　Re: 繰り返しのあるカイ二乗検定？　　【アーダン】　2009/06/19(Fri) 00:19

おおお。ありがとうございます。
二つもお返事（一つのご助言と一つのお叱り・・・）がついていて感動しました。
催促したみたいですみません。

> 比率の大きいほうで小さいほうを割った値

これ，私めも考えました。比率を安全側（差が出ない方）へ計算して比較するんですよね。
方法としては間違ってないですかね。小さい方で大きい方を割っても同じですかね？

ところで昨日，放置プレイに涙しながら独自に，メスの各系統ごとにオスの求愛割合を足した値，
つまりA-B, A-C, A-Dの組み合わせで，
あるオスが50:50, 40:60, 30:70の割合で求愛したとしたら，
Aがそのオスから受けた求愛は，50+40+30 = 120，
（つまり最小で0%，最大で300%なんですが，こんな説明でおわかりいただけますか？）
を算出してrepeated measures ANOVAに使ってみました。

一応差は支持されたんですが，こんな（てきとーな？）ことをしたら，またレフェリーに怒られますかね？

> K群の比率の差の検定
> Dを含まないデータを除くことになるかもしれない

おお。新しいキーワード，ありがとうございます。勉強させていただきます（泣）。

> トータルであなたの論文は，
> Dのモテっぷりは再現性がないことを示している可能性があるわけでしょう。

おっしゃるとおりです。すみません。説明が多分足りませんでした。
実際はちとちがうんですが，リンゴとバナナとミカンとパイナップルを食べた女性が，
A, B, C, Dだとするじゃないですか。で，今回質問させていただいた実験をしたところ，
「なんとなくDがモテそうな気がするぞ。」と。これが今回の論文の「きっかけ」になった
スクリーニングです。あくまで「きっかけ」なんです。図1です。

すると，後続の実験でもっと詳しく，パイナップルの成分を分けて別々に与えたり，
過剰に食べさせたり，成分の阻害剤を与えたりした時に，モテ方がどう変化するか
調べたくなるじゃないですか。で，そんな実験を幾つかやったところ，どの結果も，
「パイナップルのこの成分が女性をモテモテにする」ことを支持しています，
ってのが今回の論文の要旨です。まあ実際にそんなのが見つかったら億万長者なんですが（笑）。

この意味で，
「スクリーニングの段階で統計差があろうと無かろうと，全く関係ないだろう。
　お前，何言ってんだ？頭弱いのか？」
とレフェリーに反論してやりたいと思ったわけです。言葉が悪くてすみません。

更には，
「Chi-squared testなんてtotally unsoundな方法（なんですか？）だから，
　お前の結果は信用できない。」
とも言われてるんですが，私としては，
「別にこの段階で信頼して貰おうなんて，誰も思っちゃいない。
　むしろdata not shownでも構わない。」
わけです。

が，統計に関しては全く自信が無いし，カイ二乗と95%信頼区間は，レフェリーの言うとおり
ホントにどうしようもなくアホな選択なのかもしれないし，周りに詳しい人もいないしで，
こちらで質問させていただいた次第です。

お時間取らせてすみません。結局「多重比較をやっとくべき」って結論でしょうか。
みかんさま，TUさま，ご指導どうもありがとうございました。

追伸
知ったかぶりさまからのご助言，今読みました。ありがとうございます。

> メス4系統を同時にオスに提示

これ超面白いですね。ハッキリした結果が出そうですし。
次の実験で是非やってみたいと思いました。
どうもありがとうございます！！

No.10138　Re: 繰り返しのあるカイ二乗検定？　　【TU】　2009/06/19(Fri) 13:31

>実際はちとちがうんですが，リンゴとバナナとミカンとパイナップルを食べた女性が，
A, B, C, Dだとするじゃないですか。で，今回質問させていただいた実験をしたところ，「なんとなくDがモテそうな気がするぞ。」と。これが今回の論文の「きっかけ」になったスクリーニングです。あくまで「きっかけ」なんです。図1です。

>すると，後続の実験でもっと詳しく，パイナップルの成分を分けて別々に与えたり，
過剰に食べさせたり，成分の阻害剤を与えたりした時に，モテ方がどう変化するか
調べたくなるじゃないですか。で，そんな実験を幾つかやったところ，どの結果も，
「パイナップルのこの成分が女性をモテモテにする」ことを支持しています，
ってのが今回の論文の要旨です。まあ実際にそんなのが見つかったら億万長者なんですが（笑）。

>この意味で，「スクリーニングの段階で統計差があろうと無かろうと，全く関係ないだろう。

そうでしょうか…？スクリーニングの段階で差がなければ，結論は「パイナップルのこの成分は非常に重要な役割を担っているけど，それを含んだパイナップルを食べた時のモテ度への効果量はね，別にその他の果物を食べたときと変わんないんだよ」

になるのでは？もしそうだったら，それを追求してもねぇと思うのは自然なことなので，論文のインパクトを評価するためにもそのスクリーニングの部分を聞いておきたいのは自然なんじゃないでしょうか？つまり，後続実験でDのモテっぷり(の要因)に統計学的な意味があったということと，そのDのモテっぷりに実質的な意味があるがどうかは別物なので，そのスクリーニングはすごく重要な気がします。

と，あくまで私見です。上に書かれていますが，お叱りだとかそんなんじゃありません。それに僕は当該の論文を読んでいないので，そんなことをいう資格はありません。得られている情報から，「このように思うこともできるよ，その可能性はないのですか」というだけです。

No.10143　Re: 繰り返しのあるカイ二乗検定？　　【アーダン】　2009/06/19(Fri) 20:23

TUさま，ご指摘ありがとうございます。

既に本題から外れており，「楽屋でやれ！」という突っ込まれそうな気もしますが，
一応お返事をば。

> 「パイナップルのこの成分は非常に重要な役割を担っているけど，
> 　それを含んだパイナップルを食べた時のモテ度への効果量はね，
> 　別にその他の果物を食べたときと変わんないんだよ」

まさしくおっしゃる通りだと思います。しかし論文のポイントはそこじゃないんです。
もう一人のレフェリーも（まあ当たり前でしょうが）それは理解してくれてるんです。

つまり，既に「モテモテ成分X」が証明されており，それが今回の（唯一の）発見なんです。
この際，パイナップルを食べた女性（つまりD）がモテようがモテなかろうが，どーでもいいんです。
むしろモテない方（統計差が無い方）が都合が良いんです。農家が儲かるだけですから（笑）。

でも論文では，「なんで私が成分Xに着目したか」を説明する必要がありますよね。
「神の啓示がありました（data not shown）」でも構わないとは個人的には思ってますけど。

で，
「カイ二乗検定と95%信頼区間をやってみたら，なんとなくDがモテない感じじゃん？
　気のせいかもしれないけど？だから図2以降の実験をデザインしてみたんだよね。」
と論文を書いたんです。

そしたらそのレフェリーが，図1（を中心）に延々と4ページにもわたってケチをつけてきて，
メインの結果には「probably the best」とか苦し紛れのコメントを残しやがっただけなので，
「何じゃこりゃ？」と面食らった次第です。まあ，レフェリーのその日の気分が悪かったんでしょう。

こんな説明でいかがでしょう？

結局のところ，
「多重比較をやった方が良いけど，カイ二乗と95%信頼区間じゃ全然ダメってわけでもない。」
「4つのメスを同時に提示すればいいじゃん（←なんで思いつかなかったかなあ・・・）。」
との結論でよろしいでしょうか？

皆様ホントにありがとうございました。

No.10154　Re: 繰り返しのあるカイ二乗検定？　　【知ったかぶり】　2009/06/20(Sat) 17:56

解決策は提示できませんが，問題点を指摘させてください。

＞「多重比較をやった方が良いけど，カイ二乗と95%信頼区間じゃ全然ダメってわけでもない。」

このカイ二乗検定が，

＞48（8匹x6通り）の実験結果をそれぞれカイ二乗検定する

ということであれば，全然ダメです。各組合わせについて8回の検定を行っているので，間違って帰無仮説を棄却してしまう確率は，それだけ高くなってしまいます。そもそも，組み合わせごとに95%信頼区間を示すのであれば，これらの検定に意味はないでしょう。また，95%信頼区間に50:50が含まれるかどうか，というのは「求愛回数の比は50:50である」という帰無仮説を5％水準で検定するのと同じことですから，これを組み合わせごとに行った場合，やはり多重性の問題が生じます。多重比較(多重性の調整)は「やった方が良い」というものではなく，「必要」か「不要」かのどちらかであり，この場合は「必須」です。
多重性の調整を行った上で，「求愛回数の比は50:50である」という帰無仮説について組み合わせごとに検定を行えば，検定結果をそのまま解釈して差し支えないと思います（帰無仮説が採択されたからといって，差がないことが証明されたわけではない点には注意が必要ですが）。ただし，これはデータが独立であると仮定した場合の話です。実際には雄が繰り返し供試されているので，データは独立ではなく，上記の方法は適切ではないでしょう。

なお，言わずもがなの話ですが，この実験データが論文の論旨展開の上でさほど重要ではないからといって，不適切な統計手法を用いても良いということにはなりません（それくらいなら検定しない方がマシ）。

No.10155　Re: 繰り返しのあるカイ二乗検定？　　【TU】　2009/06/20(Sat) 19:29

>なお，言わずもがなの話ですが，この実験データが論文の論旨展開の上でさほど重要ではないからといって，不適切な統計手法を用いても良いということにはなりません（それくらいなら検定しない方がマシ）。

僕も同感ですね。どんなにウェイトが低くても，突っ込まれる要素があるものを論文に書いたわけですから，それが突っ込まれたというだけのことですよね。レフェリーの頭とか気分どうこうじゃありません。むしろ，これをそのまま出版するとそれを呼んだ世界中の研究者や新進気鋭の後輩が貴方にネガティヴな印象をもつ，という可能性を事前に指摘しておいてもらえたのだから，感謝するだけの話です。

知ったかぶりさんのご指摘のほかにも一つ気になることは，最初の書き込みに書かれている部分です。

>つまり，そのメスを使用した時（A-D, B-D, C-Dの組み合わせ）に限り，
50:50の帰無仮説はより頻繁に棄却され，95％信頼区間も50:50から外れるのです。

さらっと書かれていますが，「より頻繁に」が気になります。何をもってそれは頻繁だと判断するのかの根拠も必要になってきますよね。これを見ていると，帰無仮説が棄却されなかったDを含むペアがどこかにあったのでは。そいつはどうなるのか。ということです。

No.10157　Re: 繰り返しのあるカイ二乗検定？　　【アーダン】　2009/06/21(Sun) 00:02

おおお。知ったかぶりさま，再びありがとうございます。
話題が急速に核心に迫ってきた気がしています。

> そもそも，組み合わせごとに95%信頼区間を示すのであれば，これらの検定に意味はないでしょう。

おっしゃるとおりです。それでもなぜ私がカイ二乗検定（昨日二項検定でやり直しました）を
したかと言いますと，例えばみかんさまの様な表，

----- AB-AC-AD-BC-BD-CD
No.1
No.2

No.8

を作って48個の値（求愛行動回数の比）を示した場合，
「各値それぞれが50:50と差があるのかどうか？」を
アンダーライン等で示したら読者に親切かな，と考えたんです。
合計求愛回数の大小に応じて，20:80で差が無い時もあれば，
40:60で差がある時もあるわけですから，百分率／実測値にかかわらず，
数字だけ見せるよりはinformativeかな，と。

まあ全数値を見せること自体が不要と言えば，その通りでございます。
しかし結果として，Dを含む組み合わせに多くのアンダーラインが付きましたので，
視覚的にも訴えるよなー，とほくそ笑んでいたわけです。

このアンダーラインの数から何かを言おうとしているわけではないです。
おっしゃるように「95%信頼区間が50:50からずれていること」が，
メスの魅力に差がある（かもしれない）と思ったメインの根拠です。

そこで，質問なのですが，
「統計学的には，このアンダーラインも取り払うべきなのかどうか？」
です。つまり，表が見苦しくなるだけ，恥ずかしいほど無意味，
なのかどうか，お教えいただきたいと思いました。

もう一つなんですが，

> 多重性の調整を行った上で，
> 「求愛回数の比は50:50である」という帰無仮説について組み合わせごとに検定

ありがとうございます。これですよね？やるべきは，同じ多重比較と言っても，
レフェリーの言うようなRMANOVA（組み合わせ同士の比較）ではないですよね？
「組み合わせごとに検定」で構わないんですよね？ようやくスッキリしました。

で，お伺いしたいのはその方法なんですが，繰り返しも含めたヤツは
知ったかぶり先生と言えども，残念ながらおわかりにならないと。
でも，私は多重性の調整の仕方自体わからないので，よろしければ
キーワードだけでもご教授いただきたいのです。
お忙しいところすみません。よろしくお願いします。

更にもう一つなんですが，

> 95%信頼区間に50:50が含まれるかどうか，というのは
> 「求愛回数の比は50:50である」という帰無仮説を5％水準で検定するのと同じこと

> 検定しない方がマシ

> 僕も同感ですね。

と言うことは，「95%信頼区間を図に示すこと自体がこの場合は不適切」と言うことになりますか？
図的には「推定」の方が「検定」よりもわかりやすいと思ってそうしたんですが，
方法論的に不適切ならば勿論訂正しなければなりません。
「多重性と繰り返しを考慮した95%信頼区間」なんて都合の良い数値があったりしませんか？

しかし，上述のアンダーラインも信頼区間も取っ払っちゃうと，
生数値しか図に示せなくなっちゃうんですよね。
何かもっとこう，読者フレンドリーな方法ありませんかね・・・？

追伸
TUさま，毎度ありがとうございます。

> 「より頻繁に」が気になります

オスを8匹使ったとすれば，例えば，C-Dでは8回ともカイ二乗検定で有意でしたが，
A-Cでは0回でした，という程度の意味です。上述のアンダーラインの数ですね。
数が多いってだけで，検定はしてないです。

しかし今思ったんですが，「アンダーラインの数にRMANOVAを用いる」ってのは，
方法論的にはどうでしょう？差は出ないかもしれませんが，それは全然構わないので（笑）。

No.10169　Re: 繰り返しのあるカイ二乗検定？　　【知ったかぶり】　2009/06/21(Sun) 11:28

＞「統計学的には，このアンダーラインも取り払うべきなのかどうか？」です。つまり，表が見苦しくなるだけ，恥ずかしいほど無意味，なのかどうか，

「無意味」なのではなく，明らかな「誤り」です。同じ検定を繰り返しているので，そのどれかで間違って帰無仮説を棄却してしまう確率は，設定した有意水準よりもはるかに高くなってしまうからです（「検定の多重性」について調べてみることをおすすめします）。

データに対応がある(独立ではない)ことをとりあえず無視するとして，
それぞれの組み合わせにおける検定は，No.10012でマスオさんが紹介している繰り返しのある適合度の検定などが参考になるでしょう。あるいは，雄8個体の総求愛回数に大きな違いがなければ，8個体の求愛回数をプールしても構わないかもしれません。多重性の調整は，有意水準が5％であればこれを検定の総数6で割ることで行います（Bonferroni法）。つまり，個々の検定における有意水準を0.83％にするということです。この場合，信頼区間をどうするかですが，普通に95％信頼区間を計算したのでは，検定結果と矛盾します。たぶん，調整した有意水準に従って99.17(100-0.83)％の信頼区間を（95％信頼区間として）示すべきでしょう。

このやり方は，検出力がかなり小さくなる（本当は求愛回数は50：50ではないのに，帰無仮説を採択してしまう）ので，決して望ましい方法ではありません。査読者は，この様な問題点やデータが独立ではないことを考慮して，repeated measurement ANOVAを提案しているのではないでしょうか。どちらも謂わば「苦肉の策」であると思いますが（試験設計に問題があるのでそうならざるを得ない），私が著者なら査読者の指示に従います。

No.10177　Re: 繰り返しのあるカイ二乗検定？　　【アーダン】　2009/06/23(Tue) 02:12

知ったかぶり先生，お付き合いいただき，ホントに感謝しております。

> 「検定の多重性」

これが正直，私には理解するのがとても難しいんです・・・。
馬鹿につきあうのもお疲れでしょうから，以下お時間があったらで構いません。すみません。

いや，一応わかります。検定を繰り返すと危ないってのは。
「下手な鉄砲，数撃ちゃ当たる」ですよね？
50:50かどうかのカイ二乗検定をp<0.05で100回繰り返すと，
どれか一つで有意な差が検出されたとしてもp=0.9941だと。

でも『その一つの値だけを見れば』（←この考え方をするからダメなんでしょうか？），
明らかに50:50から違うわけじゃないですか。p<0.05で。
他の99の検定や，世界中で何兆回と繰り返されたであろうカイ二乗検定結果は，この際関係無いですよね？

そう考えてしまうので，「この値は『それだけを見た場合』50:50じゃないです。」と図に示すこと自体には，
なんら問題が無いように思えてしまうんです。95%信頼区間も同じです。
「このメスの組み合わせで得られた，この8個の数字『だけ』を見れば，この区間になります。」
と示したかったのです。他の組み合わせや，そのオスが実験前に無数に繰り返したであろう求愛回数は，
この『値』自体の検定・推定には何の関係も無いと思ってしまうんです。
繰り返しどころか多重性すらも考慮に入れる必要が無いだろう，と考えてしまうんです・・・。

どなたかつける薬をご存じの方がいらっしゃったら，よろしくお願いします（泣）。

僭越ながら，Termiteさん（No. 10004）の例ですと，
「あるコロニー内での性比は♂：♀＝1：1であるかどうか？」
を知りたいだけならば，カイ二乗検定を繰り返せば良いと思うんです。
100コロニー調べれば，かなりの確率で1:1じゃない（p<0.05）値（コロニー）が見つかるでしょう。
それを図に（アンダーバーで）示すことも問題無いように，私には思えてしまいます。

しかし，それが何の生物学的な意味を持つか，と考えますと，
「まあ99.41%の確率で，何の意味も無いんじゃない？『たまたま』というか『必然』？」
という結論になって，今後その女王アリ（or環境？）に着目して研究するかどうか，
悩ましい決断を迫られることになってしまうのです。それでも，そのコロニーで得られた『数値自体』は
95%の確率で1:1ではなく，Termiteさんの目的は果たされていると思うんです。

これも違いますかね・・・。

いずれにせよ，

> No.10012でマスオさんが紹介している繰り返しのある適合度の検定

を，もう少し勉強してみて，それでもわからなかったら，みかんさまのご助言通り，
安全側に計算してRMANOVAをやって「差がないけどDに着目することにしました」とするか，
生データを提示して「こんな（どんな？）理由でDに着目することにしました」とでもしようと思います（泣）。

知ったかぶり先生，どうもありがとうございました！

No.10181　Re: 繰り返しのあるカイ二乗検定？　　【takahashi】　2009/06/23(Tue) 13:37

>でも『その一つの値だけを見れば』（←この考え方をするからダメなんでしょうか？），

なぜその一つの値だけを選んで見たのか，という問題を考えてみてください。

No.10184　Re: 繰り返しのあるカイ二乗検定？　　【みかん】　2009/06/23(Tue) 17:16

遅くなってすみません。

＞これ，私めも考えました。比率を安全側（差が出ない方）へ計算して比較するんですよね。
方法としては間違ってないですかね。小さい方で大きい方を割っても同じですかね？

あまりよくないと思います。比率A:B（A<B）に対してX＝A/Bを考えると，もしA:Bが50：50を中心に現れるとすると，Xの分布は正規分布にはならないでしょう。0から1に向かって増加する分布になるかと思います。かといって，メスのどちらかを分母（または分子）
にすることは難しいですよね。群によってメスの組み合わせが違うのですから。頑健性を信じるか，フリードマン検定とするか。

大きいほうを小さいほうで割るのとは違うでしょう。こっちのほうが差が出やすいかもしれませんね。

しかし，ほかにいいアイデアがなかったので，あえて提案させていただきました。すみません。RMANOVAを適用できるような正規分布する1変数に変換するのはなかなか難しいですね。

足し算のほうも妥当かどうかはわかりません。あるオスがある組み合わせに対して10回求愛行動をして30対70であるのと，同じオスが別の組み合わせに対して100回求愛行動をして30対70なのは同じ意味になりますかね。そういう意味で足し算で処理していいものか不明です。少々理屈に合わなくても RMANOVAを適用していいかもしれませんし。

No.10187　Re: 繰り返しのあるカイ二乗検定？　　【にゃんちゅう】　2009/06/23(Tue) 21:10

このデータは手法的に一対比較ですが，それをカイ2乗検定の連続で分析するというのはどうもなじめません。

1対比較の分析法はいくつかあるようですが，
だいぶ古い本の
西里静彦『応用心理尺度法─質的データの分析と解釈─』誠信書房 1975
に詳しい解説があります。
他にも，心理尺度法の本やその他の西里静彦の本にもあります。

予備調査ということだから，有意に50％から外れているというのでなく，順序がはっきりとつくということで示せばいいのでは。

どうしても推計学ということでしたら，Bootstrapを使う手があります。

No.10189　Re: 繰り返しのあるカイ二乗検定？　　【知ったかぶり】　2009/06/23(Tue) 23:08

にゃんちゅう様

一対比較については良くわからないのですが，各対の評価の総数が一定であることが前提ではないのでしょうか？求愛回数の総数が比較する対ごとに異なっている場合にも適用する方法があるのでしょうか．データに対応があることも問題になりそうな気がしますが．

＞カイ2乗検定の連続で分析するというのはどうもなじめません。

これは同感で，何となく釈然としない．どうしてかはわかりませんが．

アーダン様

多重性の問題は，「P値」と「検定」について整理すると理解しやすいのでは．
P 値は，「帰無仮説の元で観測値よりも極端な値が得られる確率」であり，検定の回数とは無関係。ですから，アーダンさんが計算した48個のP値は全て「正しい」値です．検定は，このP値に基づいて帰無仮説の採否を判断すること．この判断の基準は，検定の回数によって変えなければならない（その理由はお分かりだと思います）．

No.10192　Re: 繰り返しのあるカイ二乗検定？　　【アーダン】　2009/06/24(Wed) 02:11

この馬鹿のために皆様の貴重なお時間を取らせてしまって，申し訳なく思っております。
ご厚意，本当に感謝いたします。

そろそろ，私の理解が及ばない所へ話題が飛んでいきそうな気配で焦っているのですが，
なにはともあれ，にゃんちゅう先生！

> 予備調査ということだから，有意に50％から外れているというのでなく，
> 順序がはっきりとつくということで示せばいいのでは。

にゃんちゅう目から鱗の解決策を！！！（←やってしまった・・・）
「Dが一番モテるので，Dに着目することにしました。」
って，全然意味不明じゃないですよね。この実験の意義が十二分に説明できます。
ありがとうございます！！

私めの場合はThurstone'sではなくScheffe'sの方になるでしょうか？
まだちっとも理解できておらず，最終的に理解できるのかも怪しいですが，

> 各対についての評価の総数が一定であることが前提ではないのでしょうか？

が解決出来そうなら（比率をそのまま使って求愛回数計100回としたらダメですか？），
是非ともこの方向（順序を決める）で検討してみたいです。
他にも良さそうな方法があったらご教授よろしくお願いします。

で，みかん先生の鋭いご指摘なんですが，

> 足し算のほうも妥当かどうかはわかりません。

そうなんです。やったことは比率の足し算なんです。実験ごと・オスごとに求愛回数の総数が違うのに，
同格に比率を足し算して良いのかなあ，ダメなんだろうなあとは思っていました（泣）。
やっぱり，てきとー過ぎますかね・・・。

そして，知ったかぶり大先生。

> 多重性の問題は，「P値」と「検定」について整理すると理解しやすいのでは．

ツボにはまりました。私は「検定」をしているんじゃなくて，「P値」を求めているんですね。なるほど。
ではそれこそ，単純に「P値」として図にアンダーラインで示すこと自体は，問題ないと解釈しちゃって，
・・・ダメなんでしょうか？それでも？うーむ・・・。

>> カイ2乗検定の連続で分析するというのはどうもなじめません。

> これは同感で，何となく釈然としない．どうしてかはわかりませんが．

そうなんですか・・・。私がこれと95%信頼区間に執着してしまう理由は単純で，
（「それしか手法を知らないから。」と言うのも大きいですが，）
「Dを使った組み合わせの時だけちょっとヘン」なのが，なんとなく（誰にでも？）読み取れるから，
つまり，アンダーラインがやけに沢山出てくるし，
「正しい」95%信頼区間も50:50からD側にずれてくれるからです。
ちゃんとした「検定」をしなくても，「これは何かあるかも・・・」と思わせるのに十分だったんですよね。
実際，この「ちょっとヘンかも」が研究を進めた理由なので，そのまんま正直に論文で説明したんですが，
それがこんなにケチョンケチョンに突っ込まれるとは・・・（泣）。

「んなこと，どーでもいーじゃねーか。論文の本質を読んでくれよ。"Probably the best"じゃねーよ。」
と糞レフェリーに反論したろ，エディター頼むぜ，と息巻いていたのですが，
おかげさまでテンションが下がってきました。冷静に対処しようと思います・・・。

> どうしても推計学ということでしたら，Bootstrapを使う手があります。

いえ，どちらかと言わなくても，できれば統計学から離れたいですので，
Bootstrapは（それが何なのか見当すらつきませんが）遠慮させて頂くことにします（泣）。
勉強嫌いですみません。ありがとうございます。

takahashi先生もありがとうございます。でも，

> その一つの値だけを選んで見た

わけじゃないです。ぜーんぶ等しく「P値」を求めて，全部結果として見せているんです。
で，低いP値がDを使った時だけに集中している（様に見える）わけです。その検定はしてないのですが。
P値が低い結果「だけ」を見せるのがアンフェアなことは理解しているのですが，
「全部」見せるのが何故ダメなのか，ということがまだ理解できていない次第です・・・（泣）。

皆様，ホントにありがとうございます。