| カイ二乗で,対応がある場合 |
|
| 投稿者:ぽち 2010/08/05(Thu) 14:10 No. 13215 |
よろしくお願いいたします。
2つのグループに対して,ある指導をして,事前,直後,3ヶ月後において,正反応の度数の偏りに差があるかどうかをみたいのですが,これは通常のカイ二乗検定でよろしいでしょうか?
お願いいたします。 |
| Re: カイ二乗で,対応がある場合 |
| 投稿者:ぽち 2010/08/05(Thu) 14:21 No. 13216 |
すこしわかりにくいと思われますので,補足させてください。
「ある指導」といいますのは,Aという指導法,Bという指導法の2つの指導法のことでして,それらをそれぞれのグループに与えたということです。
よろしくお願いいたします。 |
| Re: カイ二乗で,対応がある場合 |
投稿者:青木繁伸 2010/08/05(Thu) 22:03 No. 13217 |
「対応がある場合」なんですから,マクネマー検定(拡張マクネマー検定)ですね。しかも,処理が二種類,時期が3つだから,それぞれごとに検定すると言うことになり,面倒だし検定の多重性もあるし。 Linear Mixed-Effects Model でやっつける? |
| Re: カイ二乗で,対応がある場合 |
| 投稿者:ぽち 2010/08/06(Fri) 10:53 No. 13220 |
青木先生,お返事ありがとうございます。
簡単にするために「対応あり」を2水準で考えさせてください。
実験群と統制群で「指導前」「指導直後」で正反応の度数において,偏りに差があるかどうかですが,
mcnemar.test(matrix(c(232,362,268,336),2,2))
data: matrix(c(232, 362, 268, 336), 2, 2) McNemar's chi-squared = 13.7286, df = 1, p-value = 0.0002112
クロス集計表の上段が実験群,下段が統制群だとして,上記結果ですと,
実験群が統制群よりも正反応の数が多かったといえるのでしょうか? (このことを主張したいのですが.....)
|
| Re: カイ二乗で,対応がある場合 |
投稿者:青木繁伸 2010/08/06(Fri) 11:45 No. 13222 |
> クロス集計表の上段が実験群,下段が統制群だとして,> matrix(c(232,362,268,336),2,2) [,1] [,2] [1,] 232 268 [2,] 362 336 あなたは,この表を,1行目が実験群,2行目が統制群だとして用意したんですか? 表題に「対応がある場合」って書いてあったので,マクネマー検定を挙げたのですが,あなたは時点ごとに実験群と統制群の比較をしたかったんですか。。。だったら,普通のカイ二乗検定ですね。で,ボンフェローニ法で調整してください。 ちなみに,上のクロス集計表の独立性の検定結果は,帰無仮説は棄却できないですね。> chisq.test(matrix(c(232,362,268,336),2,2))
Pearson's Chi-squared test with Yates' continuity correction
data: matrix(c(232, 362, 268, 336), 2, 2) X-squared = 3.2622, df = 1, p-value = 0.0709 |
| Re: カイ二乗で,対応がある場合 |
| 投稿者:ぽち 2010/08/06(Fri) 11:53 No. 13223 |
青木先生、お返事ありがとうございます。
はい、先生がご指摘のような表で処理しております。
先生が説明されていらっしゃるページを読んでも、私が準備しているものと異なっており、熟読したつもりではありますが、正直、自信がありません。
前 後 実験群 232 362 統制群 268 336
で、「統制群より実験群の方が、正反応が多い」(かどうか)を調べたいのですが、ご指導いただけませんでしょうか? |
| Re: カイ二乗で,対応がある場合 |
| 投稿者:ぽち 2010/08/06(Fri) 11:59 No. 13224 |
青木先生からの最新のお返事が届く前に、最終書き込みをしてしまいました。
前後してしまいまして申し訳ございません。
わかりにくい説明で御迷惑をおかけ致しました。
通常の独立性の検定でいいのかなと思ったのですが、指導前と指導後が「対応している」のかと思い、通常の独立性の検定ができるのかと疑問に思い、質問させていただきました次第です。
ありがとうございました。 |
| Re: カイ二乗で,対応がある場合 |
| 投稿者:ぽち 2010/08/06(Fri) 12:49 No. 13225 |
青木先生,書いたつもりでいたのですが....申し訳ございません。先ほどの書き込みで,お礼の前に,ご教授いただきたかったことを書くのを抜かっておりました。
>あなたは時点ごとに実験群と統制群の比較をしたかったんですか。。。だったら,普通のカイ二乗検定ですね。で,ボンフェローニ法で調整してください。
この箇所ですが,カイ二乗検定をボンフェロー二で調整するというのが理解できませんでした。私の無知をさらけ出すようで恥ずかしい限りですが,ボンフェローニ法とは,分散分析多重比較で使用するものと思っておりました。
ここでご紹介いただきましたボンフェローニ法というのもこの考え方なのでしょうか?すなわち,私の実際のデータは,実験群と統制群で「指導前」「指導直後」「3ヶ月後」の正反応の度数ですので,これに多重比較をもちいるということなのでしょうか?
先日残差分析のことを質問させていただいたのですが,上記のデータの場合,残差分析でどのセルが影響を与えているのかというのが理解できるものと思っておりました。
先生のHPも注意深く検索させていただきましたが,たどり着くことができませんでした。Rなどのソースを準備されていらっしゃるページがございましたら,教えていただけませんでしょうか?
基本的な質問ばかりで申し訳ございません。 |
| Re: カイ二乗で,対応がある場合 |
投稿者:青木繁伸 2010/08/06(Fri) 12:55 No. 13226 |
> ボンフェローニ法とは,分散分析多重比較で使用するものと思っておりました
事前,直後,3ヶ月後 の3時点で検定するなら,多重比較になりますよね。 ボンフェローニ法に限りませんが,調整するのがよいでしょう。
なお, 前 後 実験群 232 362 統制群 268 336 なら,matrix(c(232, 362, 268, 336), 2, 2) じゃなくてmatrix(c(232, 362, 268, 336), 2, 2, byrow=TRUE)ですよ。検定結果は同じになりますけど。 |
| Re: カイ二乗で,対応がある場合 |
| 投稿者:ぽち 2010/08/06(Fri) 17:20 No. 13227 |
青木先生
お返事ありがとうございます。
私なりに理解したことですが(申し訳ありません,理解力がないかもしれません),たとえば,独立した二つのグループに対して「あなたはコーヒーが好きである」と問い,1「まったく好きでない」〜5「大好きである」の5段階評価の場合は,カイ二乗検定が有意であった場合,残差分析を行う。これまで私がお尋ねしてきたデータの場合,残差分析ではなく,多重比較を行う。
私のデータは,matrix(c(232,362,452,268,336,340),2,3,byrow=TRUE)なのですが,このあと,ボンフェローニ法で調整する場合は,Rではどのような式を使えばよろしいでしょうか?ただいま手元に先生の御著書はなく,またHPで検索できませんでしたので,お尋ねさせていただいております。
何度も申し訳ございません。よろしくお願いいたします。 |
| Re: カイ二乗で,対応がある場合 |
投稿者:青木繁伸 2010/08/06(Fri) 18:06 No. 13228 |
> カイ二乗検定が有意であった場合,残差分析を行う。これまで私がお尋ねしてきたデータの場合,残差分析ではなく,多重比較を行う。
「残差分析を行うときに,多重比較を行う」ということですよ。 残差分析を行うとしているクロス集計表が k 行 m 列だとすれば,セルの数は k × m なので,有意水準 α で検定をしようとするときはそれぞれのセルについての検定を有意水準 α/(k×m) で行う(ボンフェローニ法)のがよいでしょうということ。検定の多重性をちゃんと考えて残差分析を行うというひとは少ないかも知れません(残差分析を行う人も少ないと思うが)。
カイ二乗分布を使用する独立性の検定と残差分析 http://aoki2.si.gunma-u.ac.jp/R/my-chisq-test.html によって分析すると,> summary(my.chisq.test(matrix(c(232,362,452,268,336,340),2,3,byrow=TRUE))) 調整された残差 [,1] [,2] [,3] [1,] -3.1893 -0.45987 3.2744 [2,] 3.1893 0.45987 -3.2744
P 値 [,1] [,2] [,3] [1,] 0.0014261 0.6456 0.0010588 [2,] 0.0014261 0.6456 0.0010588 ボンフェローニ法による多重比較は,有意水準を 0.05/6 ≒ 0.0083 と P 値を比べて判定するということ。
なお,私が最初に書いたのは,残差分析を行うというのは念頭になく(No. 13224で初めて出てきたのだし)「事前,直後,3ヶ月後 の3時点で検定するなら,検定回数は 3 になるので,個々の検定は有意水準 0.05/3 で行わなければならないでしょう」ということですよ。
要するに,ボンフェローニ法は,「一連のひとまとまりの検定結果を述べるとき,個々の検定における有意水準は最終的な有意水準 α を,検定の個数 k で割ったもの(α/k)で行う」ということです。
# 質問は小出しにするのではなく,聞きたいことを明確にし,例も具体例を挙げて(本当のデータである必要はない) 聞くべきです。議論がすれ違うし,時間がもったいない。 |
| Re: カイ二乗で,対応がある場合 |
| 投稿者:ぽち 2010/08/06(Fri) 18:23 No. 13229 |
青木先生
先生のご説明でようやく納得いく理解が得られました。
今回のデータの場合,ボンフェローニ法により,α=0.0083で見なければならない,提示いただいたmy.chisq.testの結果では,幸い p<α となり,実験群の方が,教育効果の持続が見られたということで理解いたしました。(仮に,調整済み残差が1.96を上回り,p=0.03<0.05であっても,ボンフェローニ法を適用した場合(今回のα=0.0083),そこには意味がない。)
質問を小出しに行った件,本当に申し訳ございません。私がもっとよく理解し,整理してからすれば先生にご迷惑をおかけすることもないのですが.....。以後,気をつけたいと思います。
ご指導ありがとうございます。 |
| Re: カイ二乗で,対応がある場合 |
| 投稿者:ひの 2010/08/07(Sat) 07:33 No. 13230 |
議論をちゃんと読んではいないのですが、
>私の実際のデータは,実験群と統制群で「指導前」「指導直後」「3ヶ月後」の正反応の度数ですので
とか、
前 後 実験群 232 362 統制群 268 336
という部分から考えると、これは分割表データではないと思えるのですが…。
>たとえば,独立した二つのグループに対して「あなたはコーヒーが好きである」と問い,1「まったく好きでない」〜5「大好きである」の5段階評価の場合は
この場合は順序尺度なのでU-testでしょう。
|
| Re: カイ二乗で,対応がある場合 |
| 投稿者:ぽち 2010/08/09(Mon) 18:56 No. 13243 |
ひのさん
お返事が大変遅くなりました。
>これは分割表データではないと思えるのですが…。
もし私の解釈が間違っている場合,どのような検定になるのかご教授頂けませんでしょうか?
それから
>順序尺度なのでU-testでしょう
はい,確かにその通りだとは思うのですが,具体的にどのセルが,偏りの差に影響があるのかをみたいのですが,それでもやはり代表値の差を見るU検定なのでしょうか?
よろしくお願いいたします。 |
| Re: カイ二乗で,対応がある場合 |
| 投稿者:ひの 2010/08/09(Mon) 20:03 No. 13244 |
データの内容が明示されていないのでよく分からないのですが、
「正反応の度数」ということで、「正反応でない数」が解析すべきデータの中に示されていないのが気になるのです。普通の分割表なら、
反応+ 反応− 実験群 232 362 統制群 268 336
というような形になると思うのです。「正反応でない数」があるのに表に示していないならそれは分割表としての要件を満たしていません。
>具体的にどのセルが,偏りの差に影響があるのかをみたいのですが,それでもやはり代表値の差を見るU検定なのでしょうか?
その場合はカイ二乗検定ですね。
|
| Re: カイ二乗で,対応がある場合 |
投稿者:青木繁伸 2010/08/09(Mon) 20:18 No. 13245 |
ひのさんのおっしゃるとおり,単純なクロス集計表ではないですね。
前 後 実験群 232 362 統制群 268 336
は,2元配置分散分析で,前後の要因は対応があります。
前 後 実験群 232/n1 362/n1 統制群 268/n2 336/n2
その元となるデータは
対象者 実験群・統制群 前・後 正反応 1 実験群 前 あり 2 実験群 前 なし : i 統制群 後 あり :
要するに二要因2×2で片方が独立,もう一方が対応あり,結果が二値。 注意深く質問を読めばわかったかも知れないけど,問題を明確に示すことも必要。
|
| Re: カイ二乗で,対応がある場合 |
| 投稿者:ぽち 2010/08/09(Mon) 20:27 No. 13246 |
ひのさん
早速お返事頂きありがとうございます。
正反応数は,被験者50名の総数です。正反応が時間を経る毎に変化するのかどうかが知りたいのです。
具体的内容は提示できないのですが,正反応というのは,日本語作文において正しい日本語で一文書けたときに1とカウントされ,例えば,Aクラスに属するある被験者が25文の日本語で日本語作文したとして,25文全て正しい日本語の場合その人の正反応は25となります。また18文の日本語文で作文をした人で,7文しか正しい日本語で書けなかったときには7となります。その正反応(?)をクラス毎に合計して,その総数の変化を見たいわけです。
よろしくお願いいたします。 |
| Re: カイ二乗で,対応がある場合 |
| 投稿者:ぽち 2010/08/09(Mon) 20:37 No. 13247 |
青木先生,データ内容を詳細にしなかったばっかりに先生には余計な時間を取らせてしまいまして申し訳ございません。
次のようなデータだとお考えください。(青木先生が既にお示しくださっているようなものですが.....)
被験者 クラス 指導前正反応 指導直後正反応 3ヶ月後正反応 1 実験群 38 55 67 2 実験群 40 45 47 ・ ・ ・ 25 統制群 42 35 40 26 統制群 41 40 45
これで実験群のそれぞれの時間時の正反応を合計し,度数の偏りを見ようとしていたわけです。
平均値が出せないので(例えば,25文の日本語で作文しなさいと統一していないので),度数でやるのかなと考えました。
よろしくお願いいたします。 |
| Re: カイ二乗で,対応がある場合 |
投稿者:青木繁伸 2010/08/09(Mon) 20:56 No. 13248 |
正反応自体も各条件個体ごとの計数データなんですか? 計数の母数は考えなくていいのですか? もし,客観的な基準での測定値ということなら,それを測定値(従属変数)として「条件(独立)×時期(対応あり)」の二元配置分散分析と言うことになるかな?
でもね,
> 被験者が25文の日本語で日本語作文したとして,25文全て正しい日本語の場合その人の正反応は25となります。また18文の日本語文で作文をした人で,7文しか正しい日本語で書けなかったときには7となります。
という,ややこしいことになってますね。 25文全部正しい人が25で,18しか正しくない人は18だけど,18文で作文して全部正しい人も同じく18になってしまうんですよ。区別しなくていいのですか。おかしくないですか? せめて,「正答率」で考えないとダメじゃないですか?
> 平均値が出せないので(例えば,25文の日本語で作文しなさいと統一していないので),度数でやるのかなと考えました。
だからこそ,「平均正答率」というような考え方が必要なんでしょう?
また,平均正答率を考えればそれですむというようなことではないのですよ。例えば,50文における正答率20%と,5文における正答率20%は,精度(誤差)が違うんですよねえ。同じものとして扱えないんです。
これくらい複雑なデータなら,単純な検定ではなく(検定では対処しきれません),然るべきモデルを立てて適合度を検討するというアプローチを取った方が良いと思います。
どのようなデータなのか,詳細は提示されただけで十分な説明になっているのですか?実験計画は大丈夫なんですか?よ〜く内容を訊かないと,提示された状況・条件だけでああだこうだ言えないような感じですね。なぜ最初から詳しく説明できないんでしょうか。ご当人がこれでいいはずだという思い込みで細部を述べないと言うことなんでしょうか。これでは,うかうかコメントできませんね。というか,コメントしないほうが賢明ですね。 |
| Re: カイ二乗で,対応がある場合 |
| 投稿者:ぽち 2010/08/09(Mon) 22:02 No. 13249 |
青木先生
お返事ありがとうございます。先生からご説明頂きました内容,納得いたしました。
平均正答率,精度の問題,デザインが甘かったです。
もう一度最初から(デザインから)やりなおしてみたいと思っております。
以後,質問させて頂くときには,きちんとデザインを提示して,誤解のないように,あるいはきちんと伝わるようにしたいと思っております。
ご指導ありがとうございました。 |
| Re: カイ二乗で,対応がある場合 |
| 投稿者:ひの 2010/08/09(Mon) 22:48 No. 13250 |
100点満点のテストとは違うけれど、得点データとして扱って良いのではないですか。 得点の決め方が客観的に定義されているなら問題ないと思います。
ただ、個々の被験者の成績の対応がつけられるはずなので対応のある検定にしたほうがいいでしょうね。
|
| Re: カイ二乗で,対応がある場合 |
| 投稿者:ぽち 2010/08/10(Tue) 14:40 No. 13251 |
ひのさん
>100点満点のテストとは違うけれど、得点データとして扱って良いのではないですか。 得点の決め方が客観的に定義されているなら問題ないと思います。
この箇所なのですが,青木先生がご指摘される問題がクリアしないといけないですよね?すなわち,
【青木先生のコメント】 >また,平均正答率を考えればそれですむというようなことではないのですよ。例えば,50文における正答率20%と,5文における正答率20%は,精度(誤差)が違うんですよねえ。同じものとして扱えないんです。
ご指導よろしくお願いいたします。 |
| Re: カイ二乗で,対応がある場合 |
| 投稿者:ひの 2010/08/10(Tue) 17:05 No. 13254 |
まず、データはすでにあって、やり直しが出来ないのか、それともまだ実験計画の段階なのかをはっきりさせましょう。
今あるデータで何とかしなきゃならないなら、その制限のなかで考えざるを得ない。しかしまだ計画段階なら日本語の作文能力を数値的に評価する方法そのものを考え直したほうが良い。
今あるデータを使うなら、正答率に直す必要はなくて各人の正しく書けた日本文の数を得点として良いと思います。得点の上限がないのは特に問題はないと思います。それが日本語を書く能力の評価値として正しいかどうかは別問題ですが、同じ問題はどのような評価方法にもつきまとうことです。
競争試験の場合は、被験者(受験者)に対してどのような基準で評価するかを予め明らかにしておく必要がありますが、このケースではどうでしょうね。「制限時間内に書けた正しい日本文の数を競う」ということにすると、私が受験者ならごく短い正しい文を時間いっぱい無数に書き並べるという手段に出ますね。皆がそうすれば単に文字を書く速さのテストになってしまいます。
|
| Re: カイ二乗で,対応がある場合 |
| 投稿者:ぽち 2010/08/10(Tue) 21:34 No. 13258 |
ひのさん
お返事ありがとうございます。
既にデータはあります。ただやり直した方が良い場合は,やり直す覚悟でおります。
>あるデータを使うなら、正答率に直す必要はなくて各人の正しく書けた日本文の数を得点として良いと思います。得点の上限がないのは特に問題はないと思います。それが日本語を書く能力の評価値として正しいかどうかは別問題ですが、同じ問題はどのような評価方法にもつきまとうことです。
ということなのですが,得点に上限がないもので,平均値をとってもよろしいのでしょうか?統計を十分に理解していないのかも知れませんが,青木先生がご指摘のように,例えば同じ20点でも意味合いが異なってくると思うのですが.....。「得点に上限がないのは特に問題ないと思います」の箇所が,うまく理解できないのですが。申し訳ございませんが,ご説明頂けませんでしょうか。
ちなみに制限時間内にどれだけ書けたかを競うものではありませんが,とりあえず20分間の時間を設けています。繰り返しですが,競争ではありません。
よろしくお願いいたします。 |
| Re: カイ二乗で,対応がある場合 |
| 投稿者:ひの 2010/08/10(Tue) 22:19 No. 13259 |
>得点に上限がないもので,平均値をとってもよろしいのでしょうか?
全く問題ありません。
>例えば同じ20点でも意味合いが異なってくると思うのですが.....。
先の発言に書いたとおり、どのような方法を使ってもこの問題は残ります。「得点」というものがそもそも本来客観的に測定することが不可能な現象を無理やり数値化して評価する方法だからです。たとえば学校のテストで同じ80点をとったとしても、正解した問題と間違えた問題の組み合わせは人によって違うので答案の内容は同じではない。それを無理やり同じとみなして評価するのが「得点」という方式なのです。
どのような評価方法(得点の与え方)が目的に適っているのかは扱っているテーマで異なりますし、統計学以前の問題です。その分野の先行研究をお調べになるのが良いでしょう。
|
| Re: カイ二乗で,対応がある場合 |
| 投稿者:ぽち 2010/08/10(Tue) 22:38 No. 13260 |
ひのさん
いろいろとご指導頂きありがとうございました。
とりあえず,今あるデータを得点として見なし,対応あるデータとして分析を心がけてみます。今後は,青木先生やひのさんからご教授頂きましたことを踏まえて,デザイン段階から気をつけて進めていこうとおもっています。
ありがとうございました。 |
|