No.14292 追加 【榔埼】 2011/02/10(Thu) 00:23
上の方法は誤っているのでしょうか。
http://aoki2.si.gunma-u.ac.jp/lecture/Cross/differenceofdist.html
の例題を上の方法に準じて行ってみました。
男のA,B,O,ABの頻度は
A, 0.363636364
B, 0.272727273
O, 0.290909091
AB, 0.072727273
これを女性35名に当てはめると,各血液型の人数は
A, 12.7272727 (35*0.363636)
B, 9.54545454
O, 10.18181818
AB, 2.54545454
これを期待値として女性の実測値
A, 15
B, 7
O, 9
AB, 4
を用いてエクセルでカイ二乗検定chitestを行ったところ
P=0.56で上記URLのP=0.75
とは異なっていました。
No.14293 Re: カイ二乗検定の使い方 【青木繁伸】 2011/02/10(Thu) 08:21
> エクセルでカイ二乗検定chitestを行ったところ P=0.56 で上記URLの P=0.75 とは異なっていました。
検定手法の説明をたどれば,どこで違いが出てきたか,わかるでしょう。
3. 全体としてみたとき,ある個体が第 j カテゴリーに属する確率は tj / n である。
のところが違うでしょう。
基準とする割合の違いです。分布の違いを見る場合には総てのデータに基づいた割合ですが,あなたがやったのは,どれかの群の割合です。あなたは今回男での割合を使いましたが,女の割合を使って男のデータを検定するとまた別のP値が出るでしょう?
> 1回の試行で○か×のどちらかが得られる実験。
こ のデータは,厳密には検定になじまないものでしょう。統計データは,それぞれが独立である必要があります。同じ人に何回も繰り返す場合,それぞれのデータ は独立ではありません。測定対象が同じ場合(例えば短時間内に採血を繰り返し,その検査結果を得るような場合)は独立ではないのが明らかでしょう。そうで はなくて,例えばいくつかの単語を提示してその意味を知っているかどうかの試験をするような場合でも,個々の単語の正解/不正解は独立とは言えないでしょ う。特に,貴方が示したように,比較する2組のデータのサンプルサイズが異なる(当然測定対象が違う)ような場合は問題が大きくなるでしょう。測定対象を 同じにし(先の例では同じ単語を提示し),対応のあるデータとして扱うべきでしょう。
No.14294 Re: カイ二乗検定の使い方 【ひの】 2011/02/10(Thu) 11:42
>このデータは,厳密には検定になじまないものでしょう。統計データは,それぞれが独立である必要がありま す。同じ人に何回も繰り返す場合,それぞれのデータは独立ではありません。測定対象が同じ場合(例えば短時間内に採血を繰り返し,その検査結果を得るよう な場合)は独立ではないのが明らかでしょう。
サイコロを振るような試行であれば,独立と考えて差し支えないのでは?
No.14295 Re: カイ二乗検定の使い方 【青木繁伸】 2011/02/10(Thu) 12:59
> サイコロを振るような試行であれば,独立と考えて差し支えないのでは?
サイコロ振りは独立だと思います(独立でないと困りますね)
No.14350 Re: カイ二乗検定の使い方 【榔埼】 2011/02/20(Sun) 23:09
どこが良くない考えかも含めて,教えて頂きありがとうございました。
お礼が遅くなり申し訳ありませんでした。
● 「統計学関連なんでもあり」の過去ログ--- 044 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る