★ Re: χ2 分布による適合度の検定 ★

 404 Re: χ2 分布による適合度の検定   青木繁伸  2001/10/16 (火) 23:31
  405 Re^2: χ2 分布による適合度の検定   青木繁伸  2001/10/16 (火) 23:39
   407 Re^3: χ2 分布による適合度の検定   mmm  2001/10/16 (火) 23:47
   406 Re^3: χ2 分布による適合度の検定   青木繁伸  2001/10/16 (火) 23:47
    408 Re^4: χ2 分布による適合度の検定   mmm  2001/10/16 (火) 23:50
      413 論文に数を書きましょう!  DISIR  2001/10/17 (水) 12:07


404. Re: χ2 分布による適合度の検定   青木繁伸  2001/10/16 (火) 23:31
> 非常に基本的な質問で申し訳ございません。
> χ2 分布による適合度の検定を行う際に,理論値,実測値の各数値の単位がパーセントの場合,パーセント単位(つまり数値*100)の数値に基づき,検定を行うべきなのか,生の数値(例えば0.01と0.02の違いを検定)に基づき,検定を行うべきなのか教えていただけませんでしょうか。結果は,当然パーセント単位で行った方が差異が出てきます。

よく理解できないのですが,実際の数値例で示してください(差し支えがあるなら,架空例でいいですから)。

パーセント単位とか生の数値とかがどういうことなのか,わかりません。

適合度の検定は,度数についての検定ですからそこになんでパーセントなんかが関連するのでしょうか。

例: メンデルの法則 表現型が 9:3:3:1 か?
実測値: 15      6      4      2
期待値: 15.1875 5.0625 5.0625 1.6875
実測値は観察数(度数)です。
期待値は 27*(9/16)=15.1875 などです。

     [このページのトップへ]


405. Re^2: χ2 分布による適合度の検定   青木繁伸  2001/10/16 (火) 23:39
> 実測値: 15      6      4      2
> 期待値: 15.1875 5.0625 5.0625 1.6875

これを,
15/27,6/27,4/27,2/27 と
15.1875/27,5.0625/27,5.0625/27,1.6875/27 というようにして(ここでは分数のままにしておきますが),検定に使うのか
それらを100倍してパーセント表示した
15/27*100,6/27*100,4/27*100,2/27*100 と
15.1875/27*100,5.0625/27*100,5.0625/27*100,1.6875/27*100 として検定するかということでしたら,それはどちらも間違えています。

     [このページのトップへ]


407. Re^3: χ2 分布による適合度の検定   mmm  2001/10/16 (火) 23:47
> > 実測値: 15      6      4      2
> > 期待値: 15.1875 5.0625 5.0625 1.6875
>
> これを,
> 15/27,6/27,4/27,2/27 と
> 15.1875/27,5.0625/27,5.0625/27,1.6875/27 というようにして(ここでは分数のままにしておきますが),検定に使うのか
> それらを100倍してパーセント表示した
> 15/27*100,6/27*100,4/27*100,2/27*100 と
> 15.1875/27*100,5.0625/27*100,5.0625/27*100,1.6875/27*100 として検定するかということでしたら,それはどちらも間違えています。

今やろうとしていることは,実測値が度数ではなくX-X,X-Y毎の確率で得られていて,期待値も同じく確率で得られているケースにおいて,実測値の期待値との差異を検定したいということです。この場合,どのような検定を行えばよいのでしょうか?

     [このページのトップへ]


406. Re^3: χ2 分布による適合度の検定   青木繁伸  2001/10/16 (火) 23:47
元の観測度数が明示されていなくて,

観測値:  0.5  0.2  0.2  0.1
期待値:  0.4  0.3  0.25 0.15
というデータしかなくて,それを%で表したときの
観測値:  50%  20%  20%  10%
期待値:  40%  30%  25%  15%
とどちらを使うのがいいかということでしたら,そのような検定はできません。
少なくとも全体の観察数(合計数)があれば,合計と上述の割合または%を掛ければ各カテゴリーの度数が計算できるので検定は可能でしょう。

合計数が分からないときに,適当に合計数を仮定してもだめです。
合計数が100であるときと,1000であるときの計算をしてみればわかりますが,計算されるカイ二乗値は合計数と比例してしまいますから。

     [このページのトップへ]


408. Re^4: χ2 分布による適合度の検定   mmm  2001/10/16 (火) 23:50
> 元の観測度数が明示されていなくて,
>
> 観測値:  0.5  0.2  0.2  0.1
> 期待値:  0.4  0.3  0.25 0.15
> というデータしかなくて,それを%で表したときの
> 観測値:  50%  20%  20%  10%
> 期待値:  40%  30%  25%  15%
> とどちらを使うのがいいかということでしたら,そのような検定はできません。
> 少なくとも全体の観察数(合計数)があれば,合計と上述の割合または%を掛ければ各カテゴリーの度数が計算できるので検定は可能でしょう。
>
> 合計数が分からないときに,適当に合計数を仮定してもだめです。
> 合計数が100であるときと,1000であるときの計算をしてみればわかりますが,計算されるカイ二乗値は合計数と比例してしまいますから。

大変ご丁寧なお返事ありがとうございました。私の勘違いの元が明らかになりました。今回のケースでは,合計数が分かりますので割合にかけてやって度数にしてやる必要があるということが分かりました。失礼致しました。

     [このページのトップへ]


413. 論文に数を書きましょう!  DISIR  2001/10/17 (水) 12:07
直接このスレッドの質問者には関係しないかもしれませんがいい機会なのでお願いです。
論文でパーセントだけ書いた表をたまに見かけますが,少なくとも総数は表中か脚注に書いてほしいです。
あとで複数論文の結果をまとめる際にパーセントのみだと利用しにくいです。
結果の文章をじっくり読めば,文中に書いてある場合もあるのですが,欧文の論文を隅々まで全部読むのはつらいので,皆様及び周りの方々に推奨お願いします。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 015 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る