No.22442 コクラン・アーミテージ検定でのセルごとの数  【木村】 2017/09/19(Tue) 20:32

コクラン・アーミテージ検定で濃度を変えて症状(死亡など)が発生したデータを検定する時。
ある濃度(群)でたまたま極端な外れ値が出て,低濃度で発症した数が低いような場合もあります。

いろいろ頑張って調べたところ。
カイ二乗分布を使っているから発症数が5以上でなければ使えない(発症数が5になるまである濃度でデータ蓄積しなさい)または他の統計手法を使いなさいといったガイドを余所にて見つけました。
セルごとの値はあまり関係無いという海外フォーラムの回答も見つけましたけど,論拠がちゃんと説明されておりません。

サンプルデータとして低濃度で発症数が5未満のもの,または高濃度で未発症数が5未満なものを使ってるサイトも多くみられます。
(たとえば青木さまのサイトでしたら,http://aoki2.si.gunma-u.ac.jp/lecture/Hiritu/Armitage.html にて独立変数10 ケース数30 陽性数2のデータセットで解説されております)

セル内で5未満の値になるデータで,コクラン・アーミテージ検定を使っていいものでしょうか?
第一種過誤はデータの総数が少なかったとして扱うつもりです。

No.22443 Re: コクラン・アーミテージ検定でのセルごとの数  【青木繁伸】 2017/09/19(Tue) 21:36

> カイ二乗分布を使っているから発症数が5以上でなければ使えない

これは,独立性のカイ二乗検定から来ているのかも知れませんが,それならば,「発症数」ではなく「発症数の期待値」のはずですが。

そのように書かれているページの URL を教えてください。

No.22444 Re: コクラン・アーミテージ検定でのセルごとの数  【木村】 2017/09/20(Wed) 18:41

知人に相談したところ先日そのような趣旨でアドバイスされ,必死にぐぐって「セル内の数字が5未満では」と記載されたサイトを5つ見つけまして,いま必死に検索したものの全部は見つかりませんでした申し訳ありません。
ただただ,わが身の浅学と理解の浅さを恥じ入るばかりです。

医学統計勉強会 - 東北大学病院 - 循環器内科
>Cochran-Armitage 検定はχ2 分布を用いた近似検定であるので,セルの数が小さいときは他の性格検定を用いる必要があります.
http://www.cardio.med.tohoku.ac.jp/newmember/pdf/ms/16_5T.pdf

ちょっと違いますけど
Is the Cochran Armitage Trend Test valid, if any of the counts are less than 5?
https://www.researchgate.net/post/Is_the_Cochran_Armitage_Trend_Test_valid_if_any_of_the_counts_are_less_than_5

No.22445 Re: コクラン・アーミテージ検定でのセルごとの数  【木村】 2017/09/27(Wed) 20:11

こちら以外にも友人に相談したりしましたけれど,駄目とも良いともいえず。

色々と考えて結局,これをもって後々文句つけられたりした際に,これでは私どもは批判者に対して適切な対応できませんし。
「セル内で5未満の値になるデータ」は追試して全部5以上になるように満たしてからまたコクラン・アーミテージ検定を用いる事といたしました。

解決に至りませんでしたけど,ご返信ありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 048 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る