★ incidence rateの検定 ★

8350. incidence rateの検定 ひらい 2005/11/15 (火) 14:43
└8352. Re: incidence rateの検定 青木繁伸 2005/11/15 (火) 15:06
 └8358. Re^2: incidence rateの検定 ひらい 2005/11/15 (火) 17:34
  └8396. Re^3: incidence rateの検定 マスオ 2005/11/19 (土) 12:14


8350. incidence rateの検定 ひらい  2005/11/15 (火) 14:43
疫学でincidence rate(発生率あるいは罹患率と訳されるようです)は,ある集団における(例えば病気のような)調査事象の発生の率と定義され,分母は観察対象集団の各メンバーの観察期間合計となるそうです。

例えば,6人の健康で喫煙習慣のある50歳の男性を5年間観察して,ガンの発生率を求める場合は,以下の様になります。

N 12345(年目)
A -----
B ---**
C ----*
D --***
E -----
F *****

注)
 N列はサンプル番号
 1〜5列はガン発生の有無(*で発生)

ガンの発生  :4(人)
観察期間の合計:19(人年)
 → Aの5+Bの3+Cの4+Dの2+Eの5+Fの0

発生率は,4(人)/19(人年)=0.21/年となり,年間100人中21人がガンを発症するということになります(多すぎますが・・・)。

さてここで,喫煙習慣のある50歳の男性を,コーヒーを毎日飲む習慣の有無で2群に分け同様に調べたところ,以下のようになった場合,統計的に有意な差があるか検定したいと思います。

コーヒー有(A群):20(人)/200(人年)=0.100/年
コーヒー無(B群):30(人)/240(人年)=0.125/年

この場合,青木先生が解説されている二群の比率の差の検定(http://aoki2.si.gunma-u.ac.jp/lecture/Hiritu/diff-p-test.html)を用いることができるのでしょうか?

と いうのも,もしある1時点での(例えば5年後など)ガンを発症している人の割合であれば(これを有病率と呼んで区別するそうです),問題ないと思うのです が,発生率の場合は,求めた比率の分子と分母の単位が異なるため,当てはめていいものかどうか悩んでします。あるいは,もっとほかの検定方法を採用するべ きなのでしょうか?

ご回答あるいは何かヒントとなるような情報をいただければと思い投稿させていただきました。よろしくお願い致します。

     [このページのトップへ]


8352. Re: incidence rateの検定 青木繁伸  2005/11/15 (火) 15:06
人年で表されるようなデータは比率の差の検定などは適用できません。
同じデータを人月で表しても,全く意味合いは同じなのに,数値は違ってくると言うことからも変だとわかりますね。

このようなデータはロジスティック回帰分析などを行う方が,データを活用していることになるでしょうね。

     [このページのトップへ]


8358. Re^2: incidence rateの検定 ひらい  2005/11/15 (火) 17:34
> このようなデータはロジスティック回帰分析などを行う方が,データを活用していることになるでしょうね。

青木先生

ご 回答ありがとうございます。ご指摘の内容は,発生率で(この場合コーヒーのガン予防効果を)比較して統計的に差があるか検討するのではなく,ロジスティッ ク回帰分析を行うということにより,(他の因子も含め)因果関係の有無を調べたほうがよいという理解でよろしいでしょうか?

逆に言えば,人年で表されるincidence rateのような数値は,どの様な検定も適応できず(というかそういう指標ではなく),あくまでも数値を把握するというものだと理解しました。

他の方法としては,累積罹患率(cumulative incidence)であれば(この場合,例えば5年間にガンとなった人は,A群とB群でそれぞれ20人/100人と30人/100人など),カイ二乗検定も適応可能でしょうか・・・。

     [このページのトップへ]


8396. Re^3: incidence rateの検定 マスオ  2005/11/19 (土) 12:14
疫学は用語の定義からしてよくわかっていませんが,医学統計学ハンドブック(朝倉書店)の疫学のところに載っているのがそれかと思います.

発生率の場合は,
2群の発生数をa,b,その観察時間合計(人時間)をそれぞれ m1,m2とすると,

x=a,n=a+b,p=m1/(m1+m2)

の二項確率になるようで,二項検定と,カイ2乗値を使った検定が示されています.
提示例は,Rでは,

binom.test(x=20,n=20+30,p=200/(200+240))

Exact binomial test

data: 20 and 20 + 30
number of successes = 20, number of trials = 50, p-value = 0.4797
alternative hypothesis: true probability of success is not equal to 0.4545455
95 percent confidence interval:
0.2640784 0.5482060
sample estimates:
probability of success
0.4

でしょうか.

また,発生割合の場合は,通常の比率の差の検定と同じになるようで,Fisherの直接法とカイ2乗検定が示されています.(累積罹患率(cumulative incidence)と同じものでしょうか?)

いずれにせよ私の誤解や前提条件などあるといけませんので,疫学の専門書にあたることをお勧めします.

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 035 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る