No.14023 確率・発症率の意味  【bany】 2010/12/22(Wed) 03:02

統計学をきちんと学んだことがなく自学自習で進めてきたのですが,基本的な意味が理解できていないようで,恥ずかしながら質問させていただきます。

1:病気の発症率,発症確率,罹患率といった言葉は同じ意味でしょうか。

2: 発症率が5%という場合,あるリスク要因を持っている100人のうちおよそ5人が発症する可能性があるという意味でしょうか。あるいはそのリスク要因を 持っている個人Aさんが発症する可能性が5%あるということなのでしょうか。たとえば喫煙による肺がんの発症率は70%という場合,喫煙者10人のうちお よそ7人が肺がんになる可能性があるということなのか,喫煙者Aさんが肺がんになる可能性が70%あるとうことなのか,あるいはこの2つは同じ意味なの か。

サイコロを投げたときに3の目が出る確率1/6というのは,600個のサイコロを投げたときに3の目が出たサイコロの個数がおよそ 100個に近くなる(または,ひとつのサイコロを600回投げたときに3の目が出る回数がおよそ100回程度になる)あるいは,1つのサイコロを投げると きに必ずいずれかの目が出るわけですが,そのサイコロが3の目を出す能力がその全能力の1/6にあたるということなのでしょうか。

降水確率という場合は過去のデータについて前者のように考えているのではないかと思うのですが…。

3:ロジスティック回帰分析の説明を読むと0/1データからある確率が予測できるように読めるのですが,この確率というのはどちらの意味でしょうか。

統計学の基本的な本をいくつも読んできたのですが,本当に基本的なことがわかっていないようです。

No.14024 Re: 確率・発症率の意味  【青木繁伸】 2010/12/22(Wed) 06:58

「罹患率」は,厳密な定義があります。特定の期間内に集団に新たに生じた疾病の症例数を分子,特定の期間内にその 疾病に罹患する危険性のある人口を分母とした割合です。「はしか」のように,一度罹患した疾病には二度とかからないような場合には,分母には「はしか」に かかったことのある人は含まれないことに注意。「発症率」,「発症確率」も同じことを表すものでしょう。なお,疾病ではない場合は「発生率」と同義で,発 生する事象が死亡の場合は「死亡率」で,人間は死ぬ運命にあるので,この場合は分母は全人口(死を免れる人はいないので)になります。そのほかの例として は交通事故などは発生率ですね。関連するものとして有病率。これは,期間内に病気であった人の割合で,分母は全人口,分子は,期間前から病気であった人 と,期間内に新たに病気であった人の合計。

発症率が5%ということは,100人中5人が発症することとある人が発症する確率が5%(0.05)であることは同じです。つまり,ある人が100人中の5人に入っているかどうかですから。ただし,一般の人に説明するときは,前者のほうが理解されやすいでしょう。

サ イコロの3の目が出る確率が1/6というのも,600回投げるとほぼ100回出るというのと同じことです。降水確率というのも同じです。「過去のデータに ついて前者のように考えている」というような特別なものではないです。ただし,「降水」の定義が特別のものではあります。

ロジスティック回帰による予測の場合の確率も同じことです。

No.14025 Re: 確率・発症率の意味  【ひの】 2010/12/22(Wed) 11:51


>関連するものとして有病率。これは,期間内に病気であった人の割合で,分母は全人口,分子は,期間前から病気であった人と,期間内に新たに病気であった人の合計。

 現実のデータはそうなのでしょうが,概念的にはこれは時間の次元を含まない値ですね。つまり「期間」の長さが0であることが理想(現実にはそのようなデータは取れないけれど)。「罹患率」や「死亡率」は単位時間あたりの量なので時間の次元を含んでいます。

No.14026 Re: 確率・発症率の意味  【青木繁伸】 2010/12/22(Wed) 12:32

蛇足で余計なことを書きましたが,書いたのは期間有病率。期間の長さが0(とは言わないまでも極力短い)の場合は,点有病率。

> 「罹患率」や「死亡率」は単位時間あたりの量なので時間の次元を含んでいます。

分子も分母も「期間内」という時間の次元を持っているので,割り算の結果,時間の次元はなくなっていると思うんですけど。
例 えば,サイコロを振る実験でも,数百回の試行による事象の観察には一定の時間がかかるわけで,死亡率や罹患率のように年や月のように長い時間単位ではない ですが,本質は同じだと思うんです。にもかかわらず,前者の場合には時間は問題にされず後者は「時間的要因を含んだ特殊な形の比率」というような形容詞が つくのかよくわからない。もっとも,一年もかかると,死亡や罹患に影響を及ぼす原因の方が一定ではないのと分母の人口も時々刻々変化している(まあ,平均 人口や年央人口を使うけど)ので,サイコロの場合とは当然違いはあるのはわかりますけど。

No.14027 Re: 確率・発症率の意味  【ひの】 2010/12/22(Wed) 12:45

>分子も分母も「期間内」という時間の次元を持っているので,割り算の結果,時間の次元はなくなっていると思うんですけど。

 時間の次元を持たないなら,期間の長さにかかわらず同じ値になるはずですが,1日あたりの死亡率と,1年あたりの死亡率は,値が全く違うでしょう?これは同じ速さを秒速で示すか時速で示すかの違いと同じです。

 死亡率の分母の人口は時間の次元を持っていません。期間内に変化するのだから値が定まらなくなってしまう。通常は期間の最初の瞬間の人口とするはずです。

 死亡率 = 期間内の死亡者数 ÷ 期間のはじめの人口 ÷ 期間(時間)

だと思います。通常ひとつの議論の中では「期間」の値は一定で変化しないので無視されることが多いだけです。

No.14028 Re: 確率・発症率の意味  【青木繁伸】 2010/12/22(Wed) 12:57

> 通常は期間の最初の瞬間の人口とするはずです。

そうですね。分母は延べ人口ではなく,定数ですね。通常は年央人口を使いますが,場合により,年央からの時間差で推定した人口を使うこともあります。

No.14029 Re: 確率・発症率の意味  【bany】 2010/12/23(Thu) 01:12

早速のご返信ありがとうございます。本を読んだり,インターネットで検索したりしているのですが,どうも腑に落ちないというかうまく飲み込めない状態が続いていたもので,つまらない質問をさせていただきました。本当に申し訳ありません。

統計を専門に研究されている方とはちがい,勉強不足の私にとっては2つの意味が同じということがわからず,本を読んでいても途中で議論がすりかわったように思えて,何冊か基本書を読むたびにもやもやが増している状態です。

>発症率が5%ということは,100人中5人が発症することとある人が発症する確率が5%(0.05)であることは同じです。つまり,ある人が100人中の5人に入っているかどうかですから。ただし,一般の人に説明するときは,前者のほうが理解されやすいでしょう。

ある個人はもちろん任意の個人でしょうから,100人のいればどの1人についても言えることだということですね。

もっ と母数が大きい方がより正規分布に近づくという意味で,たとえば数万人規模の受験者がいる大手予備校などの実施している全国模試などを受けてみた結果,あ る成績Xを取ってその成績では東大合格の可能性が30%だったとすると(5%というのは少しさみしいので少しあげてみましたが,この程度のことも理解して いない私の場合なら5%程度でしょうかw),

(1)その成績Xもしくはその前後の一定の範囲にいるA人のうち30%は東大に合格する可能性がある

(2)その成績Xもしくはその前後の一定の範囲にいる任意の1人が東大に合格する能力は30%程度である

ということが同じことを表しているということですね,
と,あれ?ここまで書いてきて(1)はおかしいな。成績(もしくはその成績をとる学力)という要因は誰もが一定もっていてその要因の程度によって,東大合格という事象が生じると考えると,(1)ではなく,

(3)1位の成績の学生からその成績Xまでの学生の人数を分母として,そのうち東大に合格する人数を分子とするとそれがおよそ30%になっている

という方が正しいという理解でよいわけですね。

● 「統計学関連なんでもあり」の過去ログ--- 044 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る