No.05461 解析方法について  【GONBEI】 2008/01/21(Mon) 19:58

データ解析について教えてください。

例えば,以下のような例の場合どのように解析したらよいのか教えてください。

薬 を治療群のマウスに投与したところ,5000匹中5匹に有効性が認められた。対照群はプラセボを投与したが,5000匹中有効性は全く認められなかった。 両群をχ2検定を行ったところ,危険率5%で有意差が認められた。しかし,危険率1%では有意差は認められなかった。症例数を上げ,10000匹に投与 し,10000匹中10匹に有意差が認められたとすると,危険率1%でも有意差が認められることになります。5000匹の場合も10000匹の場合も有効 性の比率は同じにもかかわらず,判定は異なりました。
1.これは症例数が多くなり,両群の分布がよりシャープになった(検出力が高まり)ために,有意差検定の判定が異なったと考えてよろしいでしょうか?
2.有効性が認められたマウスはあまりにも少ないので実質的有意差(生物学的有意差)の視点から,被験薬はマウスに有効であると判断しない方がよいと思うのですがいかがでしょうか?
3.統計学的有意差と実質的有意差の両方を満たす症例数と有効数はあるのでしょうか?
例えば,例題では有効率が0.001%ですが,有効率が0.1%以上で,かつ統計学的有意差のあるものが統計学的有意差及び実質的有意差において,有意差が認められるというような場合です。
ご教授の程,よろしくお願い致します。

No.05462 Re: 解析方法について  【青木繁伸】 2008/01/21(Mon) 21:28

>1.これは症例数が多くなり,両群の分布がよりシャープになった(検出力が高まり)ために,有意差検定の判定が異なったと考えてよろしいでしょうか?

そういうことでしょう。
データが多くなれば(サンプルサイズが大きくなれば)情報の精度が向上します。
5人中の3人というのと5万人の中の3万人というのは,データの精度が違うというのは誰でも納得しますね。

> 2.有効性が認められたマウスはあまりにも少ないので実質的有意差(生物学的有意差)の視点から,被験薬はマウスに有効であると判断しない方がよいと思うのですがいかがでしょうか?

有意な差があるというのと,実質的な差があるのとでは意味が違います。
有効率が0.001%の薬を買うかと言われれば,「それはその薬が何に効くかによる」と答えるのが正解でしょう。
風邪薬で0.001%の有効性があるなんていわれても,絶対買いませんよね。
もし(あり得ないですが)不老不死の薬で有効率が0.001%なら,相当価格も高くなるでしょうが,お金持ちの中には「是非買いたい」という人はたくさんいるでしょう(^_^)

> 3.統計学的有意差と実質的有意差の両方を満たす症例数と有効数はあるのでしょうか?

これは前後関係がおかしい。
実質的な有意差があると思う場合に,どれくらいのサンプルを用意すれば統計学的に有意性を示せるというサンプルサイズを求めることはできますよ。以下を参照。
http://aoki2.si.gunma-u.ac.jp/lecture/Kentei/sample-size.html

No.05466 Re: 解析方法について  【GONBEI】 2008/01/22(Tue) 09:44

青木先生,ご回答ありがとうございました。
1.及び2.の回答はよくわかり,すっきりしました。
ただ,3.の回答があまり理解できませんでした。
例では薬についてですが,もしこれが野外でのトリインフルエンザに対するワクチンの有効性試験(死亡数で有効性を判定する)でしたら,どのような設定になるのでしょうか?
一 般的にはαとβ はα=0.05,β = 0.20ですので,このように設定します。あと,各群のPは死亡率(インフルエンザに起因する死亡)でよろしいのでしょうか?もし,Pがそうであるなら, インフルエンザに起因する死亡率は野外で発生するインフルエンザの毒性,蔓延度合いによって変わるので,予想できないのではないでしょうか?

「統計学的に有意性を示せるというサンプルサイズ」は生物学的に意味のあるサンプルサイズと考えてよろしいでしょうか?

ご教授の程,よろしくお願い致します。

No.05467 Re: 解析方法について  【青木繁伸】 2008/01/22(Tue) 10:07

> Pがそうであるなら,インフルエンザに起因する死亡率は野外で発生するインフルエンザの毒性,蔓延度合いによって変わるので,予想できないのではないでしょうか?

その分野の知見を総合して「想定する」のです

「生物学的に意味のある」サンプルサイズであるために各種知見やβの設定も同じく,結果としてそれは「統計学的に有意性を示せる」サンプルサイズになるということです。

No.05474 Re: 解析方法について  【GONBEI】 2008/01/22(Tue) 15:09

青木先生,ご回答ありがとうございました。
>その分野の知見を総合して「想定する」のです
ということですが,野外での発生は想定したよりもかなり違う場合があると思います。

例 題として対照群の死亡率Pが想定で10%としてサンプルサイズを決めて試験を行ったとき,実際は対照群の死亡率が1%で,ワクチン群は死亡率0%としま す。これで統計学的に有意差が認められた場合,生物学的に有意差が認められたと判断していいのでしょうか?発生率が低く,生物学的には有意差はないと思う のですが・・・。実際の死亡率と想定の死亡率がほぼ同じなら,統計学的有意差と生物学的有意差の両方をいうことができるのではないかと思います。いかがで しょうか?
基本的な質問で申し訳ありませんが,頭の中が混乱しています。
ご教授の程,よろしくお願い致します。

No.05475 Re: 解析方法について  【青木繁伸】 2008/01/22(Tue) 15:36

> 「統計学的に有意性を示せるというサンプルサイズ」は生物学的に意味のあるサンプルサイズと考えてよろしいでしょうか?

たとえば相関係数の検定(帰無仮説:母相関係数が0である)
相関係数が 0.1 程度であるとして,検出力 0.8,有意水準 0.05 で「統計学的に有意である」という結論を得るために必要なデータサイズは 783
相関係数 0.1 が実質的な意味を持つかどうかは,固有科学の問題であり,統計学とは無関係。

> 対照群の死亡率Pが想定で10%としてサンプルサイズを決めて試験を行ったとき

それは,実験デザイン(調査計画)がまずかったということだけです。
その結果として,どういうデータが得られて,検定したらどういう結果になったというのとは無関係でしょう。
たぶん想定10%で計画を立てると,もし実際は 1% なら,データが少なく見積もりすぎになっているでしょう。そして,たぶん有意な結果にはならないでしょう。

> 実際は対照群の死亡率が1%で,ワクチン群は死亡率0%とします。これで統計学的に有意差が認められた場合,生物学的に有意差が認められたと判断していいのでしょうか?

よくないです。生物学的有意差(生物学的に意味のある差)と統計学的有意差は無関係です。

> 発生率が低く,生物学的には有意差はないと思うのですが

あなたの考えている通りです。
しかし,繰り返しになりますが,「発生率が低いから」生物学的に有意差がないというのは,普遍的には言えないでしょう。場合によっては,それはとっても意味のあること火も知れませんよ。何たって 1% もあるものが 0% なのだから。という事もないわけではない。

> 実際の死亡率と想定の死亡率がほぼ同じなら

これは「統計学的有意差と生物学的有意差の両方をいうことができる」ということとは関係ないでしょう。

整理しましょう。最初に言ったように。

生物学的意味のある差というのは,固有科学の問題である。
その差を統計学で扱うとき,十分妥当な精度でものを言うことを保証するデータ数は統計学で計算できる。
その差を計算するときに,機械的に決まるものもあるが,固有科学により決めないといけないものもある。
その決定が間違えていると,実験・調査で得られるデータは十分な精度を持たない(データを多く取りすぎる場合はセーフだが,ほんのわずかの差でも有意にしてしまうなどということもあり,困ることがある)。
そこから得られる統計学の結論は正しくないだろう。
それによってなされる生物学上の結論も正しくないだろう。

No.05477 Re: 解析方法について  【GONBEI】 2008/01/22(Tue) 17:14

青木先生,詳細に説明していただきありがとうございました。
よく理解できました。
頭の中がすっきりしました。
感激しています。
本当にありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 041 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る