「統計学関連なんでもあり」の過去ログ--- 039

No.00743　対応のない2群間の比較　　【吉右衛門】　2006/07/27(Thu) 23:04

はじめまして。統計は超苦手のため極めて初歩的なことをお尋ねします。
分子生物学の研究室で実験をしています。
たとえばある試薬をいれた場合と入れなかった場合の実験データの変化をみた実験を3回行ったとして，各条件別のデータの平均を比較する場合，2群間のデータの平均に有意差があるかどうかの検定を行いたいのですが，教科書的にみると，n数がこのぐらい少ないデータではデータの分布の正規性が通常認められないのでノンパラメトリック検定(Wilcoxon順位和検定でよいかと思います)を行えばよいものと考えていました。
しかしながら，Nature等のメジャー誌の実験結果の統計学的処理の方法にはたいていStudent-t testで検定したと表記されております。常識的に一つの実験をデータが正規分布することを確認できるまで複数回繰り返すことはないと考えています。
冒頭にあげたような実験結果の統計学的処理はt検定でよいのでしょうか?　だめなら，多くの論文にのっている検定方法はじつは間違っていると考えて良いのでしょうか?

No.00744　Re: 対応のない2群間の比較　　【青木繁伸】　2006/07/27(Thu) 23:17

正規分布する必要があるのは，標本値ではないです。

母分布が正規分布でないといけないだけです。
母分布が正規分布に従うかどうかは，標本で確認できなくても良いんです。
理論的に仮定できればそれで十分。
母分布が分からない場合には，かなり大きい標本を採って標本分布から母分布を推定し正規分布に従っているかどうかを判断しなきゃならないわけですが。
まあ，それにしても，片手くらいのサンプルサイズでは，ちょっとね～，とは思いますが。検定はできても，検出力がめちゃくちゃ低いのではないかなと思います。
パワーアナリシスしてみたらいかがでしょぅ。

でも，理想ばかり言っても，実際にデータがとれないんじゃ，絵に描いた餅ですね。

No.00748　Re: 対応のない2群間の比較　　【吉右衛門】　2006/07/28(Fri) 09:20

ありがとうございました。以下の点について確認させて下さい。

>理論的に仮定できればそれで十分。
一般的に自然科学の実験データ(生データ)というものは正規分布すると考えて良いのでしょうか。
論文中にStudent-t testが当然のように引用されていますが，母分布を想定できるような標本数をとっていることは考えにくく，実験データは正規分布するものだといういわゆる「定説」(？)のようなものを前提に行っているように思います。血液検査の生化学データなどでは対数変換などの処理をしないとデータが正規分布しないことがあると聞いたことがあります。また，データの正規性についても「正規分布していないときは対数変換してみて正規分布することがあるのでやってみてうまくいけば，変換したデータで検定する」と書いてあるサイトもありましたがこういうものなのでしょうか。理論的に仮定できるような場合とはどういった場合でしょう？

>パワーアナリシスしてみたらいかがでしょう。
>
>でも，理想ばかり言っても，実際にデータがとれないんじゃ，絵に描いた餅ですね。

パワーアナリシス(検定力分析)についてですが，ちょっとインターネットで調べてみましたが，詳しく書いてあるサイトがなく，方法もよくわかりません。もしかして，効果サイズにあわせた検定を行うのに十分な標本の数を推定するところから検討しなければならない話なんでしょうか？

なにぶん，わからないことだらけなのでよろしくご教示下さい。

No.00749　Re: 対応のない2群間の比較　　【青木繁伸】　2006/07/28(Fri) 11:12

純粋理論的に母分布が正規分布に従うということが言える場合はそう多くはないかも知れません。身長なんかはいろいろな要因が作用しているので，個人の中で中心極限定理が働いて正規分布に近いかも知れませんね。

多くの場合は，過去の膨大なデータの蓄積でどのような分布に近いかがだいたいわかるのかも知れません。

血中濃度や刺激に対する反応なんかは理論的に対数正規分布に従うと言える場合もある。

パワーアナリシスは事前と事後の両方で行うことができるが，R でやってみると以下のようになりますね。
例数が両群等しく3例ずつ。データの標準偏差が1で，平均値に1の差があるとする（平均値に標準偏差分の差があるというのは相当なことですよね）。二群の平均値に差があるか有意水準5％で両側検定を行う
> power.t.test(n=3, delta=1, sd=1, sig.level=0.05, type="two.sample", alternative="two.sided", strict=TRUE)

     Two-sample t test power calculation 

              n = 3
          delta = 1
             sd = 1
      sig.level = 0.05
          power = 0.1587909
    alternative = two.sided

 NOTE: n is number in *each* group 
なんと，検出力は power = 0.1587909 ですよ。有意という結果が得られる確率は16％しかない。実験をやる気力が失せませんか？

検出力を 0.8 にするために何例必要かをやってみると（strict=TRUE は失敗するので外す）
> power.t.test(delta=1, sd=1, sig.level=0.05, type="two.sample", alternative="two.sided", power=0.8)

     Two-sample t test power calculation 

              n = 16.71477
          delta = 1
             sd = 1
      sig.level = 0.05
          power = 0.8
    alternative = two.sided

 NOTE: n is number in *each* group 
17例ずつ必要と言うことですね。平均値の差が小さいともっともっと必要になりますね。

No.00751　Re: 対応のない2群間の比較　　【吉右衛門】　2006/07/28(Fri) 11:51

迅速なレスポンスの上，詳細に解説頂き，本当にありがとうございました。
まだまだ統計についてたくさん勉強しなければなりませんが，大変参考になり助かりました。
また，なにかわからないことがあれば書き込みします。