No.11644 多群間の比較方法とその表記方法  【卒業浪人】 2010/01/05(Tue) 20:23

質問させていただきます。
対象患者の年齢で4群にわけ,各群の細胞面積を計測しそれぞれに差が見られるかを検討したいのですが,解析方法が今ひとつわかりません。
各群の症例数は,1群:6,2群:7,3群:3,4群:10の合計26例です。
そ れぞれの素データ(ばらばらですが1例につき約300個あります。)を用いて,一元配置分散分析法を行い差が認められたら多重比較検定の Scheffe’s F testを行いました。ソフトの関係上他にTukey―KramerとBonferroni/Dunnとが行えるようなのですが,有意差がでにくい方法で 有意差がでれば一番説得力があるかなと考え,Scheffe's F testを選びました。
   データ数  平均値   標準偏差
1群: 963 36.1  13.6
2群: 852 40.0 12.6 
3群: 523 39.6  15.8
4群:1027 46.0  15.1
で1群と2,3,4群。2,3群と4群。で有意差はあるようなのですが,平均値のグラフを見るとあまり変化がないのにどうして有意差が見られるのか不思議でなりません。
解析方法が間違っているのでしょうか。 
また,分散分析法と多重比較検定の論文での表記法をお教え下さい。
ご指導よろしくお願いいたします。

No.11645 Re: 多群間の比較方法とその表記方法  【青木繁伸】 2010/01/05(Tue) 21:22

> 平均値のグラフを見るとあまり変化がないのにどうして有意差が見られるのか不思議でなりません

データ数が大きいからでしょう。検定統計量の計算式を見ればわかりますが,検定統計量が大きくなるのは,差の大きさのほかに,データ数の大きさも関係することがわかるでしょう。
な お,「各群の症例数は,1群:6,2群:7,3群:3,4群:10」であるにも関わらず,「1例につき約300個」のデータが使われているので,この 「データ数」は水増しされたものであるということになります(正当なデータ解析ではないということでしょう)。どのようにすればよいかと言うことについて は異論があるでしょうけど,各群の各例ごとに平均値を取り,6,7,3,10個の平均値の平均値に差があるかをみるというやり方もあるやもしれません。な ぜ水増し例数が好ましくないかは,もし,各例300個の測定値で有意でなければ,600,1000個と繰り返し測定をするだけで有意であるという結果を得 ることができるからです。本来的に各例数の測定値(の平均値)はいくら測定回数を増やしても変化するわけではないですからね(標準誤差は小さくなるけど。 そして,標準誤差は小さくなるので,元データの分布はかなり重なっていても,平均値の分布(標準誤差)は狭くなり,そのため平均値に差があると言うことに なるのです)。

No.11650 Re: 多群間の比較方法とその表記方法  【卒業浪人】 2010/01/06(Wed) 13:13

職場でしかインターネットにアクセスできず,返信が遅れましたこと深くお詫び申し上げます。
青木先生,丁寧な解説ありがとうございます。

> 「各群の症例数は,1群:6,2群:7,3群:3,4群:10」であるにも関わらず,「1例につき約300個」のデータが使われているので,この「データ 数」は水増しされたものであるということになります(正当なデータ解析ではないということでしょう)。〜各群の各例ごとに平均値を取り,6,7,3,10 個の平均値の平均値に差があるかをみるというやり方もあるやもしれません。

それで行ってみると有意差が認められず,先生がおっしゃる水増 しした方法での解析を行ってしまいました。では,各群ごとにランダムに300個なら300個ずつ抽出し解析を行うというのはどうでしょうか。ランダムに データを抽出する方法もできればお教えていただきたく存じます。

No.11652 Re: 多群間の比較方法とその表記方法  【青木繁伸】 2010/01/06(Wed) 13:19

ランダムであろうと同数ずつであろうと,水増しにかわりはありません。

No.11665 Re: 多群間の比較方法とその表記方法  【卒業浪人】 2010/01/07(Thu) 11:53

納得いたしました。各群の症例数を増やしか正当な解析は行えないということなんですね。
ありがとうございました。

No.11673 Re: 多群間の比較方法とその表記方法  【太郎】 2010/01/08(Fri) 10:03

>有意差がでにくい方法で有意差がでれば一番説得力があるかなと考え,Scheffe's F testを選びました。

Scheffe's F testは,処理間のすべての対比について検討を行うため,対比較の検出力はかなり低くなります。

対比較(全処理中のすべてのペア(2処理)の比較)のみを問題にするなら,そのための手法,たとえばTukeyなどを用いるべきです。

説得力を持たせたいなら,有意水準を厳しく(1%とか0.1%とか)した方がいいでしょう。

● 「統計学関連なんでもあり」の過去ログ--- 043 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る