「統計学関連なんでもあり」の過去ログ--- 043

No.11751　擬似反復？　　【ＣＪ】　2010/01/19(Tue) 20:02

組織切片中にある特定の細胞種を見つけてきて，その直径を計ることを考えます。5匹の動物でこの作業を行い，n1,n2,n3,n4,n5個の細胞を（ランダムに）抽出できたとします。
直径の平均値，標準偏差がそれぞれm1-m5, s1-s5と算出でき，m1からm5までの平均値に統計的な有意差があるかどうかは例えばANOVAで行うことができると思います。ここでm1からm5に有意差が検出できなかったとき，5匹のデータをまとめてn1+n2+...+n5個のデータとしてしまうことは悪い作法となるのでしょうか？
これがまずい，となると，データ数は5つとなるわけですが，この場合データは平均値をもとに扱うことになるのでしょうか？つまり，m1からm5の平均を全体の平均とし，m1からm5の標準偏差を全体の標準偏差とするのが正しいでしょうか？この際に疑問となるのは動物1-5に存在した標準偏差の情報(s1- s5)が消えてしまうことです。

（例えば実験群5匹と対照群5匹で細胞の直径に差があるか？といった類の検定を行うことを考えた上での質問です。

よろしくお願いします。

No.11753　Re: 擬似反復？　　【波音】　2010/01/19(Tue) 23:02

同一の個体から繰り返しデータを得たのであれば：

ラットA　→　1つ目の細胞, 2つ目の細胞, ..., iつ目の細胞
ラットB　→　1つ目の細胞, 2つ目の細胞, ..., jつ目の細胞

というようになっているわけですから，i + jをサンプルサイズだとして通常通りの分散分析（独立性を仮定した分散分析）をしてしまうと，擬似反復を犯していることになりますね。

ちょうど似たような解析例を使った解説が「Statistics: An Introduction using R」という本に書いてありますが，Google Bookだとドンピシャでそのページが見ることができなくなっています。。。

日本語訳された「統計学：　Rを用いた入門書」という本も出ています。p195-199を参照のこと。

あまり回答になっていませんが(^_^;)

No.11758　Re: 擬似反復？　　【CJ】　2010/01/20(Wed) 12:14

お返事ありがとうございます。調べてみると，
nested ANOVAとかGLMMなどで個体の平均を取ることなくデータを分析できるようですね。肝心のそれらの技法が良くわかっていないので勉強いたします…