No.11751 擬似反復?  【CJ】 2010/01/19(Tue) 20:02

組織切片中にある特定の細胞種を見つけてきて,その直径を計ることを考えます。5匹の動物でこの作業を行い,n1,n2,n3,n4,n5個の細胞を(ランダムに)抽出できたとします。
直 径の平均値,標準偏差がそれぞれm1-m5, s1-s5と算出でき,m1からm5までの平均値に統計的な有意差があるかどうかは例えばANOVAで行うことができると思います。ここでm1からm5に 有意差が検出できなかったとき,5匹のデータをまとめてn1+n2+...+n5個のデータとしてしまうことは悪い作法となるのでしょうか?
これ がまずい,となると,データ数は5つとなるわけですが,この場合データは平均値をもとに扱うことになるのでしょうか?つまり,m1からm5の平均を全体の 平均とし,m1からm5の標準偏差を全体の標準偏差とするのが正しいでしょうか?この際に疑問となるのは動物1-5に存在した標準偏差の情報(s1- s5)が消えてしまうことです。

(例えば実験群5匹と対照群5匹で細胞の直径に差があるか?といった類の検定を行うことを考えた上での質問です。

よろしくお願いします。

No.11753 Re: 擬似反復?  【波音】 2010/01/19(Tue) 23:02

同一の個体から繰り返しデータを得たのであれば:

ラットA → 1つ目の細胞, 2つ目の細胞, ..., iつ目の細胞
ラットB → 1つ目の細胞, 2つ目の細胞, ..., jつ目の細胞

というようになっているわけですから,i + jをサンプルサイズだとして通常通りの分散分析(独立性を仮定した分散分析)をしてしまうと,擬似反復を犯していることになりますね。

ちょうど似たような解析例を使った解説が「Statistics: An Introduction using R」という本に書いてありますが,Google Bookだとドンピシャでそのページが見ることができなくなっています。。。

日本語訳された「統計学: Rを用いた入門書」という本も出ています。p195-199を参照のこと。

あまり回答になっていませんが(^_^;)

No.11758 Re: 擬似反復?  【CJ】 2010/01/20(Wed) 12:14

お返事ありがとうございます。調べてみると,
nested ANOVAとかGLMMなどで個体の平均を取ることなくデータを分析できるようですね。肝心のそれらの技法が良くわかっていないので勉強いたします…

● 「統計学関連なんでもあり」の過去ログ--- 043 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る