No.20287 成長段階別データの解析法  【タカギ】 2013/10/07(Mon) 22:51

初めて質問させていただきます.統計については初心者です.

成長段階別の分析データの解析についてです(試料は化石です).
成 長段階を追って,ある項目の分析を行いました.その項目の成長を追った変動パターンや値について,複数種間で比較することが研究目的です.(なお,ここで いう成長段階というのは,ある個体の一生を複数分割した各々,という意味です.成体の化石1個体から分割して得られます.)
変動パターンについては,順位相関を用いて種内で一定の傾向は見られています.個体差はあるものの,種としての傾向を探りたいので,種間の差の検定(分散分析)を行うことを考えました.
しかし,同一種であっても,個体ごとに得られる成長段階の数が異なるため,得られたデータの水準がバラバラです.そのため,種間の差の解析方法に難儀しています.
なお,6種,各々について複数個体(3〜7個体),複数成長段階(3〜6段階)の分析データがあります.1成長段階につき1データです.

データの種類から考えると,自分なりに調べたところでは,Nested ANOVA, Mixed effect modelが関連するようでしたが,どちらが適切なのでしょうか.
Nested ANOVAを考えた際は,成長段階という要因がどこにネストするのか判断できませんでした.
またMixed effect modelを考えた際,要因Aが種,要因Bが成長段階で,個体は変量効果と考えましたが,要因Bの水準数が一定ではありません.そもそもこのようなデータ(水準数が異なるデータ)を解析に用いることができるのでしょうか.

当初,統計的手法で解析することが念頭になかったため,今回のデータセットで解析は無理,ということなのかもしれませんが,個体別の成長段階別分析は今後も継続予定ですので,その時の分析計画やデータ解析の参考にしたく思っております.

まとめますと,
1.このデータセットでNested ANOVAやMixed effect model等の解析が可能か
2.成長段階別分析を解析するにはどのような解析手法が適切か,またそれに必要な条件について

をご指南いただけますと幸いです.
どうぞ,よろしくお願いいたします.

No.20292 Re: 成長段階別データの解析法  【斜界人】 2013/10/08(Tue) 18:42

データの構成がよく分からないのですが,対応あり一要因x対応なし一要因の混合型?
こんな感じでしょうか?
Sp subj value.1 value.2 value.3 value.4 value.5 value.6
1 1 1.54 1.67 2.14 2.21 NA 2.53
1 2 1.43 1.92 1.84 NA 2.46 2.47
1 3 1.29 NA 1.96 2.07 2.26 NA
1 4 1.50 1.59 NA 2.06 2.48 NA
2 5 1.36 1.26 1.69 1.96 2.13 2.31
2 6 NA 1.39 1.57 NA NA 2.25
2 7 1.27 NA 1.63 NA 2.12 NA
2 8 1.29 NA 1.75 1.91 2.06 2.09
2 9 NA 1.45 NA NA 1.94 2.53
2 10 1.37 1.44 1.64 NA NA 2.25
3 11 NA 1.91 1.67 2.09 NA 2.45
3 12 1.17 1.59 1.73 NA 2.15 2.52
3 13 1.35 1.71 NA 1.87 2.53 2.36
3 14 1.43 1.67 1.74 2.05 NA 2.37
Sp: 種,subj: 個体,value.1~6: 各発生段階の測定値

これならMANOVAもあるみたいだけど,何れにしても欠損値の扱いは知らないです。種ごとに回帰分析をやって期待値で埋めるとかかなあ。

もう少しデータ構造をはっきりさせれば,良い案を出せる人が現れるかもしれませんよ。

No.20294 Re: 成長段階別データの解析法  【タカギ】 2013/10/09(Wed) 01:00

ご回答ありがとうございます.

なるほど,確かに水準数が足りないものは欠損値という扱いになるのですね.
データの構造はまさにそのような感じです.
補足するとすれば,成長段階の最後,最後から2番目,および最初(value6,5,1)は全ての個体についてデータがあります.

>対応あり一要因x対応なし一要因の混合型?
これは,
 ・対応あり→一連の成長段階データはある個体に属する(対応がある,折れ線グラフが描ける)
 ・対応なし→ある種において個体はどれを選んでもよい(対応がない)
という意味でしょうか.
だとしたら,そういうデータ構成です(対応ある,なしの判断に自信がないので,質問に質問するような形ですみません).

欠損値については,「Mixed effect modelでは欠損値があっても解析可能」という言葉を目にしました.どう処理するのかというところまではまだ把握していませんが,欠損値の存在という特徴も含めて考えると,このモデルを使えるのかもしれません..
またMANOVAについては知識が全くないので,ひとまず調べてみようと思います.

No.20296 Re: 成長段階別データの解析法  【斜界人】 2013/10/09(Wed) 20:02

対応はざっくりそんな感じです。
件のデータの場合,
・種内で同一個体からの測定値が存在するが,種間では同一個体測定値は無い(対応なし)。種はbetween-subject factor
・発生段階は水準内では同一個体からの測定値は無く独立であるが,水準間は同一個体からの測定値(対応あり)。発生段階はwithin-subject factor
・個体は種内において大きな母集団から無作為抽出された種を代表するものと考えられるから,個体は変量効果。発生段階の水準を無視すると,個体は複数回測定されており,種に入れ子になった状態といえる。
ということで,one-between one-withinの混合モデルで良いのかな。

計算は欠損値ありでも出来るみたいですが,どうなんでしょう。
Rで試してみたところ,aov()だと発生段階がbetweenとwithinに分解され,どう解釈していいのか分からず。欠損値で完全なwithinとして扱えないということなのか...
lme()とlmer()は同じ結果で一応まともっぽかったけど。(というかaov()が駄目?)。
(追記1)aov()は不均衡データには向かないから他を使えヘルプと書いてありました。欠損値でも均衡性を失います。このケースでは元々不均衡デザインな上に欠損値ありなのでaov()を使うべきではないですね。

欠損値を埋めた場合はaovの結果も分かり易くなりましたが,やはりlme,lmerと少し違います。残差の分解が違うのか...
(追記2)追記1と同じ理由によるものかもしれません。

多分TypeIII平方和も使った方が良いと思われますが,ezANOVA()は欠損値があると駄目みたいです。Anova(lmer(...), ...)は計算に癖あり? 計算結果はezANOVAとlmerで異なります。

MANOVAは欠損値があると駄目かも...

No.20297 Re: 成長段階別データの解析法  【タカギ】 2013/10/10(Thu) 21:25

ご丁寧にありがとうござます.大変参考になります.

自分でもlmer()を試してみました.確かに欠損値があっても解析はされているようですね.
とは言いましても,私はRも初心者なので,カッコの中身の書き方から,結果の見方から,いろいろと調べながら四苦八苦しています.
実際わからないことだらけ,質問したいことだらけなのすが,まずはもう少し基本を勉強してからにいたします.

取り急ぎお礼申し上げます.

● 「統計学関連なんでもあり」の過去ログ--- 046 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る