No.02725 回帰して傾きを比較してよいのか  【su】 2007/02/13(Tue) 08:11

10種類の異なる行動実験において,対照群及び実験群A,Bから以下のような平均値データを得ました。標本数はいずれも n = 10 前後で,実験により異なります。
   対照  A  B
20%  15  10
18   10  12
15   10  10
2   1  -2
1   2   2
-10   -5  -5
-20  -15  -10
-30  -18  -13
-32  -20  -15
-35  -20  -12
一見して,正負いずれの方向の変化も,実験群では対照群に比べて小さいと思われるので,個々のデータを用いて ANOVA で交互作用をみるのが妥当と思われます。

このデータに対して,以下の手法が妥当かどうか悩んでおります。

そ れぞれの行動実験において,x軸に対照群の平均値,y軸に実験群の平均値をプロットすると,A,B群それぞれ10個の点がプロットされます。もし実験群と 対照群に差が無いとすると,これらの点は y = x 上にあるはずですが,多くの点がよりx軸に近いところにプロットされるので,A,Bそれぞれの点を直線回帰して,その傾きを y = x と比較したいと考えています。

1. 3群の傾きを同時に比較する方法はあるでしょうか。
2. そもそもこのような平均値データを直線回帰してよいのでしょうか。
3. その場合,各実験群の標準偏差のデータはどう扱うのでしょうか。

ANOVA よりも直接視覚に訴えるようなきがするというのが,このような解析をしたい動機ですが,御意見を伺えると幸いです。

No.02735 Re: 回帰して傾きを比較してよいのか  【ファン】 2007/02/14(Wed) 16:46

大雑把な印象ですが,,,

>1. 3群の傾きを同時に比較する方法はあるでしょうか。

C:対照群
Z:もし「10種類の異なる行動」を表す適切な数量的指標があれば,それが Z。無ければ主成分分析の第一主成分(第二第三主成分は微弱なためゼロとみなす)。因子分析の方が良いかどうかも要検討。
(1) C = γ_c・Z + ε_c
(2) A = γ_a・Z + ε_a
(3) B = γ_b・Z + ε_b

>2. そもそもこのような平均値データを直線回帰してよいのでしょうか。

(1') Z = (C - ε_c) / γ_c
これを(2)(3)に代入すれば,C を条件(説明変数)とする(平均値データ間の)回帰式が得られる。

>3. その場合,各実験群の標準偏差のデータはどう扱うのでしょうか。

パス(汗。

No.02738 Re: 回帰して傾きを比較してよいのか  【青木繁伸】 2007/02/14(Wed) 19:22

> 2. そもそもこのような平均値データを直線回帰してよいのでしょうか

その平均値が計算された元のデータ数が違うので,データポイントには重みをつけて回帰しないといけない。
その面倒をさけるなら,元のデータを使って回帰すればよい。

No.02750 Re: 回帰して傾きを比較してよいのか  【su】 2007/02/15(Thu) 08:54

回答ありがとうございます。勉強になります。

>ファンさん

直線回帰の代わりに主成分分析を使う訳ですね。見た目のシンプルさは失われてしまうのですが,シンプルなら正しいとは言えないので,面白いかもしれません。やってみます。

傾きの比較の代わりに,主成分のスコアを検定するにはどうすればよいのでしょうか。

>青木さん

や やこしいので,対照群Cと実験群Aだけだとします。10の行動実験について(x,y)=(Cの「平均値」,Aの「平均値」)として10点プロットすること はできるのですが,20のデータポイントがそれぞれ異なるデータ数を持っているので,このやり方では重みをつけたり元データを使うことはできません。

おっ しゃるとおり,データ数が違うのに平均値だけで回帰するのはおかしいですね。全ての行動実験に渡って,実験群が対照群より変化が小さいことを示すのに,一 目でわかる良い方法だと思ったのですが,何か別の工夫が必要なようです。やはり,ANOVA で交互作用をみるのが妥当でしょうか。

良い方法があれば,御教授いただければ嬉しいです。

No.02755 Re: 回帰して傾きを比較してよいのか  【ファン】 2007/02/15(Thu) 19:45

>傾きの比較の代わりに,主成分のスコアを検定するにはどうすればよいのでしょうか。

主旨は,suさんの「3群の傾き」というイメージが
>(1) C = γ_c・Z + ε_c
>(2) A = γ_a・Z + ε_a
>(3) B = γ_b・Z + ε_b
の ような3次元モデルかな?と感じたところにあります。で,先験的な Z の値が無い時には,主成分分析か因子分析で Z を推定することになるかと。しかし Z 直線の傾きの検定は,やや面倒な統計的問題になりますね。そこで (C,A) および (C,B) 平面に射影して回帰推定を使う,というのが No.2725 を読んだ時に浮かんだ筋書きです。

各平均値を求めた時のデータ数は,「n = 10 前後」の『前後』を見落としていました(汗。しかし回帰モデルなら,C は「条件値=非確率変数」になるので,ε_c の分散不均一性は考慮する必要が無く,ε_a と ε_b の不均一分散のみを考慮した重み付き回帰で良いかと。ただし別の統計的な問題があって,それは
>(1') Z = (C - ε_c) / γ_c
を(2) (3)に代入すれば明示的な式が得られるように,C と回帰の誤差項(ε_c を含む)が相関(非直交性)を持ち,通常の回帰推定だとバイアスが生じてしまう点です。そのため,「ε_c (の分散)が小さいからバイアスは無視できる」という理由付けや,操作変数推定法を用いるなどの「歯切れの悪さ」が生じます。

以上は,モデルが(1)(2)(3)ならば(しかも ε 間の相関は何も考えていない)という話ですし,どんなモデルが適切かは,その分析対象を扱って居る方にしかわからないことですので,雑談程度に聞き流して下さい。

● 「統計学関連なんでもあり」の過去ログ--- 040 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る