「統計学関連なんでもあり」の過去ログ--- 042

No.08442　原点を通る回帰式の併合検定　　【kmj】　2008/11/28(Fri) 18:34

原点を通る回帰式の併合検定についてです。

通常の回帰式の併合検定は，たとえば，2組の回帰に関する統計量は下記のように設定すると，

＜1組＞
n = 6
xの平均値 = 5.53, yの平均値 = 44.33
xの偏差平方和(Sxx) = 17.5733, yの偏差平方和(Syy) = 837.3333
xyの偏差積和(Sxy) = 119.0333
回帰式：y = 6.98+6.77x
残差平方和(Se) = 31.4775

＜2組＞
n = 8
xの平均値 = 5.78, yの平均値 = 50.75
xの偏差平方和(Sxx) = 18.4950, yの偏差平方和(Syy) = 1023.50000
xyの偏差積和(Sxy) = 135.6500
回帰式：y = 8.39+7.33x
残差平方和(Se) = 29.1855

誤差分散(Ve) = (31.4775 + 29.1855)/(6 + 8 -4) = 6.0663
1,2組の回帰係数の差の標準偏差(s)=sqrt((1/17.5733 + 1/18.4950) x 6.0663) = 0.820
ただし，＊sqrt → 平方根

t = (|6.77-7.33|)/0.820 = 0.683 < t(10,0.05) = 2.228

このことから，有意ではないことが分かるので，回帰式の傾きは共通であると，判断されます。

さて，質問は，原点を通る回帰式の傾きの併合を検定したい場合，上の計算方法をそのまま用いることができるでしょうか？

よろしくお願いいたします。

No.08443　Re: 原点を通る回帰式の併合検定　　【青木繁伸】　2008/11/28(Fri) 19:45

> t = (|6.77-7.33|)/0.820 = 0.683 < t(10,0.05) = 2.228 このことから，有意ではないことが分かるので，

本筋とは関係ないので申し訳ないが，近代的なやり方は pt で，P値を求めるのが良いと思います

No.08450　Re: 原点を通る回帰式の併合検定　　【kmj】　2008/11/30(Sun) 00:35

青木先生，ご回答いただきありがとうございます。
さらに質問なのですが，近代的なやり方で，ptというのはどういうことでしょうか？

No.08453　Re: 原点を通る回帰式の併合検定　　【青木繁伸】　2008/11/30(Sun) 19:26

> ptというのはどういうことでしょうか？

失礼しました。
有意水準に対応する臨界値と検定統計量を比較するのではなく，検定統計量からP値を計算し，P値と有意水準を比較する方法にした方が良いのではないでしょうかということです（pt は，R の関数ですが，一般性を持っていませんでしたね）

No.08455　Re: 原点を通る回帰式の併合検定　　【kmj】　2008/12/01(Mon) 09:48

青木先生ありがとうございます。せっかくご教授いただけたのに大変申し訳ありませんが，先生のご説明にフォローできない個所がありますので，確認させていただけたら幸いです。「有意水準に対応する臨界値」とは，上の例で，"t(10,0.05) = 2.228"のことでしょうか？　検定統計量とは，"t=0.683"のことでしょうか？　「検定統計量からP値を計算し，P値と有意水準を比較する方法」とは，どのような計算をするのでしょうか？　

No.08456　Re: 原点を通る回帰式の併合検定　　【青木繁伸】　2008/12/01(Mon) 11:16

> 「有意水準に対応する臨界値」とは，上の例で，"t(10,0.05) = 2.228"のことでしょうか？

その通りです。

> 検定統計量とは，"t=0.683"のことでしょうか？

その通りです。

>「検定統計量からP値を計算し，P値と有意水準を比較する方法」とは，どのような計算をするのでしょうか？

あなたは何を使って計算しているのでしょうか？Excelには TDIST という関数がありますよね。=TDIST(2.228, 10, 2) という計算式を入力すると 0.050011771 という数値が表示されます。"t(10,0.05) = 2.228" に対応するわけです。t=0.683 のときの P値は，=TDIST(0.683,10,2) によって計算され，0.510119954 となります。P値＞αのとき，帰無仮説を採択ということにするのです。

No.08457　Re: 原点を通る回帰式の併合検定　　【kmj】　2008/12/01(Mon) 13:38

青木先生，ご回答ありがとうございました。t分布表を見ていました。よく理解できました。ただ，原点を通る回帰式の併合検定については，わからぬままです。原点を通る回帰式の計算方法と，最小2乗法による計算は違うので，同じ計算はできないのではないかと，直感的に思っていますが，私にはこれを説明するすべがありません，，，，。私の疑問をもっと具体的に言えば，たとえば，若者とお年寄りで，トレーニング量に対する体重減少をプロットしたとき，ともに有意な相関関係があり，その回帰式が，それぞれ，Y = AXとY = BX であったとします（トレーニングしなければ，体重減少効果はゼロ，とします）。若者のとお年寄りを合わせてプロットできるのか，すなわち，傾きAとBは「統計的に同じ」と言えるのか否か，を検定したい場合に，どのような計算をすればよいか，ということです。あまりやられない解析なのでしょうか，，，。もしどなたかお分かりになればよろしくお願いいたします。

No.08458　Re: 原点を通る回帰式の併合検定　　【青木繁伸】　2008/12/01(Mon) 15:03

> あまりやられない解析なのでしょうか

かもしれませんね。トレーニングと体重減少が原点を通る直線で説明できるとするのには色々問題があるかも。

独立変数の標本値が全て0から幾分離れたところにある場合，しいて原点を通らない直線に当てはめた方が都合がよいような事がある。母集団における独立変数と従属変数は曲線相関であって，その曲がり方が0の近くでは急であるが，独立変数が観察される範囲においてはほとんど直線で近似できるような場合には，切片を持つ直線に当てはめた方がよく近似できる。ただ，この直線は外挿はできない。というようなことが，スネデッカー・コクランの「統計的方法原書第6版」の161ページに書いてある。

赤い曲線が真の回帰曲線。黒い点がデータ，黒い直線は原点を通らない（切片を持つ）回帰直線。この例は，ある程度の強度を持ったトレーニングでないと体重減少にはつながらない（閾値を持つ反応曲線）とも解釈できるようなものかも知れない。

No.08461　Re: 原点を通る回帰式の併合検定　　【kmj】　2008/12/01(Mon) 16:13

お忙しい中，丁寧なご説明をありがとうございました。これ以上お聞きするのは心苦しくもあります。原点を通る直線で回帰するということ自体に無理があり，実際のデータは，切片を持つ直線で回帰したほうが都合がよいことが多い，と解釈しました。それでも，（無理矢理でも）原点を通る回帰式の併合検定を行う場合，上の計算例に倣って行うことは，理論的に間違いであるか否か，間違いならばなぜか，その辺は消化不良のまま終わりそうですが，，，。

No.08463　Re: 原点を通る回帰式の併合検定　　【青木繁伸】　2008/12/01(Mon) 18:22

どんな場合にも使える方法は，いつもの通り，正規近似による検定。
2群の傾きとその標準誤差を b1, b2, sb1, sb2 とすると，abs(b1-b2) / sqrt(sb1^2+sb2^2) が近似的に標準正規分布に従う。

No.08464　Re: 原点を通る回帰式の併合検定　　【kmj】　2008/12/01(Mon) 22:05

ありがとうございます。「・・・・・近似的に標準正規分布に従う」ということは，「この値を標準正規分布表で調べればP値が求まる」ということでしょうか？　とすると，確認させていただきたいのは，「標準誤差」とおっしゃられているのは，間違いなかったでしょうか？　分散ではないでしょうか？　

No.08465　Re: 原点を通る回帰式の併合検定　　【青木繁伸】　2008/12/01(Mon) 22:23

> 「この値を標準正規分布表で調べればP値が求まる」ということでしょうか？

エクセルでやるとしたら
=(1-NORMSDIST(1.96))*2　で 0.04999579
になりますよ。
計算機が利用できる状況で，正規分布表とかt分布表（カイ二乗分布表もF分布表も同じですが）は，用済みなのです。

> 「標準誤差」とおっしゃられているのは，間違いなかったでしょうか？　分散ではないでしょうか？　

なぜ，そのようにお思いになるのか，理解できませんが，標準誤差に間違いないですよ。
なぜ，間違いではないかとお思いになったのか，疑問です。
「標準誤差」というものを検索なされば宜しいかと思います。
> x <- c(2, 5, 4, 1, 7)
> y <- c(4, 6, 2, 3, 5)
> summary(lm(y ~ x-1))

Call:
lm(formula = y ~ x - 1)

Residuals:
     1      2      3      4      5 
 2.232  1.579 -1.537  2.116 -1.189 

Coefficients:
  Estimate Std. Error t value Pr(>|t|)  
x   0.8842     0.2034   4.346   0.0122 *
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Residual standard error: 1.983 on 4 degrees of freedom
Multiple R-squared: 0.8253,	Adjusted R-squared: 0.7816 
F-statistic: 18.89 on 1 and 4 DF,  p-value: 0.01219 
例えば，R で lm により分析したときに "Estimate" という列に示されるのが係数（傾き），"Std. Error" という列に示されるのがその係数の「標準誤差」です。

No.08470　Re: 原点を通る回帰式の併合検定　　【kmj】　2008/12/02(Tue) 09:53

青木先生，懇切丁寧なご説明ありがとうございました。大変参考になりました。分散と思ったのは，確かな根拠があったためではありませんでした。大変失礼いたしました。

No.08471　Re: 原点を通る回帰式の併合検定　　【kmj】　2008/12/02(Tue) 10:19

大変申し訳ございませんが，もう一つだけお聞きしたいことがあります。

> 正規近似による検定。
> 2群の傾きとその標準誤差を b1, b2, sb1, sb2 とすると，abs(b1-b2) / sqrt(sb1^2+sb2^2) が近似的に標準正規分布に従う。

ということでしたが，これは，データx1とy1の回帰式の傾きがb1，データx2とy2の回帰式の傾きがb2，としたとき，y1とy2の標準誤差を求めよ，ということでしょうか？　それとも，回帰直線Y=b1X Y=b2Xそれぞれから，標準偏差が求められますが，これより導かれる標準誤差のことか，どちらでしょうか？

お手数おかけいたしますが，よろしくお願いいたします。

No.08472　Re: 原点を通る回帰式の併合検定　　【青木繁伸】　2008/12/02(Tue) 11:30

> y1とy2の標準誤差を求めよ，ということでしょうか？　それとも，回帰直線Y=b1X Y=b2Xそれぞれから，標準偏差が求められますが，これより導かれる標準誤差のことか

「y1とy2の標準誤差」とは何？
「標準偏差が求められますが，これより導かれる標準誤差」とは何？

どちらでもないでしょう。
No. 8465 に書いたように，群別に直線回帰を行い，それぞれの「傾き」と，「傾きの標準誤差」を求めるということです。

No.08473　Re: 原点を通る回帰式の併合検定　　【kmj】　2008/12/02(Tue) 11:57

お忙しいところありがとうございます。お手を煩わせてしまいまして本当にすみません。　どのデータ群を使って標準誤差を求めたらよいのか混乱してしまいました。先生がおっしゃられているのは，
傾きbの標準誤差 sb = s/sqrt(Sxx) （ただし，sは回帰直線Y=bXからの標準偏差）
ということですね。

ありがとうございました。