No.09020 回帰分析結果からのレンジの求め方  【山田】 2009/01/25(Sun) 04:34

始めまして。エクセルで回帰分析を行った際の質問をさせてください。
解析を行った結果が以下のようになったとします。
(解析に用いた要因は質的データなので,数量化理論?類を用いました。なお,要因Aの水準は5つ,要因Bの水準は3つ,要因Cの水準は5つ,要因Dの水準は3つあり,解析の際に各要因から1水準ずつ冗長データを削除しました。)
          係数          標準誤差      t             P-値
切片 2.9874002 0.866255625 3.448635847 0.00059683

A1 3.736651697 0.99870245 3.741506488 0.000197755
A2 0.846806387 0.608252227 1.392196114 0.16430076
A3 -1.483657685 0.634369252 -2.338791925 0.019623891
A4 -0.737649701 0.74785246 -0.986357257 0.324295263

B1 -0.0499002 0.5183083 -0.096275131 0.923329345
B2 1.89246507 0.575975408 3.285669915 0.001067616

C1 3.000249501 0.922499265 3.252305573 0.001199098
C2 1.462325349 0.587136357 2.490606028 0.012980975
C3 -2.148328343 0.558170524 -3.848874582 0.000129405
C4 0.775199601 0.769947182 1.006821791 0.314364875

D1 -1.554765469 0.465529561 -3.339778181 0.000882467
D2 -1.229291417 0.57722617 -2.129652951 0.033545075
ここからt値とP−値を見て,信頼できる(データとして使える)係数は,A1・A3・B2・C1・C2・C3・D1・D2となると思います。

ここからそれぞれの要因におけるレンジ(係数の最大値−最小値)を求める場合,結果として出てきた信頼できるデータ「A1・A3・B2・C1・C2・C3・D1・D2」を用いるのだと思いますが,要因Bのレンジを求めるにはどうしたらいいのでしょう?

要因AならばA1−A3,要因CならばC1−C3,要因DならばD2−D1のようにレンジを計算することは正しいのでしょうか?

結果には算出されていない「B3=0」を用いればいいのでしょうか?しかしそれだとt値もP−値も分からないB3を使っていいものか悩みます。

No.09022 Re: 回帰分析結果からのレンジの求め方  【青木繁伸】 2009/01/25(Sun) 09:59

あなたがやろうとしているのは,「数量化I類における係数のレンジの決め方」には反しています。少なくとも「P値<αの係数が信頼できる」ということもおかしいし,「信頼できる係数の差がレンジである」というのもへんですね。

なお,結果の表示も数量化I類の形式ではないので,これを数量化I類と呼んだり,数量化I類におけるレンジを表示したりするのは不適切です。あなたの行った,ダミー変数を使う重回帰分析と数量化I類は,同じものではありますが,両者を混同して解釈するのは不適切です。

以 下の文書を読めば分かると思いますが,ダミー変数を用いた重回帰分析の結果から,数量化I類で言うレンジを求めるのは,削除したカテゴリーの係数値は0と して,アイテム単位で「最大係数−最小係数」の計算をすればよいのです。A,B,C,D のレンジは,5.220309, 1.942365, 5.148578, 1.554765 となるわけですね。

数量化I類と重回帰分析の関連についての解説
http://aoki2.si.gunma-u.ac.jp/LaTeX/sreg-qt1.pdf

なお,どうしてもエクセルで数量化I類をやりたいということならば,以下を参照するとよいかも。
http://aoki2.si.gunma-u.ac.jp/lecture/stats-by-excel/vba/html/qt1.html

No.09023 Re: 回帰分析結果からのレンジの求め方  【山田】 2009/01/25(Sun) 14:35

早速の返信ありがとうございます。

>少なくとも「P値<αの係数が信頼できる」ということもおかしいし,「信頼できる係数の差がレンジである」というのもへんですね。

係数A1が0かどうかの有意性検定を,α=5% として行ってみると
A1のP値は 0.000197755で 0.019%ですので,P値>αとなり帰無仮説は棄却され,有効な説明変数である。
という考え方は間違っていますでしょうか?

>なお,結果の表示も数量化I類の形式ではないので,これを数量化I類と呼んだり,数量化I類におけるレンジを表示したりするのは不適切です。あなたの行った,ダミー変数を使う重回帰分析と数量化I類は,同じものではありますが,両者を混同して解釈するのは不適切です。

適切なご指摘,ありがとうございます。今まで混同していました。

> 以下の文書を読めば分かると思いますが,ダミー変数を用いた重回帰分析の結果から,数量化I類で言うレンジを求めるのは,削除したカテゴリーの係数値は0 として,アイテム単位で「最大係数−最小係数」の計算をすればよいのです。A,B,C,D のレンジは,5.220309, 1.942365, 5.148578, 1.554765 となるわけですね。

係数の検定の結果を問わず,「最大係数−最小係数」でいいのですね。
ありがとうございました。

No.09024 Re: 回帰分析結果からのレンジの求め方  【青木繁伸】 2009/01/25(Sun) 15:22

> 係数A1が0かどうかの有意性検定を,α=5% として行ってみるとA1のP値は 0.000197755で 0.019%ですので,P値>αとなり帰無仮説は棄却され,有効な説明変数である。という考え方は間違っていますでしょうか?

P値<α の書き間違いは別として,

有 効という言葉にもよるでしょう。検定は,帰無仮説が「回帰係数は0である」,対立仮説が「回帰係数は0ではない」としているだけです。ほかの変数(カテゴ リー)との相対比較をしているのではないので,他の変数(カテゴリー)が,意味的にも大いに有効なら,回帰係数が0ではないとされただけで有効とは言えな くなると思います。

● 「統計学関連なんでもあり」の過去ログ--- 042 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る