No.22083 重回帰分析の従属変数の正規性について  【睡眠専門医】 2016/07/27(Wed) 23:03

いつもお世話になっております。
お尋ねしたいのですが,重回帰分析の従属変数として用いたい変数が分布に偏りがあります。そこで,変数変換をしたところ,3乗根変換にて正規分布(Kolmogorov-Smirnov の正規性の検定による)に近い形となりました。
重回帰分析の従属変数は,正規分布である必要があるのでしょうか。
また,独立変数についても同様でしょうか。
以上につきましてご教示いただけましたら幸いです。

No.22084 Re: 重回帰分析の従属変数の正規性について  【青木繁伸】 2016/07/28(Thu) 09:21

従属変数は正規分布する必要はありません。たとえば,ロジスティック回帰の場合,従属変数は二項分布(0/1の二 値データ)です。このように,従属変数が二値データの場合には普通の重回帰分析は適用できません。また,y = ax^b のような場合は,たとえ x が正規分布でも,y は正規分布しませんね。両辺の対数をとって,log(y)=log(a)+b*log(x) のようにすれば,直線回帰(重回帰)に持ち込めます(もっとも,これも,非線形回帰を行う方がよいですけど)。

独立変数も正規分布する必要はないです。たとえば,ダミー変数(これも 0/1 の二値データ)など,正規分布するわけでもないし,データから検量線を引くような場合(単回帰...重回帰に発展)にも独立変数は任意に選ばれた(きれいな整数値)ですしね。

変数変換をするときは,闇雲にやるのではなく理論的根拠に従うべきです。

従属変数と独立変数の間に理論式(のようなもの)があるなら,非線形回帰を試みるのも一法でしょう。

No.22087 Re: 重回帰分析の従属変数の正規性について  【睡眠専門医】 2016/07/29(Fri) 03:11

ご教示いただきありがとうございました。
変数変換はやみくもに行うべきではないのですね。
非線形回帰についても勉強させていただきます。

● 「統計学関連なんでもあり」の過去ログ--- 048 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る