No.05244 判別分析に投入する変数の選択について  【オレンジ】 2008/01/03(Thu) 19:11

新年あけましておめでとうございます.
現在,判別分析について勉強中で,判別分析に用いる説明変数の選択について疑問に思ったことがあります.
先日,以下のウェブサイトで次のような記述を見かけました.
http://www.bunkyo.ac.jp/~yatsuha/kenkyu/kena1/4syou.html

「調査では様々なデータをとっているが,その中で加入―非加入に関与しうる変数を整理した.(中略)これらの変数は加入―非加入間で相応の差のある変数の採用を中心としている」とあります.
このように判別分析を行なうにあたって,あらかじめ2群間で変数の値の差を検定し,そこで差がみられたものだけを投入する…というやり方は理論的に正しいのでしょうか?

(以前,SPSSで判別分析(ステップワイズ法)を行なったとした際,「グループ間の平均の差の検定」では有意差が出なかった変数が投入されたことがあり,しっくりときませんでした.
もし上のやり方を採用することができれば,このようなことも起きないのかと思ったのですが…)

No.05245 Re: 判別分析に投入する変数の選択について  【青木繁伸】 2008/01/03(Thu) 19:24

> 理論的に正しいのでしょうか?

正しくありません。大間違いです。

一変量の解析結果(差のある変数を説明変数にする)をいくら積み上げても多変量の解析結果は生み出せません。

http://aoki2.si.gunma-u.ac.jp/lecture/Discriminant/index.html
の「演習問題」および,その「解答」を参照
http://aoki2.si.gunma-u.ac.jp/lecture/Discriminant/ans2.html

逆に,差のある変数をたくさん取り上げると,その中で不要な変数や多重共線性の原因になる変数が出てくる,ということもあります。

No.05257 Re: 判別分析に投入する変数の選択について  【オレンジ】 2008/01/04(Fri) 14:43

ご返事ありがとうございます.
>正しくありません。大間違いです。
やはりこのような手法は間違っているんですね.このような変数選択の方法を見たことがなかったので疑問に思っていました.

2群間で平均値が全く同じでも判別には役立つというのも図を見てよく分かりました.
このことに関連して別の質問になるのですが,SPSS関連のテキストでは判別分析の結果の解釈として
「変数Xの値が大きく,変数Yの値が小さい者ほどA群に属する傾向にある」
というような書き方がされています.
そこで,判別分析の結果とともにA群とB群における変数X,Yの平均値を表で示すと分かりやすいかな?と思ったのですが,
変数Xは判別には役立っても平均値は全く同じ…ということであれば,このような表を作成する意味はないということになるのでしょうか?

No.05258 Re: 判別分析に投入する変数の選択について  【青木繁伸】 2008/01/04(Fri) 15:08

> 変数Xは判別には役立っても平均値は全く同じ…ということであれば,このような表を作成する意味はないということになるのでしょうか?

多変量解析の結果があれば単変量解析の結果がなくても良いというわけではありませんので,表を作る意義はあります。
というか,基本的な解析結果はちゃんと掲載すべきものです。
総合して解釈する訳です。「平均値に差がないのに判別には役立つんだなあ」ということを示すのも重要なことです。

No.05259 Re: 判別分析に投入する変数の選択について  【オレンジ】 2008/01/04(Fri) 16:04

度々ありがとうございます.大変参考になりました.
多変量解析の勉強を始めたばかりではありますが,やってみると面白いものだなと実感しています.
今後も少しずつ勉強していこうと思いました.ありがとうございました.

● 「統計学関連なんでもあり」の過去ログ--- 041 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る