★ ステップワイズ法による選択について ★

1340. ステップワイズ法による選択について ha 2003/12/12 (金) 03:38
└1342. Re: ステップワイズ法による選択について 青木繁伸 2003/12/12 (金) 10:42
 └1353. Re^2: ステップワイズ法による選択について ha 2003/12/12 (金) 15:53
  └1355. Re^3: ステップワイズ法による選択について 青木繁伸 2003/12/12 (金) 17:41
   └1356. Re^4: ステップワイズ法による選択について ha 2003/12/12 (金) 18:14
    └1357. Re^5: ステップワイズ法による選択について 青木繁伸 2003/12/12 (金) 18:39
     └1367. Re^6: ステップワイズ法による選択について ha 2003/12/14 (日) 01:03


1340. ステップワイズ法による選択について ha  2003/12/12 (金) 03:38
たびたび失礼します。

青木様にご教授いただきました,ステップワイズ法をSPSSにておこないました。

結果は80個ありましたカテゴリが一番高い重相関で5個選ばれることになりました。>モデル集計より

80個あるが,5個しか回帰式に投入されないということと理解してよろしいのでしょうか・・・。

     [このページのトップへ]


1342. Re: ステップワイズ法による選択について 青木繁伸  2003/12/12 (金) 10:42

> 80個あるが,5個しか回帰式に投入されないということと理解してよろしいのでしょうか・・・。

そういうことです。(あなたが操作を間違えたり,不適切な設定をしていない限り)設定した Fin, Fout 以下になる(または Pin, Pout 以上になる) 変数は選択されなかったということです。閾値の設定を間違えていなければそれでいいでしょう。

変数選択の仕組みも理解しておくといいと思います。
http://aoki2.si.gunma-u.ac.jp/lecture/Regression/mreg/mreg7.html

     [このページのトップへ]


1353. Re^2: ステップワイズ法による選択について ha  2003/12/12 (金) 15:53

お返事誠にありがとうございます。

結果:ステップワイズ法では,5つのカテゴリしか抽出されませんでした。

強制投入法にすると全てのカテゴリが考慮されるため,重相関が1になり,偏相関もとても低くなり,意味がないような結果がでてきました。

疑問:
データがおかしいのもあると思うのですが,カテゴリ(デザイン)抽出において,考慮したいカテゴリを増やすには,一度にかけるよりも,80個を分割してかてみようと思ったのです。



アドバイスよろしくお願いいたします。

     [このページのトップへ]


1355. Re^3: ステップワイズ法による選択について 青木繁伸  2003/12/12 (金) 17:41
> 考慮したいカテゴリを増やすには,一度にかけるよりも,80個を分割してかてみようと思ったのです。

予想に反した結果になったとは思いますが,それが現実なのです。
バラバラにたとえば10個ずつで分析して,それを寄せ集めても,全部を対象にして変数選択による結果にはなりません。すくなくとも,それより優れた結果は得られません。理論的にも不完全ですし。最もうまくいっても,ばらして分析した結果,予測に役立つ変数はステップワイズにより得られた変数と同じになるでしょう。(ほんのわずかの違いはありますが,それは考慮の対象にもならない微々たるものでしょう)。

部分が全体を決めるというのは,美しい理論ですが,現実ってそんなものではないでしょう。

被検者が精密に評価をしているとはとても期待できないし,1が5集まって10になったり100になったりしているわけでしょうし,そうでなきゃデザインなんかやってらんないのでは?(10が5つ集まって30くらいにしかならないなんてこともないとはいえない)。

調査者側の思い入れというのは,よく裏切られるものです。

そもそも,単純集計(クロス集計)の段階で,今回の結果は想像できたのではないでしょうか?

     [このページのトップへ]


1356. Re^4: ステップワイズ法による選択について ha  2003/12/12 (金) 18:14
お返事誠にありがとうございます。

気になることがあるので再度お伺いします。

> バラバラにバラバラにたとえば10個ずつで分析して,それを寄せ集めても,全部を対象にして変数選択による結果にはなりません。

たとえば80個を
(グループ1):1−10,
(グループ2):10と11−20,
(グループ3)10と21−30,
 ・・・,
(グループ8):10と71から80
という様にわける時に共通のカテゴリを混ぜて分析することは,意味がないでしょうか・・・。

初心者なので,次元の低い質問をしてしまってるのですが,ご意見をお聞かせくださると幸いです。


     [このページのトップへ]


1357. Re^5: ステップワイズ法による選択について 青木繁伸  2003/12/12 (金) 18:39
分割して分析すればいい結果が得られるのではないかと思われているなら,それは間違いです。

変数選択の意味は,予測に役立つ順に変数を選ぶわけです。このようにやるのが一番効率的なのです。

分 割して分析し,その分析において有効な変数を残していくというのは,有望そうな候補を選んでいるわけです。どのような観点から候補を選んでいるのかは,分析をしている人の主観(完全に主観ではなくて,統計量を見ながら判断しているわけですが,それはコンピュータプログラムが行っている変数選択に比べると低レベルのものでしょう)。かりに,そのような手動の変数選択がうまく昨日したとして,最終的にそれらのなかからさらに有効な変数を選ぶということをやっていくと,コンピュータプログラムがやった変数選択と同じものになるわけでしょう?ふつうは同じものより劣る(途中で,多重共線性などの考慮が不十分になる可能性がある)。

単純な場合を考えましょう。
毎回一つずつの変数を使って,80個の予測式を作ります。その中で,重相関係数の大きい方から5つ変数をとります。実は,80回も分析する必要はなくて,従属変数との相関係数を計算して,相関係数の絶対値の大きい方から5つ取り出してみてください。その5つは,変数選択をして得られたものと同じでしょうか。同じこともありますが,違うことも多いです。なぜ違うか。1つの独立変数を使う予測式をいくつ積み上げても,複数の独立変数を使う予測式は作れないのです。同時に使う変数との相互関係である変数は選ばれたり選ばれなかったりするわけです。

なお,一番完全な独立変数の選択法は,先に挙げておいたページにも書いたように,総当たり法を行うことです。つまり,2^80 通りの解析を行い,重相関係数の一番大きいものを採用するのです。
でも,2^80 通りの分析ってどれだけの分析ですか。計算してみましょう,約1.208926e+24って,1の後に0が24個つきますよ!!そんな計算やれるわけないですね。

     [このページのトップへ]


1367. Re^6: ステップワイズ法による選択について ha  2003/12/14 (日) 01:03

お返事誠にありがとうございました。

80個という多さのため,他の分析にかけられず,悩んでいました。

ステップワイズ法というものを教えていただき,とても参考になりました。

わかりやすいご説明,誠にありがとうございました。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 026 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る