★ ステップワイズ重回帰分析の説明変数について ★

 178 ステップワイズ重回帰分析の説明変数について  またたび  2000/04/12 (水) 17:14
  183 Re: ステップワイズ重回帰分析の説明変数について  sb812109  2000/04/13 (木) 09:43
   189 Re^2: ステップワイズ重回帰分析の説明変数について  またたび  2000/04/15 (土) 00:53
  182 Re: ステップワイズ重回帰分析の説明変数について(3)  出口慎二  2000/04/13 (木) 02:43
  181 Re: ステップワイズ重回帰分析の説明変数について(2)  出口慎二  2000/04/13 (木) 02:43
   188 Re^2: ステップワイズ重回帰分析の説明変数について(2)  またたび  2000/04/15 (土) 00:47
    193 Re^3: ステップワイズ重回帰分析の説明変数について(2)  出口慎二  2000/04/15 (土) 21:28
    192 Re^3: ステップワイズ重回帰分析の説明変数について(1)  出口慎二  2000/04/15 (土) 21:28
     195 Re^4: ステップワイズ重回帰分析の説明変数について(2)  またたび  2000/04/16 (日) 00:04
     194 Re^4: ステップワイズ重回帰分析の説明変数について(1)  またたび  2000/04/15 (土) 23:58
      196 Re^5: ステップワイズ重回帰分析の説明変数について(1)  出口慎二  2000/04/16 (日) 20:07
       197 Re^6: ステップワイズ重回帰分析の説明変数について(1)  またたび  2000/04/16 (日) 23:45
  180 Re: ステップワイズ重回帰分析の説明変数について(1)  出口慎二  2000/04/13 (木) 02:41


178. ステップワイズ重回帰分析の説明変数について  またたび  2000/04/12 (水) 17:14
はじめまして。統計学は初めてなので,いろいろな本を読みつつ頭を抱えています。さて,あるひとつの目的変数に影響する(かもしれない)と思われる,説明変数がたくさんあり,それらをもとにステップワイズ重回帰分析をしようと思っていますが,その説明変数には,例えば年齢,知人の人数,性別などとともに,アンケートからそれぞれ0〜4の5ポイントで評価された症状,例えば不眠,妄想,暴力などからなる症状の変数が20項目あります。20項目の症状のスコアについては因子分析により,斜交回転にて有効な3つの因子が抽出され,それぞれの斜交スコア1,2,3がコンピューターで計算されました。各因子の解釈は一応できています。そこで,最終的に目的変数以外の変数は,年齢,知人の人数,性別,斜交スコア1,斜交スコア2,斜交スコア3とあるのですが,斜交スコアのような因子スコアを,年齢などの他の変数とともに同時に説明変数として扱って,ステップワイズ重回帰分析に用いることができるのでしょうか。ぜひともどうか御教示下さい。統計について相談できるひとがいないもので,これがとんちんかんな質問か否かも分かりません。とにかく真剣に悩んでいます。

     [このページのトップへ]


183. Re: ステップワイズ重回帰分析の説明変数について  sb812109  2000/04/13 (木) 09:43
ステップワイズ法に関しては以下のような意見もあります。
http://www.stata.com/support/faqs/stat/stepwise.html

     [このページのトップへ]


189. Re^2: ステップワイズ重回帰分析の説明変数について  またたび  2000/04/15 (土) 00:53
> ステップワイズ法に関しては以下のような意見もあります。
> http://www.stata.com/support/faqs/stat/stepwise.html

早速,上記サイトにいって,印刷いたしました。またたびのちいさなおつむで,じっくり読もうと思います。どうもありがとうございました。

     [このページのトップへ]


182. Re: ステップワイズ重回帰分析の説明変数について(3)  出口慎二  2000/04/13 (木) 02:43
こちらの2つめの疑問の方は,データについても何も分かっていない者の思いつきで,まるで的はずれな疑問かもしれませんので,読み流して頂ければ結構です.

で,共分散構造分析を行う前提で,因果モデルの構成のために,探索的に行う目的であれば,直接測定できる変数(観測変数)と因子のような潜在的な変数(潜在変数)を混在させた重回帰モデルを設定して,変数選択をしてみても,べつに構わないと思うのですが,どうなのでしょう?

そういえば,共分散構造分析については,大阪大学人間科学部の狩野裕氏のHPにもいろいろ情報があります.

URL: http://koko15.hus.osaka-u.ac.jp/members/kano/index1.html

     [このページのトップへ]


181. Re: ステップワイズ重回帰分析の説明変数について(2)  出口慎二  2000/04/13 (木) 02:43
『原因をさぐる統計学 共分散構造分析入門』豊田秀樹,前田忠彦,柳井晴夫著,1992,講談社(ブルーバックス)

があります.より詳しくは,朝倉書店から,上記本の著者でもある豊田秀樹氏による共分散構造分析の入門編,実践編が出ていたように記憶しています.

2)ところで,またたびさんが行おうとしていることは,属性的であるいくつかの測定可能な変数や,症状に関する項目から抽出された因子を原因,ある測定可能な(目的)変数を結果とした場合の,変数間の因果関係の分析かと思います.この場合,何が何の原因であるとするのか,というモデルの構築が非常に重要になると思います.この点において,書き込みにありました重回帰モデルに疑問を感じます.果たして属性に関する変数と,症状に関する項目から抽出された因子とが,それぞれ同時に,目的変数に対して直接の原因となっているのでしょうか.例えば,
・属性項目が症状因子の原因となる.
・症状因子が症状項目の原因となる.
・症状因子が目的変数の原因となる.
という3つの因果関係を想定するとか.

     [このページのトップへ]


188. Re^2: ステップワイズ重回帰分析の説明変数について(2)  またたび  2000/04/15 (土) 00:47
 出口さん貴重なご意見ありがとうございます。早速このまたたび,共分散構造分析について,あっちこっちのぞいて読みまくったんですが,残念ながらオーバーヒートしてしまいました。そこで原点にかえり,そもそもこの研究でステップワイズ重回帰が適切なのかと考えました。またたびの研究では,(患者Aを世話する世話人Bのストレス度C)において,Aの因子(属性・・・ダミー変数にて,症状因子・・・20項目各5ポイント評価),Bの因子(属性など)の中で,Cに影響しているものはどれどれで,しかもどれが一番影響しているかを検討しようとしています。すなわち,属性あるいは症状因子のなかのどれかがCの原因となるという因果関係を想定しています。これまでの同じようなモデル・意図の研究では,ステップワイズ重回帰を使っているものや,分散・共分散分析で要因の規定力(の方向性)とかいうものを検討しているものがあります。そこで,重回帰と共分散析のどちらが適当あるいはより適切かと思われますか。あと,共分散分析と共分散構造分析は全く違うものなのでしょうか。なにとぞご意見をお願いします。ネコに食われても仕方がないまたたびより。

     [このページのトップへ]


193. Re^3: ステップワイズ重回帰分析の説明変数について(2)  出口慎二  2000/04/15 (土) 21:28
> 重回帰と共分散析のどちらが適当あるいはより適切...

またたびさんのデータについて私の方,良く把握できていないのですが,共分散分析を適用する(できる)ケースとは思えないのですが.また,分散分析の場合について考えてみても,要因に潜在変数(因子)を使用するのであれば,因子得点という連続変数をカテゴライズすることになるかと思われるのですが,私見では,あまり妥当なやり方とは思いません.尚,観測変数である独立変数の全てが,上手く2因子にまとまるのであれば,直接に観測変数を独立変数とする重回帰分析を行っても,多重共線性が起こり,上手くいかないと思います.結局,潜在変数(因子)を使った回帰分析を行ってみることになるのでは.

> 共分散分析と共分散構造分析は全く違うものなのでしょうか。

共分散分析モデルは,共分散構造分析モデルの下位モデルに含まれます.潜在変数を使用した共分散分析の適用事例もあるようです(Arbuckle,1997).

     [このページのトップへ]


192. Re^3: ステップワイズ重回帰分析の説明変数について(1)  出口慎二  2000/04/15 (土) 21:28
> (患者Aを世話する世話人Bのストレス度C)において,Aの因子...,Bの因子...の中で,Cに影響しているものはどれどれで,しかもどれが一番影響しているかを検討しようとしています。

だとすると,ストレス度という1つの観測変数を,患者因子と世話人因子の2つの潜在変数で説明するモデルになるのでしょうか.でしたら,機械的に行われる変数選択などを使用せずに,2つの単回帰モデルと上記1つの重回帰モデルの3つのモデルについて回帰分析を行い,比較してみては如何でしょう.

> すなわち,属性あるいは症状因子のなかのどれかがCの原因となるという因果関係を想定しています。

「因子のなかのどれか」というのは観測変数ですか?観測変数まで遡って考える場合,因子に対する観測変数の負荷量と,各因子(潜在変数)に係る回帰係数から,どの観測変数が従属変数(ストレス度C)に影響しているのかを判断することになるかと思います.しかし,通常の(探索的)因子分析では,もとのデータ自体がよほどきれいな単純構造をしていない限り,1つの観測変数が複数の因子に影響をうけるので,解釈が難しくなる場合もあるかと思います.

     [このページのトップへ]


195. Re^4: ステップワイズ重回帰分析の説明変数について(2)  またたび  2000/04/16 (日) 00:04
> 「因子のなかのどれか」というのは観測変数ですか?観測変数まで遡って考える場合,因子に対する観測変数の負荷量と,各因子(潜在変数)に係る回帰係数から,どの観測変数が従属変数(ストレス度C)に影響しているのかを判断することになるかと思います.しかし,通常の(探索的)因子分析では,もとのデータ自体がよほどきれいな単純構造をしていない限り,1つの観測変数が複数の因子に影響をうけるので,解釈が難しくなる場合もあるかと思います.

すみません。因子と書いたのは,観測変数ではなく,因子分析で抽出された因子(自分で意味づけした因子)のことです。自分なりに,おもしろく意味づけできたので,それらの因子もストレス度Cに関係していたらなあと考えています。

     [このページのトップへ]


194. Re^4: ステップワイズ重回帰分析の説明変数について(1)  またたび  2000/04/15 (土) 23:58
出口さん貴重なご教示ありがとうございます。出口さんの説明は大体ふむふむと理解できました。といいつつもう少し教えてください(ほんとにすいません)。前回,「患者Aを世話する世話人Bのストレス度C」云々を検討・・・と単純化して書きましたが,患者因子と世話人因子の2つに説明変数をまとめられる状態ではなく,患者側の変数として,性別(0/1),年齢,自立度(連続変数),入院日数,全般的重症度,症状(20項目)などがあり,世話人側にも年齢,性別,他の援助できる人数があり,これらのうちどれとどれがストレス度Cに影響を与えているかいう,説明変数がかなり多い状態です。そこでせめて患者の症状の20項目だけでも少数の因子にわけようとして,因子分析にて現在6つの因子に分けられいます(無理に因子分析せずに20項目の総得点にしてもいいと最近考えているのですが)。どの変数もある程度独立していますが,ご指摘のように多重共線性をさけるべく,なるだけ相関の強い説明変数はひとつにと考えています。こんなときステップワイズ重回帰分析は解析法として適切でしょうか。

     [このページのトップへ]


196. Re^5: ステップワイズ重回帰分析の説明変数について(1)  出口慎二  2000/04/16 (日) 20:07
> ...患者側の変数として,性別(0/1),年齢,自立度(連続変数),入院日数,全般的重症度,症状(20項目)などがあり,世話人側にも年齢,性別,他の援助できる人数があり,これらのうちどれとどれがストレス度Cに影響を与えているかいう,説明変数がかなり多い状態です。

説明変数には,定量的な変数と定性的な変数が混在しているようですね.この場合,定性的な変数を(各変数ごと1つのカテゴリを除いた)ダミー変数で置き換えれば,重回帰分析は行えます.しかし,この場合の,適切な変数選択の方法は,私はわかりません.ご存知の方,レスお願い致します.

     [このページのトップへ]


197. Re^6: ステップワイズ重回帰分析の説明変数について(1)  またたび  2000/04/16 (日) 23:45
出口さん,どうもありがとうございました。
大変参考になりました。今後は,もう少し独立変数の選択,多重共線性などについて勉強したいと思います。

     [このページのトップへ]


180. Re: ステップワイズ重回帰分析の説明変数について(1)  出口慎二  2000/04/13 (木) 02:41
> 因子スコアを,年齢などの他の変数とともに同時に説明変数として扱って,ステップワイズ重回帰分析に用いることができるのでしょうか。

これに回答する能力はありませんが,以下,ご参考になりましたら.

因子のような潜在的な変数を説明変数に取り込んで重回帰を解くこと自体は行われていると思います.少なくとも,行われていました.さらに変数選択を行うことが行われているのかどうかは知りません.

補足(?)を2点ほど.

1)このように潜在的な変数と,直接測定できる変数を混在させたモデルの分析手法としては,共分散構造分析があります.この手法が用いられる以前は,直接測定できる変数から因子分析によって因子を抽出し,この因子を変数として(重)回帰分析を(繰り返し)行うことで,変数(因子)間の因果関係を分析する(パス分析)ことが行われていました.しかし,共分散構造分析が使われる様になってからは,この手法の方が,モデル全体を1回で分析するため,前述の「因子分析+パス分析」という手法に秀でる部分が多く,現在もって「因子分析+パス分析」という手法が使われているのかは分かりません.尚,共分散構造分析の親しみ易い文献としては,

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 007 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る