★ 重回帰分析 ★

1662. 重回帰分析 鈴木 2004/01/08 (木) 16:26
└1671. Re: 重回帰分析 冨田雅一 2004/01/08 (木) 21:07
 ├1683. Re^2: 重回帰分析 鈴木 2004/01/09 (金) 04:26
 │├1686. Re^3: 重回帰分析 青木繁伸 2004/01/09 (金) 08:11
 ││└1706. Re^4: 重回帰分析 鈴木 2004/01/09 (金) 23:43
 │└1684. Re^3: 重回帰分析 冨田雅一 2004/01/09 (金) 08:09
 │ └1687. Re^4: 重回帰分析 青木繁伸 2004/01/09 (金) 08:31
 │  ├1705. Re^5: 重回帰分析 冨田雅一 2004/01/09 (金) 23:43
 │  │└1708. Re^6: 重回帰分析 青木繁伸 2004/01/10 (土) 09:57
 │  │ └1712. Re^7: 重回帰分析 冨田雅一 2004/01/10 (土) 16:49
 │  │  └1715. Re^8: 重回帰分析 青木繁伸 2004/01/10 (土) 18:38
 │  │   └1716. Re^9: 重回帰分析 冨田雅一 2004/01/10 (土) 23:05
 │  │    └1725. Re^10: 重回帰分析 青木繁伸 2004/01/11 (日) 09:28
 │  │     └1729. Re^11: 重回帰分析 冨田雅一 2004/01/11 (日) 12:13
 │  │      └1731. Re^12: 重回帰分析 青木繁伸 2004/01/11 (日) 13:29
 │  │       └1754. Re^13: 重回帰分析 冨田雅一 2004/01/11 (日) 23:44
 │  └1688. Re^5: 重回帰分析 青木繁伸 2004/01/09 (金) 08:32
 │   ├1707. Re^6: 重回帰分析 冨田雅一 2004/01/10 (土) 00:25
 │   └1690. Re^6: 重回帰分析 青木繁伸 2004/01/09 (金) 08:35
 │    └1709. Re^7: 重回帰分析 冨田雅一 2004/01/10 (土) 13:49
 └1672. Re^2: 重回帰分析 青木繁伸 2004/01/08 (木) 21:16
  └1675. Re^3: 重回帰分析 冨田雅一 2004/01/08 (木) 22:52


1662. 重回帰分析 鈴木  2004/01/08 (木) 16:26
ある変数を1多い2やや多い3普通4やや少ない5少ないで回答をもとめ目的変数をある1ない0の2値にして,年齢,性別と一緒に投入してロジスティック重回帰分析をしました。これは,正しいでしょうか?また,このような順序尺度は重回帰分析でも使えますか?

     [このページのトップへ]


1671. Re: 重回帰分析 冨田雅一  2004/01/08 (木) 21:07
僭越ながら所存を述べます。私に誤解があれば諸賢の訂正を願います。

> これは,正しいでしょうか?また,このような順序尺度は重回帰分析でも使えますか?
正しくないと思います。例えば,1の回答と2回答の足し算は3の回答と同値ということになってしまいます。あくまで順序でけを問題にしているので,このような計算は無意味です。

> ある変数を1多い2やや多い3普通4やや少ない5少ないで回答をもとめ目的変数をある1ない0の2値にして,年齢,性別と一緒に投入してロジスティック重回帰分析をしました。
順序尺度をダミー変数に変換するか,むしろ順序尺度を目的変数にして多項反応データとして分析するのが適当だと思います。後者を順序ロジット・モデルといいます。
牧,宮内,浪花,縄田「応用計量経済学II(シリーズ第3巻)」(多賀出版)P254以下(数値例あり)
Greene"EconometricAnalysis"(the4th edition) P875-879

なお,SPSSの多項ロジスティック回帰と似ていますが,これは質的従属変数について順序を問題としないモデルです。

     [このページのトップへ]


1683. Re^2: 重回帰分析 鈴木  2004/01/09 (金) 04:26

> > これは,正しいでしょうか?また,このような順序尺度は重回帰分析でも使えますか?
> 正しくないと思います。例えば,1の回答と2回答の足し算は3の回答と同値ということになってしまいます。あくまで順序でけを問題にしているので,このような計算は無意味です。
>

お返事ありがとうございました。

1の回答と2の回答の足し算は3の回答と同値・・というのは・・順序尺度は間隔尺度ではないのでロジスティックにも
重回帰にも使えないということでしょうか?

従属変数0と1に年齢,性別,順序尺度をダミー変数にして独立変数として投入すればよいですか?
あと,ダミー変数をつくれば重回帰分析にも投入できますか?
従属変数(連続変数)=年齢,ダミー変数(独立変数)
・・・
この場合性別は入れられないので,性別でわけて
それぞれ
女性  従属変数=年齢,ダミー変数
男性  充足変数=年齢,ダミー変数
とすればよろしいでしょうか?

順序尺度を目的変数にして多項反応データとして分析するのが適当だと思います。後者を順序ロジット・モデルといいます。

多項反応データとしたあとに独立変数としてロジスティック重回帰分析の独立変数として投入できるということでしょうか?

初心者なので具体的な解析方法がのっている書物をご紹介頂けるとありがたいです。数式がいっぱい出ていてもいざやってみようとするとどうして良いかわからず,いつもここにメールでご助言を求めています。よろしくお願いします。

     [このページのトップへ]


1686. Re^3: 重回帰分析 青木繁伸  2004/01/09 (金) 08:11
> 従属変数0と1に年齢,性別,順序尺度をダミー変数にして独立変数として投入すればよいですか?
> あと,ダミー変数をつくれば重回帰分析にも投入できますか?
> 従属変数(連続変数)=年齢,ダミー変数(独立変数)

その通り,何の問題もなくできます。

> この場合性別は入れられないので,性別でわけて
> それぞれ
> 女性  従属変数=年齢,ダミー変数
> 男性  充足変数=年齢,ダミー変数
> とすればよろしいでしょうか?

性別は,ダミー変数の一種です。(この掲示板でも何回となくし適し続けています。つい最近 FAQ 材料としても掲載)
ダミー変数の本質は,「ふたつの値のうちのいずれかを取る二値変数」です。二値変数としては 0/1 データがもっとも扱いやすい(掛算が必要ないというだけだが,実地での計算などが簡単)
つまり,性別(男:1,女:2)をそのまま独立変数として使えます。

数量化I類と重回帰分析,数量化II類と判別分析の関係についても,
http://aoki2.si.gunma-u.ac.jp/LaTeX/sreg-qt1.pdf
http://aoki2.si.gunma-u.ac.jp/LaTeX/sdis-qt2.pdf
を参照いただくと理解が深くなるのではないでしょうか。

     [このページのトップへ]


1706. Re^4: 重回帰分析 鈴木  2004/01/09 (金) 23:43
お返事ありがとうございます。
よくわかりました。

     [このページのトップへ]


1684. Re^3: 重回帰分析 冨田雅一  2004/01/09 (金) 08:09
鈴木様

> 順序尺度は間隔尺度ではないのでロジスティックにも重回帰にも使えないということでしょうか?
順序尺度を重回帰に使ったことはありません。

> 順序尺度をダミー変数にして独立変数として投入すればよいですか?
> あと,ダミー変数をつくれば重回帰分析にも投入できますか?
そう思ったのですが,うまくいかないですね。なぜなら選択肢の数だけダミー変数をつくって,当該の回答があったときを1,それ以外を0とするのであれば,順序性を表現できていないからです。以前,同様のアンケートを処理しようとして,この問題に突き当たりました。その時の選択肢は次のようなものでした。
1簡単  2それほど簡単ではない  3難しい  4非常に難しい

そこで,まず回答1のとき値1,回答2〜4のとき値0というダミー変数による重回帰,次に回答1〜2のとき値1,回答3〜4のとき値0というダミー変数による重回帰,そして回答1〜3のとき値1,回答4のとき値0というダミー変数による重回帰と,3つの重回帰をしてみたのです。結局,そのうちの1つしかダミー変数の係数に有意な結果が得られたものがなかったように思います。それなら順序尺度というより名義尺度ということになるでしょう。

次いで,回答3を答えた人は回答2の程度を含んでいるとみなして回答2と回答3のダミー・データとして値1を,回答4を答えた人は回答3及び回答2の程度を含んでいるとみなして回答2〜4にのダミー・データとして値1をつくってみたのです。ところが端の選択肢についての回答が少ないせいか,多重共線性を来たしたようでした。

結局,順序尺度を説明変数として使うことを諦めたのです。そして,むしろ順序尺度を質的従属変数として順序ロジット・モデルを使って,集めたデータを活かす方法をとったのです。これが不遜ながら提案のよなことを申し上げた理由です。

なお,私も順序尺度を説明変数として重回帰する方法があれば知りたいです。

     [このページのトップへ]


1687. Re^4: 重回帰分析 青木繁伸  2004/01/09 (金) 08:31
> そう思ったのですが,うまくいかないですね。なぜなら選択肢の数だけダミー変数をつくって,当該の回答があったときを1,それ以外を0とするのであれば

選択肢がn個あるとき,必要なダミー変数の個数は(n−1)ですが,そこのところはよろしいですか?

> 順序性を表現できていないからです。

確かにダミー変数間の順序性はどこにも存在しなくなります。
しかし,通常は,常識の範囲内での順序性は,データが保証してくれると思います。もし,ダミー変数に付与される係数(数値;数量化データ)の大きさが順序尺度と対応していないなら,選択肢の選択が不適切である可能性もありましょう(「ときどき」と「しばしば」と「ときに」などなど,順序のあいまいな選択肢など)。

数量化I類の場合には選択肢の数量化は一通りしか出ませんが,数量化II類,数量化III類の場合には数量化は複数通りあることがあります。最初の数量化軸は,前述の理由から順序が保存されることが多いのですが,二番目以降の数量化軸では,常識的な順序関係は出てきません(これはこれで問題になる)。

     [このページのトップへ]


1705. Re^5: 重回帰分析 冨田雅一  2004/01/09 (金) 23:43
>> 選択肢の数だけダミー変数をつくって,

> 選択肢がn個あるとき,必要なダミー変数の個数は(n−1)ですが,そこのところはよろしいですか?

心得ています。重大な言い間違いをしてしまいました。


> しかし,通常は,常識の範囲内での順序性は,データが保証してくれると思います。

おそらくそういうことになるだろうと推察はできます。しかし,私は順序性をどのように表現すればよいのだろうかということにこだわってしまったのです。


> 数量化II類,数量化III類の場合には数量化は複数通りあることがあります。最初の数量化軸は,前述の理由から順序が保存されることが多いのですが,二番目以降の数量化軸では,常識的な順序関係は出てきません(これはこれで問題になる)。

具体的には,どんな選択肢をどのように数量化する場合でしょうか。すでに集まったアンケートを分析するのに使えないものか,どうか試してみたいのです。

     [このページのトップへ]


1708. Re^6: 重回帰分析 青木繁伸  2004/01/10 (土) 09:57
> > 数量化II類,数量化III類の場合には数量化は複数通りあることがあります。最初の数量化軸は,前述の理由から順序が保存されることが多いのですが,二番目以降の数量化軸では,常識的な順序関係は出てきません(これはこれで問題になる)。
>
> 具体的には,どんな選択肢をどのように数量化する場合でしょうか。

以下は健康調査のデータを数量化III類で分析した例です。
4つの変数はそれぞれ「はい」,「どちらでもない」,「いいえ」という選択肢を持っています。
解1では,おおむねこの順序に数値が付与されています。解2では違った順序になっています。また,X021 は他の変数と違って,解1と解2での数値の付与が逆になっていますね。
など,いろいろなことがわかります。
***** カテゴリースコア *****

アイテム-カテゴリー      解1       解2       解3

  1 X008       1    -2.53493  -2.36486   0.19588
  2            2    -0.04010   0.83621   0.00225
  3            3     1.40782  -1.74429  -0.10582

  4 X021       1    -2.17335  -1.46076   0.22900
  5            2     0.64210  -0.58726  -1.81768
  6            3     0.20254   0.84931   1.20368

  7 X029       1    -1.79690  -2.11770  -0.86664
  8            2    -0.65698   1.08189  -0.20833
  9            3     1.05629  -0.61129   0.40091

 10 X096       1    -1.22677   0.15765   0.37979
 11            2     0.49112   0.69221  -2.00539
 12            3     1.14457  -0.90240   1.49901

     [このページのトップへ]


1712. Re^7: 重回帰分析 冨田雅一  2004/01/10 (土) 16:49
丁寧なる回答ありがとうございます。

> 解1では,おおむねこの順序に数値が付与されています。

「常識の範囲内での順序性」をデータが保証しているということですね。


> 解2では違った順序になっています。また,X021 は他の変数と違って,解1と解2での数値の付与が逆になっていますね。

この例の場合,回答の順序に反映している解1が回答を決定する最大要因であり,解1と直交する解2(ないし解3)は必ずしも回答の順序とは一致せず,むしろ常識的な順序関係に対するバイアスをもたらす要因である,という解釈でよろしいでしょうか。


このような丁寧な回答をいただきながら,まことに恐縮ですが,「数量化II類,数量化III類の場合には数量化は複数通りあることがあります」ということについて,今一度,ご教示いただきたいです。
順序尺度によるn個の選択肢について,重回帰の場合は(n−1)個のダミー変数に変換しますが,この例のように数量化III類の場合,カテゴリーとして採用する選択肢を取捨選択することにより,n個以下のダミー変数に変換することがあるというこでしょうか。

     [このページのトップへ]


1715. Re^8: 重回帰分析 青木繁伸  2004/01/10 (土) 18:38
> この例の場合,回答の順序に反映している解1が回答を決定する最大要因であり,解1と直交する解2(ないし解3)は必ずしも回答の順序とは一致せず,むしろ常識的な順序関係に対するバイアスをもたらす要因である,という解釈でよろしいでしょうか。

バイアスとかそういうことではありません。

私の挙げた例では,解2は,「どちらでもない」というのは,「はい」とか「いいえ」の間にあるものではない。ということを示しているのですね。

質問の内容はあえて示しませんが,「その質問にははいとかいいえとかでは答えられない」という人もいるということを示していると考えることもできるわけです。

> 順序尺度によるn個の選択肢について,重回帰の場合は(n−1)個のダミー変数に変換しますが,この例のように数量化III類の場合,カテゴリーとして採用する選択肢を取捨選択することにより,n個以下のダミー変数に変換することがあるというこでしょうか。

カテゴリーを併合するのは,結果を見て回答数の少ない選択肢で意味的に併合してもよい選択肢があるなら併合してもよいと言うことです。
結果をみてというのは非常に曖昧ですが,それはケースバイケースによるしかないでしょう。
数量化は,回答数の少ないカテゴリーに大きめのスコアを与える傾向があるので,回答数の少ないカテゴリーは併合するのがいいかもしれない。

     [このページのトップへ]


1716. Re^9: 重回帰分析 冨田雅一  2004/01/10 (土) 23:05
数量化が複数通りあるとは,選択肢の併合のことだったのですね。
また,数量化軸の解釈はよくわかりました。ありがとうございます。

     [このページのトップへ]


1725. Re^10: 重回帰分析 青木繁伸  2004/01/11 (日) 09:28
> 数量化が複数通りあるとは,選択肢の併合のことだったのですね。

違います。
選択肢の併合の如何に関わらず,実際に分析に使用される延べ選択肢とケース数によって,必ず複数決まります。そのうちで,意味のあるものは最初からいくつかですが。

     [このページのトップへ]


1729. Re^11: 重回帰分析 冨田雅一  2004/01/11 (日) 12:13
> 選択肢の併合の如何に関わらず,実際に分析に使用される延べ選択肢とケース数によって,必ず複数決まります。

まず「ケース」数とは,SPSSでいう「ケース」概念でよろしいでしょうか。

「数量化は複数通りある」の「複数通り」の意味が飲み込めないのです。「カテゴリーを併合するのは,結果を見て回答数の少ない選択肢で意味的に併合してもよい選択肢があるなら併合してもよい」ということなので,併合可能な「場合の数」をイメージしていたのですが,併合と関係なく「複数」ということなので,またイメージを描けずにいます。

「必ず複数決ま」るとは,どのようなプロセスによるものなのでしょうか。


しつこい質問で申し訳ございません。

     [このページのトップへ]


1731. Re^12: 重回帰分析 青木繁伸  2004/01/11 (日) 13:29
> まず「ケース」数とは,SPSSでいう「ケース」概念でよろしいでしょうか。

多分そうでしょう。n×p データ行列で,pが変数の個数,nがケース数でしょう。

> 「数量化は複数通りある」の「複数通り」の意味が飲み込めないのです。

前の例で示した例で言えば,そこには3通りの数量化が示されていましたね(実際には,8通りの数量化が得られていたが省略した)。

軸とか,解とか呼ばれるものです。データから作成された正方行列の固有値・固有ベクトルを求める問題になり,得られる固有値・固有ベクトルのセットから導かれる訳です。主成分分析も同じように固有値・固有ベクトルのセットから導かれる複数の主成分・主成分負荷量が得られますね。それとおなじようなことです。

     [このページのトップへ]


1754. Re^13: 重回帰分析 冨田雅一  2004/01/11 (日) 23:44
> 軸とか,解とか呼ばれるものです。

了解。だから「必ず複数決まります。そのうちで,意味のあるものは最初からいくつか」なのですね。

忍耐強いご回答,ありがとうございました。

     [このページのトップへ]


1688. Re^5: 重回帰分析 青木繁伸  2004/01/09 (金) 08:32
> そこで,まず回答1のとき値1,回答2〜4のとき値0というダミー変数による重回帰,次に回答1〜2のとき値1,回答3〜4のとき値0というダミー変数による重回帰,そして回答1〜3のとき値1,回答4のとき値0というダミー変数による重回帰と,3つの重回帰をしてみたのです。結局,そのうちの1つしかダミー変数の係数に有意な結果が得られたものがなかったように思います。それなら順序尺度というより名義尺度ということになるでしょう。

前述した,必要なダミー変数の個数の問題のほかに,そのデータがそのようであったということで,一般的なものではないと思います。別のスレッドに示したように,順序尺度の選択肢を二つのグループにして一方を0,他方を1としても,それは名義尺度ではありますが,順序がついているので順序尺度でもあり,さらに驚くかもしれませんが,間隔尺度なんですね。ダミー変数は二値変数で,ダミー変数を重回帰分析や判別分析などに用いてよいと言うことは,「ダミー変数は間隔尺度である」からです。

> 次いで,回答3を答えた人は回答2の程度を含んでいるとみなして回答2と回答3のダミー・データとして値1を,回答4を答えた人は回答3及び回答2の程度を含んでいるとみなして回答2〜4にのダミー・データとして値1をつくってみたのです。ところが端の選択肢についての回答が少ないせいか,多重共線性を来たしたようでした。

このようにすると,同じ変数に所属するダミー変数が相互従属になるので,多重共線性を来しても不思議ではないと思います。同じ変数に由来するダミー変数は「相互に完全に独立です(相関0)」。

     [このページのトップへ]


1707. Re^6: 重回帰分析 冨田雅一  2004/01/10 (土) 00:25
ご高評いただきありがとうございます。

> ダミー変数は二値変数で,ダミー変数を重回帰分析や判別分析などに用いてよいと言うことは,「ダミー変数は間隔尺度である」からです。

ご教示いただいたので理解できます。ご推察の通り,新鮮な「驚き」がありました。


> 同じ変数に由来するダミー変数は「相互に完全に独立です(相関0)」。

これが選択肢をダミー変数に変換するときの要点ですね。また,だから「ダミー変数間の順序性はどこにも存在しなくなります」ということなのですね。

     [このページのトップへ]


1690. Re^6: 重回帰分析 青木繁伸  2004/01/09 (金) 08:35

> 結局,順序尺度を説明変数として使うことを諦めたのです。そして,むしろ順序尺度を質的従属変数として順序ロジット・モデルを使って,集めたデータを活かす方法をとったのです。これが不遜ながら提案のよなことを申し上げた理由です。

順序ロジット・モデルについて知らないので教えていただきたいのですが,,,
どのような場合でもそうではありませんが,重回帰モデルに関与する変数は原因変数と結果変数があり(前者が独立変数,後者が従属変数),これを入れ替えるというか,原因変数の一つを従属変数とするということの意味はどうなるのでしょうか。

     [このページのトップへ]


1709. Re^7: 重回帰分析 冨田雅一  2004/01/10 (土) 13:49
>> 結局,順序尺度を説明変数として使うことを諦めたのです。そして,むしろ順序尺度を質的従属変数として
> どのような場合でもそうではありませんが,重回帰モデルに関与する変数は原因変数と結果変数があり(前者が独立変数,後者が従属変数),これを入れ替えるというか,原因変数の一つを従属変数とするということの意味はどうなるのでしょうか。

あるモデルで説明変数として使おうとしていた順序尺度の変数を,別のモデルで質的従属変数として使うということです。すでに回収したアンケートについて,そのデータから何かいえないか,どんな分析をすれば傾向がつかめるかというところから始めたからです。アンケート調査は問題意識に基づいて計画(plan),実施(do)するのが本来であって,評価(see)の段階で「集めたデータを活かす方法」を模索するのはよくないのですが,集計していく過程で,感覚として質問項目間になんらかの傾向がうかがえると,適当な数量的処理はないものかと思ったのです。

     [このページのトップへ]


1672. Re^2: 重回帰分析 青木繁伸  2004/01/08 (木) 21:16
> > これは,正しいでしょうか?また,このような順序尺度は重回帰分析でも使えますか?
> 正しくないと思います。

私も正しくないと思います。つまり間隔尺度ではないからです。

> 順序尺度をダミー変数に変換するか,むしろ順序尺度を目的変数にして多項反応データとして分析するのが適当だと思います。後者を順序ロジット・モデルといいます。

原質問者の用語法が曖昧なのですが,年齢・性別・そして件の順序尺度は独立変数,0/1データが従属変数なのだと読みました。
件の順序尺度を従属変数として分析せよと言うことなんでしょうか?

     [このページのトップへ]


1675. Re^3: 重回帰分析 冨田雅一  2004/01/08 (木) 22:52
> 原質問者の用語法が曖昧なのですが,年齢・性別・そして件の順序尺度は独立変数,0/1データが従属変数なのだと読みました。
私もそのように読みました。

> 件の順序尺度を従属変数として分析せよと言うことなんでしょうか?
そうです。以前,順序尺度を従属変数としたモデルに取り組んだことがあったので提案のつもり述べたのです。上記のようなモデルで分析したいというのが原質問者の意図なのですから,余計なお世話でした。
失礼しました。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 027 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る