★ 数量化I類について ★

 88 数量化I類について  nacci  2000/12/27 (水) 19:33
  90 Re: 数量化I類について  上田太一郎  2000/12/27 (水) 21:10
   91 Re^2: 数量化I類について  nobody  2000/12/27 (水) 23:20
    94 Re^3: 数量化I類について  上田太一郎  2000/12/28 (木) 13:39
     95 Re^4: 数量化I類について  nobody  2000/12/28 (木) 16:31
      96 Re^5: 数量化I類について  上田太一郎  2000/12/28 (木) 17:04
       97 Re^6: 数量化I類について  nobody  2000/12/28 (木) 17:54
        98 Re^7: 数量化I類について  上田太一郎  2000/12/28 (木) 22:21
  89 Re: 数量化I類について  nobody  2000/12/27 (水) 20:39


88. 数量化I類について  nacci  2000/12/27 (水) 19:33
質問します。
非数量的な説明変数から数量的な従属変数を説明することが数量化I類と認識していますが,
説明変数に非数量的なものと数量的なものが混在している場合, 数量化I類の理論は使えるのでしょうか?
教えて頂けないでしょうか?
お願いします。

     [このページのトップへ]


90. Re: 数量化I類について  上田太一郎  2000/12/27 (水) 21:10
数量化I類はnobodyさんがずばりご回答されているとおりで,ダミー変数が入っている回帰分析と一致します。そのとき,要因分析はどうするかということになります。例えばこれを影響度とすると,回帰係数*レンジとなります。事例は弊著「Excelでできるデータマイニング入門」などを参照ください。

     [このページのトップへ]


91. Re^2: 数量化I類について  nobody  2000/12/27 (水) 23:20
> ダミー変数が入っている回帰分析と一致します。
> そのとき,要因分析はどうするかということになります。
> 例えばこれを影響度とすると,回帰係数*レンジとなります。

レインジは,最大のカテゴリースコア,マイナス,最小のカテゴリースコアで, 回帰係数というのが偏回帰係数というのを意味しているのなら,カテゴリースコアは偏回帰係数を(ある意味で)正規化したものなので, 「回帰係数*レンジ」という解釈はよく分からないのですがどういうことでしょうか。

     [このページのトップへ]


94. Re^3: 数量化I類について  上田太一郎  2000/12/28 (木) 13:39
> レインジは,最大のカテゴリースコア,マイナス,最小のカテゴリースコアで,回帰係数というのが偏回帰係数というのを意味しているのなら,カテゴリースコアは偏回帰係数を(ある意味で)正規化したものなので,「回帰係数*レンジ」という解釈はよく分からないのですがどういうことでしょうか。
説明不足でした。すみません。ダミー変数の場合はカテゴリスコアのレンジでOKですが,定量的なデータのときは回帰係数*レンジとなります。

     [このページのトップへ]


95. Re^4: 数量化I類について  nobody  2000/12/28 (木) 16:31
> ダミー変数の場合はカテゴリスコアのレンジでOKですが,定量的なデータのときは回帰係数*レンジとなります。

わかりにくいので再確認します。
この場合のレインジは,定量的データの「最大値-最小値」ということですね。

引用は適切に。

     [このページのトップへ]


96. Re^5: 数量化I類について  上田太一郎  2000/12/28 (木) 17:04
> わかりにくいので再確認します。
> この場合のレインジは,定量的データの「最大値-最小値」ということですね。

そのとおりです。

     [このページのトップへ]


97. Re^6: 数量化I類について  nobody  2000/12/28 (木) 17:54
> 定量的なデータのときは回帰係数*レンジとなります。

この件ですが,なぜ「回帰係数*レンジ」なのかを考えてみます。

「回帰係数×独立変数の標準偏差/従属変数の標準偏差」は「標準化偏回帰係数」ですよね。
偏回帰係数 b1,b2,独立変数の標準偏差s1,s2,独立変数の標準偏差 sy,標準化偏回帰係数 β1,β2 とします。

β1=b1*s1/sy
β2=b2*s2/sy
です。
標準偏差の推定値としてレインジR1,R2が使われることがあります。
標準偏差はレインジの関数でしょう。
s1≒k*R1
s2≒k*R2
よって,
β1≒b1*k*R1/sy=b1*R1*κ
β2≒b2*k*R2/sy=b2*R2*κ
(κ=k/sy)
要するに,偏回帰係数にレインジを掛けた数値で影響度を評価しようとするのは,「標準化偏回帰係数」で評価することの近似値でしょう。

Excel の回帰分析ツールではどういう訳か標準化偏回帰係数が計算されないのでこの簡便法を使うのかもしれないが,どのような統計学の教科書にも書いてある正統的なやり方を使った方がいいでしょう。

     [このページのトップへ]


98. Re^7: 数量化I類について  上田太一郎  2000/12/28 (木) 22:21
&> Excel の回帰分析ツールではどういう訳か標準化偏回帰係数が計算されないのでこの簡便法を使うのかもしれないが,どのような統計学の教科書にも書いてある正統的なやり方を使った方がいいでしょう。
>
> もう一度書きます。
> 引用は適切に!
そのとおりだと思います。

     [このページのトップへ]


89. Re: 数量化I類について  nobody  2000/12/27 (水) 20:39
> 説明変数に非数量的なものと数量的なものが混在している場合,数量化I類の理論は使えるのでしょうか?

林知己夫という統計学の大先生を擁した日本ならではの質問ですね。

お答えしましょう。

その1
 西洋においては,当然ながら数量化I類などというものは存在しません。
 なにがあるか? ダミー変数を使った重回帰分析しかありません。

その2
 ダミー変数って何ですか?
 選択肢をn個持つ質問では,n-1 個のダミー変数を作ります。
 例えば,「賛成」,「中立」,「反対」という選択肢を持つ質問への回答をデータファイルとするときに,「賛成か?yes/no」,「中立か?yes/no」という2つのダミー変数を作ります。知れぞれの変数の回答は0/1で表します。それでもって,他の間隔尺度・比尺度の変数と同じように取り扱って重回帰分析するのです。

つまり,なんだかんだいっても,「数量化理論I類というのは,ダミー変数を使った重回帰分析」,「数量化II類というのは,ダミー変数を使った判別分析」にすぎないということです。

いや〜〜,まったくもって簡潔明瞭。

#異論反論があるのは承知の上。ご意見無用!!!(^_^;)(^_^;)(^_^;)(^_^;)(^_^;)

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 012 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る