★ 判別分析か数量化II類か ★
421 判別分析か数量化II類か 下手の横好き 2003/05/21 (水) 13:57
422 Re: 判別分析か数量化II類か 青木繁伸 2003/05/21 (水) 16:34
426 Re^2: 判別分析か数量化II類か 下手の横好き 2003/05/21 (水) 19:55
431 Re^3: 判別分析か数量化II類か 青木繁伸 2003/05/21 (水) 23:18
432 Re^4: 判別分析か数量化II類か 下手の横好き 2003/05/21 (水) 23:57
421. 判別分析か数量化II類か 下手の横好き 2003/05/21 (水) 13:57 |
度々すみませんが,質問させていただきます。質的データと量的データの混じったデータから,2群もしくは3群の判別(予測)をしたいと思っています。
そこで質問なのですが,量的データを一定の基準を設けて質的データに変換して数量化II類で分析する方法と,質的データをダミー変数に変換して判別分析で分析する方法とを考えましたが,以下のような理由からどちらで分析したものか悩んでいます。
1 数量化II類の場合,量的データの質的データへの変換の際に恣意が入り込み,情報の損失もある。
2 判別分析の場合,ダミー変数に変換することで,変数の数が増えるとともに,そもそもカテゴリーとして一つの変数だったものがいくつにも別れるため,カテゴリーとしての影響度が結果が読み取りにくそう。
,という感じで迷っています。
どうしたものか,ご教授お願いします。
|
[このページのトップへ]
422. Re: 判別分析か数量化II類か 青木繁伸 2003/05/21 (水) 16:34 |
> 2 判別分析の場合,ダミー変数に変換することで,変数の数が増えるとともに,そもそもカテゴリーとして一つの変数だったものがいくつにも別れるため,カテゴリーとしての影響度が結果が読み取りにくそう。
情報の損失という観点からも,2の方法をお勧めします。
カテゴリーとしての影響度は,アイテムの偏相関係数を求めることでアイテムとしての影響度を把握できるので大丈夫ではないでしょうか。 |
[このページのトップへ]
426. Re^2: 判別分析か数量化II類か 下手の横好き 2003/05/21 (水) 19:55 |
> カテゴリーとしての影響度は,アイテムの偏相関係数を求めることでアイテムとしての影響度を把握できるので大丈夫ではないでしょうか。
度々のご教授ありがとうございます。
ダミー変数を用いて分析してみようと思います。ところで,もう一つ理解が足りないこともあり,またまた質問なのですが,ダミー変数の利用に当たり,青木先生の論文(数量化II類と判別分析に関するもの)を参考に勉強させていただいたのですが,この中でアイテム変数に対応するダミー変数の内,一つを除くという手法の主旨は理解できたのですが,この除かれたダミー変数が指すアイテムのカテゴリーの影響関係はどの洋にして知ることができるのかがよく分かりません。
例えば,「色」というアイテムについて選択肢が「赤」「緑」「青」と3つ用意されているとします。これを,ダミー変数に展開し,「赤」に相当するダミー変数を削除した場合,もし仮に「赤」が従属変数に大きな影響を与えているとしても,これをたまたま除いてしまうと「色」とういうアイテムの影響度がうまく結果に示されないと思うのですが,いかがなものなのでしょうか。ご教授お願いします。 |
[このページのトップへ]
431. Re^3: 判別分析か数量化II類か 青木繁伸 2003/05/21 (水) 23:18 |
> 例えば,「色」というアイテムについて選択肢が「赤」「緑」「青」と3つ用意されているとします。これを,ダミー変数に展開し,「赤」に相当するダミー変数を削除した場合,もし仮に「赤」が従属変数に大きな影響を与えているとしても,これをたまたま除いてしまうと「色」とういうアイテムの影響度がうまく結果に示されないと思うのですが,いかがなものなのでしょうか。ご教授お願いします。
除かれるカテゴリーは,0という重みを持つわけですね。しかし,この0は,「ない」というのとは違い,たのカテゴリーがどういう値を取るかによって相対的に決まるのです。
もし,赤が一番大きい(正の)影響を与えるのだとしましょう。
赤を0とすると,緑は -5,青は -10 と言うようになるだけです。
この中で一番小さいもの(青)を 0 とすると赤は+10 ですね。緑は +5。というわけで,赤はちゃんと一番大きな正の影響を与えるのです。
0というのはあくまでも「基準」ということで,「影響がない」というのではありません。
(同じデータを分析するのに,どのカテゴリーを基準にするかで答えが変わってしまうわけがありませんね) |
[このページのトップへ]
432. Re^4: 判別分析か数量化II類か 下手の横好き 2003/05/21 (水) 23:57 |
> 除かれるカテゴリーは,0という重みを持つわけですね。しかし,この0は,「ない」というのとは違い,たのカテゴリーがどういう値を取るかによって相対的に決まるのです。
> もし,赤が一番大きい(正の)影響を与えるのだとしましょう。
>
> 赤を0とすると,緑は -5,青は -10 と言うようになるだけです。
> この中で一番小さいもの(青)を 0 とすると赤は+10 ですね。緑は +5。というわけで,赤はちゃんと一番大きな正の影響を与えるのです。
>
> 0というのはあくまでも「基準」ということで,「影響がない」というのではありません。
>
> (同じデータを分析するのに,どのカテゴリーを基準にするかで答えが変わってしまうわけがありませんね)
夜遅くまで本当にありがとうございます。大変勉強になりました。すっきりした気持ちで安眠できそうです。また,何かありましたらよろしくご教授お願いします。感謝!感謝!です。
|
[このページのトップへ]
● 「統計学関連なんでもあり」の過去ログ--- 024 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る