No.20841 分析手法  【はる】 2014/02/08(Sat) 07:06

点検データを利用して,ある事象の発生の原因を調べたいと思います。データは目的変数も説明変数も質的データです。このような場合に数量化二類を適用して問題ないでしょうか。事象は全サンプルの2割でしか発生していません。

No.20842 Re: 分析手法  【青木繁伸】 2014/02/08(Sat) 08:05

数量化II類はダミー変数を使った判別分析に過ぎません。
従属変数が二値変数だとロジスティック判別分析(ロジスティック回帰分析)のほうがよいかもしれませんね。
多値変数だと,順序ロジスティックとなりますが,その場合は判別分析のほうが分かりやすいかも。

No.20852 Re: 分析手法  【はる】 2014/02/09(Sun) 22:27

ありがとうございます。従属変数は2値変数です。ロジスティック,勉強してみます。取り急ぎ,御礼申し上げます。

No.20854 Re: 分析手法  【はる】 2014/02/10(Mon) 09:45

ロジスティック回帰を行う予定ですが,説明変数のサンプルサイズがバラバラです。
たとえば,Y1=700.X1=700.X2=500,X3=300サンプルになっていて,すべての値があるものにあわせるとサンプル数が300になってしまいます。扱うサンプルサイズは従属変数,説明変数すべて同じでないとだめなんでしょうか?

No.20855 Re: 分析手法  【青木繁伸】 2014/02/10(Mon) 09:51

> 扱うサンプルサイズは従属変数,説明変数すべて同じでないとだめなんでしょうか?

つまり,変数により欠損値があるということでしょう?
欠損値をふくむケースはどのようにして取り扱うつもりですか?欠損値の補完をしないとすれば,分析に使う変数のうちで欠損値を1つでも含むケースは除外するしかないでしょう。

No.20856 Re: 分析手法  【はる】 2014/02/10(Mon) 14:22

欠損値を補完できないません。なので,事前に説明変数を絞りたいと思います。その場合,カイ二乗検定で5%有意となる組み合わせを関連性がある(独立ではないと判定)として,説明変数を選んできていいものでしょうか?

No.20857 Re: 分析手法  【青木繁伸】 2014/02/10(Mon) 16:18

> カイ二乗検定で5%有意となる組み合わせを関連性がある(独立ではないと判定)として,説明変数を選んできていいものでしょうか

ダメです。単変量(二変量)解析の結果を寄せ集めても,多変量の結果にはなりません。だってそうでしょう。単変量(二変量)解析の結果を寄せ集めて事足りるなら,多変量解析なんか不要ということになる訳ですから。

まあ,説明変数の個数も少ないのだから,すべての変数の組合せでモデルを作り,結果を吟味すればよいでしょう。

● 「統計学関連なんでもあり」の過去ログ--- 046 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る