★ 数量化II類の軸について ★

1106. 数量化II類の軸について 卒研生 2003/11/21 (金) 17:47
└1108. Re: 数量化II類の軸について 青木繁伸 2003/11/21 (金) 19:42
 └1109. Re^2: 数量化II類の軸について 卒研生 2003/11/22 (土) 11:53
  └1110. Re^3: 数量化II類の軸について 青木繁伸 2003/11/22 (土) 14:22
   └1116. Re^4: 数量化II類の軸について 卒研生 2003/11/22 (土) 19:27
    ├1119. Re^5: 数量化II類の軸について 青木繁伸 2003/11/22 (土) 23:18
    └1118. Re^5: 数量化II類の軸について 青木繁伸 2003/11/22 (土) 23:12
     └1120. Re^6: 数量化II類の軸について 卒研生 2003/11/23 (日) 12:28


1106. 数量化II類の軸について 卒研生  2003/11/21 (金) 17:47
初めまして。
現在数量化II類を用いて卒業研究をやっているものです。

今,説明変数を2個。目的変数を19個。サンプルサイズ3742件でおこない,相関係数を算出し,次に予測値を算出しようと考えています。

予測をするには軸を利用しないといけないのですが,目的変数が19個なので,軸は18本出ており,どの軸まで利用すればいいのかわかりません。
相関係数で見たとしても,第4軸から0.09と低くなっているので,相関係数の低い軸を使ってもいいものか疑問を感じています。

そこで,予測値を算出する際, どういう形で軸の評価をすればいいのでしょうか?
相関係数の値に関係なく軸を選んでしまってもいいのでしょうか?

いろいろと分からないことが多くて先に進めなくなってしまっているので,いいアドバイスがあればうれしく思います。

よろしくお願いします。

     [このページのトップへ]


1108. Re: 数量化II類の軸について 青木繁伸  2003/11/21 (金) 19:42
目的変数が19個,説明変数が2個とはどういうことでしょう。

どの軸まで使えばいいのかは,相関比をみればいいでしょう。絶対的な基準というのが決めがたいので,軸を一つ使った場合,二つ使った場合,三つ使った場合というように増やしていって,判別率の変化を見ていけばいかが?軸を増やしていっても判別率があまり上がらないところが見つかるのでは?

     [このページのトップへ]


1109. Re^2: 数量化II類の軸について 卒研生  2003/11/22 (土) 11:53
早速の返事ありがとうございます。

> 目的変数が19個,説明変数が2個とはどういうことでしょう。

予測するためのカテゴリーを2個として,予測された結果を19個としています。
すなわち,カテゴリー2つの条件から,19個のうちの1つを予測するということです。

> どの軸まで使えばいいのかは,相関比をみればいいでしょう。

実際相関係数を算出すると,第1軸で0.49,第2軸で0.19となっており,全軸の中では相関が強い方だといえるんですが,一つずつ軸を増やして判別率を計算すると,第1,第2軸の判別率は,決していい値になったとはいえませんでした。

全軸で判別率を算出してみたんですが,最も高かったのが11軸まで使ったときの32.63%となりました。
それ以降の判別率は少しずつ減ってきています。
しかし,11軸の相関係数は0.0309となっていて,この軸を使っていいものかわかりません。
この際,相関係数が低くても判別率の方で利用する軸を決めてしまってもいいのでしょうか?

     [このページのトップへ]


1110. Re^3: 数量化II類の軸について 青木繁伸  2003/11/22 (土) 14:22
> 予測するためのカテゴリーを2個として,予測された結果を19個としています。
> すなわち,カテゴリー2つの条件から,19個のうちの1つを予測するということです。

カテゴリー二つの条件というのが未だよく分かりません。
カテゴリーを二つ持つアイテム変数が複数個あるということですかね。
そして,分類(判別)される群が19個あるということですか。
そのあたりのことは,今回はあまり関係ないかもしれないのでお答えはいただかなくてもかまいませんが,他人に何かを伝えるときには正しい用語と用法をお願いします。

> 実際相関係数を算出すると,第1軸で0.49,第2軸で0.19となっており,全軸の中では相関が強い方だといえるんですが,

相関比については
http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc004/261.html
に基準についての記載があったりします。

> 一つずつ軸を増やして判別率を計算すると,第1,第2軸の判別率は,決していい値になったとはいえませんでした。
>
> 全軸で判別率を算出してみたんですが,最も高かったのが11軸まで使ったときの32.63%となりました。
> それ以降の判別率は少しずつ減ってきています。
> しかし,11軸の相関係数は0.0309となっていて,この軸を使っていいものかわかりません。
> この際,相関係数が低くても判別率の方で利用する軸を決めてしまってもいいのでしょうか?

一番高い正判別率が30数パーセントというのは,首をひねりすぎて痛めそうです(^_^)

そもそも19群を判別しようという状況がかなり異例のように思われます。

     [このページのトップへ]


1116. Re^4: 数量化II類の軸について 卒研生  2003/11/22 (土) 19:27
> カテゴリーを二つ持つアイテム変数が複数個あるということですかね。
> そして,分類(判別)される群が19個あるということですか。

はい。その通りです。
参考書によって書き方が違うので,説明が難しくて,分かりにくくなってしまい,申し訳ありませんでした。

> そもそも19群を判別しようという状況がかなり異例のように思われます。

最初は6群だったのですが,それでは求めるものが違ってきてしまったので…。
ただ異例であるということは承知で計算してきました。
そこで,19群のうちに判別結果を6個まで出すようにしました。
それは19群の重心から近い順に6個出すというふうにしたんですが,そうすると第11軸の判別率は累積すると82.07%。
全部の軸を利用すると87.07%となりました。

研究の内容としては,1つの候補でなく6つ候補が出ても問題は無いのですが,どちらにしてもどの軸まで使えばいいのかまだ分からないんですけれども,今回のように相関係数が低いのであれば,複数の軸を使い,判別率から有効な軸を見つけるという方法でいいのでしょうか?

     [このページのトップへ]


1119. Re^5: 数量化II類の軸について 青木繁伸  2003/11/22 (土) 23:18
> > カテゴリーを二つ持つアイテム変数が複数個あるということですかね。
> > そして,分類(判別)される群が19個あるということですか。
>
> はい。その通りです。
> 参考書によって書き方が違うので,説明が難しくて,分かりにくくなってしまい,申し訳ありませんでした。

2カテゴリーからなる複数の説明変数を用いて,19群を判別するために数量化II類を行った

と,書けばいいのです。
自分勝手な用語の使い方をしたのでは,意思疎通ができません。

     [このページのトップへ]


1118. Re^5: 数量化II類の軸について 青木繁伸  2003/11/22 (土) 23:12
> そこで,19群のうちに判別結果を6個まで出すようにしました。
> それは19群の重心から近い順に6個出すというふうにしたんですが,

「この個体は,a 群に属するかもしれないし,c,f,g,h,k 群かもしれない。実際は g 群であったから,正判別」というような具合ですか。かなりいい加減?ですな。

> 研究の内容としては,1つの候補でなく6つ候補が出ても問題は無いのですが,どちらにしてもどの軸まで使えばいいのかまだ分からないんですけれども,今回のように相関係数が低いのであれば,複数の軸を使い,判別率から有効な軸を見つけるという方法でいいのでしょうか?

そのような条件下での分析であるなら,いいのではないでしょうか。あなたの指導教官には相談したのでしょうか。

# ところで,相関係数,相関係数と書いておられるが,相関比η^2 のことを指しているのか,ηなのかそれとも相関係数なのか私には判断がつきませんでした。

     [このページのトップへ]


1120. Re^6: 数量化II類の軸について 卒研生  2003/11/23 (日) 12:28
> 「この個体は,a 群に属するかもしれないし,c,f,g,h,k 群かもしれない。実際は g 群であったから,正判別」というような具合ですか。かなりいい加減?ですな。

判別の方法はその通りで,確かにいい加減ですね。
ただ,未知のものを予測し,一つに断定する必要が無いので,それはそれでいいと考えています。
教授にも相談といいますか,こういう考えでおこなうということは伝えました。
しかし,どうしても相関比(これまで相関係数と書いていたものです)の低さが気になっているようで,判別結果を多く取るというところまで話が進んでいないという現状です。

> # ところで,相関係数,相関係数と書いておられるが,相関比η^2 のことを指しているのか,ηなのかそれとも相関係数なのか私には判断がつきませんでした。

いろいろと指摘していただき,もう一度調べなおしたことで,間違っていることに気がつきました。
相関係数→相関比η^2です。
相関比について述べられてあるログにも書かれていましたが,相関比のルートを取れば相関係数と同じように扱えるということですか?

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 026 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る