★ 数量化II類の正規化カテゴリースコアに関する疑問 ★

 2 数量化II類の正規化カテゴリースコアに関する疑問  あかり  1999/11/10 (水) 23:16
  3 Re: 数量化II類の正規化カテゴリースコアに関する疑問  マンボウ  1999/11/10 (水) 23:39
   4 Re^2: 数量化II類の正規化カテゴリースコアに関する疑問  あかり  1999/11/11 (木) 03:04
    8 Re^3: 数量化II類の正規化カテゴリースコアに関する疑問  青木繁伸  1999/11/11 (木) 13:54
     11 Re^4: 数量化II類の正規化カテゴリースコアに関する疑問  あかり  1999/11/11 (木) 14:37
      13 Re^5: 数量化II類の正規化カテゴリースコアに関する疑問  あかり  1999/11/11 (木) 15:02
      12 Re^5: 数量化II類の正規化カテゴリースコアに関する疑問  青木繁伸  1999/11/11 (木) 14:59
    5 Re^3: 数量化II類の正規化カテゴリースコアに関する疑問  堀 啓造  1999/11/11 (木) 12:07
     7 Re^4: 数量化II類の正規化カテゴリースコアに関する疑問  あかり  1999/11/11 (木) 13:24
      9 Re^5: 数量化II類の正規化カテゴリースコアに関する疑問  堀 啓造  1999/11/11 (木) 14:11
       10 Re^6: 数量化II類の正規化カテゴリースコアに関する疑問  あかり  1999/11/11 (木) 14:27
        14 Re^7: 数量化II類の正規化カテゴリースコアに関する疑問  堀 啓造  1999/11/11 (木) 16:32
         16 Re^8: 数量化II類の正規化カテゴリースコアに関する疑問  あかり  1999/11/11 (木) 17:16
          19 Re^9: 数量化II類の正規化カテゴリースコアに関する疑問  SS  1999/11/12 (金) 01:20
           23 Re^10: 数量化II類の正規化カテゴリースコアに関する疑問  あかり  1999/11/12 (金) 10:40


2. 数量化II類の正規化カテゴリースコアに関する疑問  あかり  1999/11/10 (水) 23:16
皆さん,はじめまして
現在,数量化II類を勉強しています.
で,今回webで数量化II類の計算ができるページを耳にしたので,早速,勉強がてら伺ってみました.
そして,本に載っているデータを打ち込んでみたところ正規化カテゴリースコアの値が違う?
なぜ,そのような結果になるのか教えていただけませんか?

データ(こちらのWebで使用されている形式で記述します)
2,1,1
2,2,1
2,1,1
1,2,1
1,2,2
1,1,2
1,2,2
アイテムが2つ,カテゴリは各々に2つずつ,群数も2つです.
サンプル数は7つです.
本に乗っていたスコアは
a11=-0.4191 a12=0.5587 a21=-0.1196 a22=0.0897
相関比=0.5882
webでの計算結果は
a11=0.929896 a12=-1.23986 a21=0.265684 a22=-0.199263
相関比=0.588235
どちらの結果を使ってもきちんと判別できるので問題はないのですが,どうも附に落ちません.
なぜなのでしょう?

     [このページのトップへ]


3. Re: 数量化II類の正規化カテゴリースコアに関する疑問  マンボウ  1999/11/10 (水) 23:39
それぞれのプログラムから出てくる対応する係数の比をとってみると(出力桁数による誤差を考慮して)一定ですね(符号は正反対)。

判別のためのスコアは定数倍されていてもかまわないので,同じ判別結果になるのです。

スコアの分散を1にするとか別の値にするとかの方針でこのようなことになるのではないでしょうかね。

     [このページのトップへ]


4. Re^2: 数量化II類の正規化カテゴリースコアに関する疑問  あかり  1999/11/11 (木) 03:04
マンボウさん,早速のご回答ありがとうございます.
(あまりの早さにかなり驚いています.)

> それぞれのプログラムから出てくる対応する係数の比をとってみると(出力桁数による誤差を考慮して)一定ですね(符号は正反対)。
>
・・・中略・・・
>
> スコアの分散を1にするとか別の値にするとかの方針でこのようなことになるのではないでしょうかね。
なるほど・・・すると,今度は最後の文面が気になります.

勉強している本によれば,η^2(^2は2乗のことです)の固有値から得られる,大きさが1の固有ベクトルを正規化したものがカテゴリスコアと記述してありました.
そこで,webで得られたカテゴリスコアを正規化前のものに逆算して大きさ(つまり,a12^2+a22^2のことです.)を求めたところ,大きさが1になりませんでした.
このあたりで現在いきづまっています.(要するに,大きさ1にならないのはなぜかということと,1でない場合,どうやってその大きさを決めているのかということです)
数量化II類では一般に何か決まった変換方針のようなものが存在するということなのでしょうか?

     [このページのトップへ]


8. Re^3: 数量化II類の正規化カテゴリースコアに関する疑問  青木繁伸  1999/11/11 (木) 13:54
マンボウさん> > スコアの分散を1にするとか別の値にするとかの方針で
マンボウさん> >このようなことになるのではないでしょうかね。

私のプログラムでは確かに,サンプルスコアの分散が1になるように調整してあります。

> 勉強している本によれば,η^2(^2は2乗のことです)の固有値から得られる,大きさが1の固有ベクトルを正規化したものがカテゴリスコアと記述してありました.

本に書いてある記述がこの通りになっていると少しあいまいですね。(その本は持っていないので確認できませんが)

最大固有値に対応する固有ベクトルを正規化してカテゴリースコアを求めます。
そのときの固有値の大きさが η^2になります。
「大きさが1の固有ベクトル 」というのは,固有ベクトルは(アルゴリズムにもよりますが)大きさ(正確にはノルム)1に正規化されていることを指しているのでしょう。

> 数量化II類では一般に何か決まった変換方針のようなものが存在するということなのでしょうか?

spss の例くらいしか知らないのですけど,主成分得点,因子得点,判別値などは平均0,分散1に正規化してあることが多いかもしれません。

     [このページのトップへ]


11. Re^4: 数量化II類の正規化カテゴリースコアに関する疑問  あかり  1999/11/11 (木) 14:37
青木繁伸さん,ご回答ありがとうございます.

> 私のプログラムでは確かに,サンプルスコアの分散が1になるように調整してあります。
むむむ,
サンプルスコアの分散を1にする・・・のですか.なるほど.
どのようにすれば,サンプルスコアの分散を1にできるのでしょうか?
参考になる文献やホームページがあれば教えていただきたいのですが・・・

> 「大きさが1の固有ベクトル 」というのは,固有ベクトルは(アルゴリズムにもよりますが)大きさ(正確にはノルム)1に正規化されていることを指しているのでしょう。

> spss の例くらいしか知らないのですけど,主成分得点,因子得点,判別値などは平均0,分散1に正規化してあることが多いかもしれません。
固有ベクトルを正規化するのは一般的ではないようですね.
しかし,入門書にはたいてい固有ベクトルの大きさを1にしてカテゴリスコアを求めています.不思議です.

     [このページのトップへ]


13. Re^5: 数量化II類の正規化カテゴリースコアに関する疑問  あかり  1999/11/11 (木) 15:02
> サンプルスコアの分散を1にする・・・のですか.なるほど.
> どのようにすれば,サンプルスコアの分散を1にできるのでしょうか?
> 参考になる文献やホームページがあれば教えていただきたいのですが・・・
すみません,バカな質問をしてしまいました.
サンプルスコアの分散を1することはすぐにできました.
(ちょっと,勘違いしていました)
ちゃんと,webの計算結果と一致しました.
これで,安心して寝れます.

     [このページのトップへ]


12. Re^5: 数量化II類の正規化カテゴリースコアに関する疑問  青木繁伸  1999/11/11 (木) 14:59
> サンプルスコアの分散を1にする・・・のですか.なるほど.
> どのようにすれば,サンプルスコアの分散を1にできるのでしょうか?
> 参考になる文献やホームページがあれば教えていただきたいのですが・・・
サンプルスコアの分散がaであったとき,それぞれのサンプルスコアを√aで割ってやれば変換後のサンプルスコアの分散は1になります。
http://aoki2.si.gunma-u.ac.jp/lecture/Bunpukansu/operator-E-V.html
数量化II類の計算法については以下のURLが参考になるかも知れません。
http://aoki2.si.gunma-u.ac.jp/LaTeX/SDIS-QT2.html

> 固有ベクトルを正規化するのは一般的ではないようですね.
必ずしも一般的でないとはいえません。ノルム1に正規化する方が一般的かも知れませんよ。

     [このページのトップへ]


5. Re^3: 数量化II類の正規化カテゴリースコアに関する疑問  堀 啓造  1999/11/11 (木) 12:07

> 勉強している本によれば,η^2(^2は2乗のことです)の固有値から得られる,大きさが1の固有ベクトルを正規化したものがカテゴリスコアと記述してありました.

その本は,何でしょうか。
統計学の基本は,どういうサンプリングをしたかということがありますが,科学的に考える基本として,引用文献を明確にするということがあります。

     [このページのトップへ]


7. Re^4: 数量化II類の正規化カテゴリースコアに関する疑問  あかり  1999/11/11 (木) 13:24
堀 啓造さん,ご回答ありがとうございます.

> > 勉強している本によれば,η^2(^2は2乗のことです)の固有値から得られる,大きさが1の固有ベクトルを正規化したものがカテゴリスコアと記述してありました.
>
> その本は,何でしょうか。
> 統計学の基本は,どういうサンプリングをしたかということがありますが,科学的に考える基本として,引用文献を明確にするということがあります。
これは大変,失礼いたしました.ご指摘のとおりです.
引用元の文献は
タイトル:「多変量解析のはなし」
著  者:有馬 哲,石村 貞夫
出 版 社:東京図書株式会社
引用部分は
第7章数量化II類 p.211〜p.229
この本の中にある例題のデータを使用しました.
どのようなサンプリングをしたかは述べられていません.
困りました・・・

     [このページのトップへ]


9. Re^5: 数量化II類の正規化カテゴリースコアに関する疑問  堀 啓造  1999/11/11 (木) 14:11

> 引用元の文献は
> タイトル:「多変量解析のはなし」
> 著  者:有馬 哲,石村 貞夫
> 出 版 社:東京図書株式会社
> 引用部分は
> 第7章数量化II類 p.211〜p.229

なるほど。

> この本の中にある例題のデータを使用しました.
> どのようなサンプリングをしたかは述べられていません.

サンプリングはジョークで使っているのであって,本をどう選んだのかというか,本は何ですかという質問と同じです。

     [このページのトップへ]


10. Re^6: 数量化II類の正規化カテゴリースコアに関する疑問  あかり  1999/11/11 (木) 14:27
堀 啓造さん,ご返事ありがとうございます.

> > この本の中にある例題のデータを使用しました.
> > どのようなサンプリングをしたかは述べられていません.
>
> サンプリングはジョークで使っているのであって,本をどう選んだのかというか,本は何ですかという質問と同じです。

この本のほかにも2,3冊読んでいますが,すべて入門書レベルの
本ばかりです(苦笑).
この本は,理論式だけでなく計算方法が載っていたので,電卓を片手に理論式の実現方法の習得のために購入しました.
今回,webと本の計算結果が違ったということは,その本に載っていない計算手順(理論?)があるということなので,それは何なのかが知りたかったわけです.

     [このページのトップへ]


14. Re^7: 数量化II類の正規化カテゴリースコアに関する疑問  堀 啓造  1999/11/11 (木) 16:32
> この本のほかにも2,3冊読んでいますが,すべて入門書レベルの本ばかりです(苦笑).
> この本は,理論式だけでなく計算方法が載っていたので,電卓を片手に理論式の実現方法の習得のために購入しました.
> 今回,webと本の計算結果が違ったということは,その本に載っていない計算手順(理論?)があるということなので,それは何なのかが知りたかったわけです.

数量化の手順については,駒澤勉氏の本を基準にするのが本道でしょう。
いくつか本が出ています。

駒澤勉『数量化理論とデータ処理』朝倉書店

が代表。
他の駒澤本でもいいです。

     [このページのトップへ]


16. Re^8: 数量化II類の正規化カテゴリースコアに関する疑問  あかり  1999/11/11 (木) 17:16
堀 啓造さん,ご返事ありがとうございます.

> 数量化の手順については,駒澤勉氏の本を基準にするのが本道でしょう。
> いくつか本が出ています。
>
> 駒澤勉『数量化理論とデータ処理』朝倉書店
>
> が代表。
> 他の駒澤本でもいいです。
ご教授ありがとうございます.
早速,購入してさらなる勉強をしたいと思います.

     [このページのトップへ]


19. Re^9: 数量化II類の正規化カテゴリースコアに関する疑問  SS  1999/11/12 (金) 01:20
数量化II類のカテゴリスコアは,サンプル数量の全体の分散が1になるように基準化するのが習慣.
正準判別分析ではプールした群内分散が1になるように基準化するのが習慣.
主成分分析の主成分得点の分散は固有値に基準化する習慣.
因子分析の因子得点の分散は1に基準化する習慣.
ただし因子得点の推定値(予測値)は1にはならない.
いろいろ習慣がありますね.
石村本のII類の血液型のデータをがんばって入力してソフトの出力を確認するとどうですか?

     [このページのトップへ]


23. Re^10: 数量化II類の正規化カテゴリースコアに関する疑問  あかり  1999/11/12 (金) 10:40
SSさん,ご回答ありがとうございます.

> 数量化II類のカテゴリスコアは,サンプル数量の全体の分散が1になるように基準化するのが習慣.
> 正準判別分析ではプールした群内分散が1になるように基準化するのが習慣.
> 主成分分析の主成分得点の分散は固有値に基準化する習慣.
> 因子分析の因子得点の分散は1に基準化する習慣.
> ただし因子得点の推定値(予測値)は1にはならない.
> いろいろ習慣がありますね.
> 石村本のII類の血液型のデータをがんばって入力してソフトの出力を確認すると
> どうですか?
上記の習慣,参考にさせていただきます.
ちなみに,血液型のデータはすでに入力して,結果を確認しました.
サンプル数量全体の分散が1になるように計算すると,出力結果が本の内容と一致しました.
ご指導,どうもありがとうございました.

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 004 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る