「統計学関連なんでもあり」の過去ログ---029

★ キードライバ分析 ★

3766.　キードライバ分析　HOJO　2004/07/21 (水) 16:56
└3783.　Re: キードライバ分析　青木繁伸　2004/07/21 (水) 23:55
　└3791.　Re^2: キードライバ分析　HOJO　2004/07/22 (木) 11:47
　　└3795.　Re^3: キードライバ分析　青木繁伸　2004/07/22 (木) 12:49
　　　└3796.　Re^4: キードライバ分析　HOJO　2004/07/22 (木) 16:27
　　　　└3797.　Re^5: キードライバ分析　青木繁伸　2004/07/22 (木) 16:40
　　　　　└3798.　Re^6: キードライバ分析　HOJO　2004/07/22 (木) 17:47
　　　　　　└3877.　Re^7: キードライバ分析　HOJO　2004/07/30 (金) 14:38
　　　　　　　└3878.　Re^8: キードライバ分析　青木繁伸　2004/07/30 (金) 15:58
　　　　　　　　└3879.　Re^9: キードライバ分析　HOJO　2004/07/30 (金) 16:28
　　　　　　　　　└3880.　Re^10: キードライバ分析　青木繁伸　2004/07/30 (金) 17:39
　　　　　　　　　　└3904.　Re^11: キードライバ分析　HOJO　2004/08/04 (水) 09:09

3766.　キードライバ分析　HOJO　　2004/07/21 (水) 16:56

　会社でCSデータの分析のため，キードライバ分析を実行しているのですが，意図に反して，重要度係数がマイナスになってしまい困っています．
この分析手法は，
　(1)　お客様に数十個の項目と，最後に会社の総合満足度についてアンケートに記入していただく．
　(2)　このアンケートデータについて，因子分析を実施し，7個の共通因子を抽出する．
　(3)　その因子得点を独立変数，総合満足度を目的変数として重回帰分析を行い，回帰係数を算出する．
　(4)　因子得点係数行列と回帰係数から，その積を求め，元のアンケートデータに対する回帰係数（これを重要度係数と呼ぶ．）
　これは，アンケートデータについてそのまま重回帰分析を行うと，各項目の従属関係のために回帰係数が負になるものが出てしまうのを避けるためにこのようにすると聞いています．
　しかし実際に上記の解析を実施すると，(4)の段階で重要度係数が負になるものが出てしまいます．その数値も正の値の重要度係数とあまり変わらないオーダーであり，計算誤差というのはちょっと苦しいものがあります．これはどうしてなのでしょうか．

　　　　　[このページのトップへ]

3783.　Re: キードライバ分析　青木繁伸　　2004/07/21 (水) 23:55

因子分析（主成分分析）において，因子負荷量や因子得点（主成分負荷量や主成分得点）の符号は，アルゴリズムやデータのちょっとした違いで正負が入れ替わることがあります。
そのあたりのことが原因ではないわけですね。

だとすると，あなたのデータが理論に従っていないということしかわかりません。
実際のデータをお持ちのあなたが，原因を精査するしかなさそうに思います。

　　　　　[このページのトップへ]

3791.　Re^2: キードライバ分析　HOJO　　2004/07/22 (木) 11:47

早速のレスをいただき有り難うございます。ただキードライバ分析は初めて経験するものなので，自分が理論どおりおこなっているかどうか定かではありません．因子分析は先生の作成されたpfaを元に最後のlistコマンドの前に以下の2行を追加して利用しています。
w<-solve(cor(dat))%*%fl
f<-scale(dat)%*%w

> 因子分析（主成分分析）において，因子負荷量や因子得点（主成分負荷量や主成分得点）の符号は，アルゴリズムやデータのちょっとした違いで正負が入れ替わることがあります。
私の計算結果では，因子負荷量については，第1，2，4，5，6因子に関するものが，満足度の高い方についてマイナスで出力されていました．それでそのような因子については，「～の良さ」ではなくて「～の悪さ」であると解釈しました．
> そのあたりのことが原因ではないわけですね。
このあたりがよく分からないのですが，逆符号で出力された因子得点や因子負荷量は，そのまま以降の計算に用いるものではなくて，符号をそろえてから利用すべきものなのでしょうか．
>
> だとすると，あなたのデータが理論に従っていないということしかわかりません。
　現在41個の重要度係数のうち，約10個の重要度係数がマイナスで出力されています．かつ値も正の重要度係数と同じオーダーです．何かよく分からないのですが，とても初歩的なミスを犯しているようなきがします．
> 実際のデータをお持ちのあなたが，原因を精査するしかなさそうに思います。

　　　　　[このページのトップへ]

3795.　Re^3: キードライバ分析　青木繁伸　　2004/07/22 (木) 12:49

> 私の計算結果では，因子負荷量については，第1，2，4，5，6因子に関するものが，満足度の高い方についてマイナスで出力されていました．それでそのような因子については，「～の良さ」ではなくて「～の悪さ」であると解釈しました．

解釈はそれでいいのですが，後で利用するときには符号を考えて解釈しないといけませんよね。それがいやらしいと思うなら，因子得点の符号を反転させて，得点が大きいとき「～の良さ」を表すようにしておくことです。

　　　　　[このページのトップへ]

3796.　Re^4: キードライバ分析　HOJO　　2004/07/22 (木) 16:27

HOJOです．お忙しい中有り難うございました．
> 解釈はそれでいいのですが，後で利用するときには符号を考えて解釈しないといけませんよね。それがいやらしいと思うなら，因子得点の符号を反転させて，得点が大きいとき「～の良さ」を表すようにしておくことです。
　因子負荷行列，因子係数行列，因子得点について，該当する因子の符号を反転してやりなおしてみました．やはり7～8個の観測変量についてはマイナスが出てしまいます．この点については，更に検討してみます．
　ところで重回帰分析についてもmregを使わせていただいているのですが，ここで偏回帰係数そのものを使うと，マイナスの符号が一部出るものの，単相関係数から求めた重要度と比較的似た結果が出ます．しかしSE（B） (標準化係数ベータ？）を用いると，結果は単相関係数から求めた重要度とは大幅に異なってしまいます．どちらを使用すべきなのでしょうか．

　　　　　[このページのトップへ]

3797.　Re^5: キードライバ分析　青木繁伸　　2004/07/22 (木) 16:40

> 偏回帰係数そのものを使うと，マイナスの符号が一部出るものの，単相関係数から求めた重要度と比較的似た結果が出ます．しかしSE（B） (標準化係数ベータ？）を用いると，結果は単相関係数から求めた重要度とは大幅に異なってしまいます．どちらを使用すべきなのでしょうか．

理論的基盤をしっかりさせておかないと，危険ですよ。

SE(B)は，偏回帰係数の標準誤差。
β（ベータ）は標準化偏回帰係数。

標準誤差など使うはずがないので，偏回帰係数と標準化偏回帰係数のいずれを使うべきなのかという質問と解釈して，，，，

偏回帰係数は，独立変数の測定値を用いて従属変数の値を予測するために使われるもの。
標準化偏回帰係数は，独立変数，従属変数を平均0，分散1に標準化したデータに対して重回帰分析を行ったときの偏回帰係数。独立変数相互間の相対的重要性を評価するためや，独立変数が従属変数に対して及ぼす影響量を評価するためのもの。

ですから，当然，偏回帰係数の方を使わなければなりませんね。

　　　　　[このページのトップへ]

3798.　Re^6: キードライバ分析　HOJO　　2004/07/22 (木) 17:47

スピーディなレスをいただき恐縮です．
>
> SE(B)は，偏回帰係数の標準誤差。
> β（ベータ）は標準化偏回帰係数。
>
> 標準誤差など使うはずがないので，偏回帰係数と標準化偏回帰係数のいずれを使うべきなのかという質問と解釈して，，，，
　すみません．そのとおりです．標準化係数ベータという日本語が先にあり，その英訳はSE(B)なのかなと想像してしまいました．その近くにあるbetaが標準化係数ベータ（標準化偏回帰係数）のことですね．
>
> 偏回帰係数は，独立変数の測定値を用いて従属変数の値を予測するために使われるもの。
> 標準化偏回帰係数は，独立変数，従属変数を平均0，分散1に標準化したデータに対して重回帰分析を行ったときの偏回帰係数。独立変数相互間の相対的重要性を評価するためや，独立変数が従属変数に対して及ぼす影響量を評価するためのもの。
>
> ですから，当然，偏回帰係数の方を使わなければなりませんね。
　有り難うございました．重回帰分析は，実空間で予測するものですから，規準化された空間で予測をしても偏回帰係数を求めても仕方がないのですね．
　重要度係数のマイナス符号については，これまでにおこなった因子分析の検算なども含めて，じっくり検討してみます．

　　　　　[このページのトップへ]

3877.　Re^7: キードライバ分析　HOJO　　2004/07/30 (金) 14:38

> 　重要度係数のマイナス符号については，これまでにおこなった因子分析の検算なども含めて，じっくり検討してみます．
あれから，いろいろと調べてみました．一つ気づいたことは，偏回帰係数が，0.398899571 0.245808938 0.30626852 0.057394002 -0.009142446 0.342516485 0.00868654
一方，目的変数に対する独立変数の相関係数は0.546138875 0.341532747 0.432120629 0.105360312 0.009107649 0.473633558 0.043171092
ということで，第5変数の（第5因子）の符号が異なっていることです．ところが，独立変数相互の相関係数を調べてみると，最大でも0.05程度で，独立変数相互の相関は大変低いのです．因子分析だから当たり前ではあるのですが．このような場合も多重共線性の問題になるのでしょうか．また元データにどのような原因があると考えられるのでしょうか．

　　　　　[このページのトップへ]

3878.　Re^8: キードライバ分析　青木繁伸　　2004/07/30 (金) 15:58

符号が違うと言っても，きわめて0に近い値なのだから，騒ぐほどのことではないでしょう。0.5が-4.99になっていたら問題ですが。

　　　　　[このページのトップへ]

3879.　Re^9: キードライバ分析　HOJO　　2004/07/30 (金) 16:28

> 符号が違うと言っても，きわめて0に近い値なのだから，騒ぐほどのことではないでしょう。0.5が-4.99になっていたら問題ですが。
ご回答有り難うございます。そうすると，元の観測変量の重要度係数を求めるときには，どのようにすればよいのでしょうか。例えば，偏回帰係数の小さな因子データは無視して，第1，2，3，6因子のみで重回帰分析を行って，偏回帰係数を求め，それから，元の観測変量の重要度係数を求めればよいのでしょうか。

　　　　　[このページのトップへ]

3880.　Re^10: キードライバ分析　青木繁伸　　2004/07/30 (金) 17:39

補足：3878のコメントについて
あげられていたのは，偏回帰係数でしたね。
独立変数の相対的重要性を判断するのは標準化偏回帰係数でなくてはなりません。（たぶん標準化偏回帰係数も小さいのでしょうが）。

ということで，#3879へのコメントにもなるでしょう。
そもそも，キードライバ分析というのがどのように行われるものなのかをよく調べてみてください。（私は，今になって言うのもなんですが，キードライバ分析って知らないんですよ(^_^;)

　　　　　[このページのトップへ]

3904.　Re^11: キードライバ分析　HOJO　　2004/08/04 (水) 09:09

> そもそも，キードライバ分析というのがどのように行われるものなのかをよく調べてみてください。

　ご返事が遅くなりまして申し訳ありません。キードライバ分析については，日本語だけでなく英語（Key Driver Analysis)も含めて調べてみたのですが，わずかしか見あたらなかったのです。まして理論的解説を述べたものを見つけることはできませんでした。
　ただ因子分析と重回帰分析をキーワードとして調べると，類似の解析手法が心理学やマーケティングの分野で散見できましたので，検討してみます。

（私は，今になって言うのもなんですが，キードライバ分析って知らないんですよ(^_^;)
　いいえ，いろいろとアドバイスいただいてありがとうございました。私こそ回答を無理矢理お願いするような質問になってはいなかったかと恐縮しています。

　今後もよろしくご指導いただければ幸いです。

　　　　　[このページのトップへ]