No.11333 大量の観測項目の間接効果  【統計初学生】 2009/11/26(Thu) 14:01

はじめまして。
統計を独学で学びつつ,研究の統計データ解析を進めています。
ご意見を伺えると大変ありがたいです。

7段階評定した心理的な観測項目(140項目)を共分散構造分析(AMOS)のパス解析等により,「間接効果の違い」を見ようとしています。なるべく項目を削除することなく分析に生かすには,以下のどの方法が適しているでしょうか?
あるいは別の方法があれば是非教えていただけますか?

1.数個の共通因子にまとめ,因子のパス解析にする。
2.合成変数にまとめて,合成変数のパス解析にする。
3.数個の共通因子にまとめて因子得点を算出し,因子得点のパス解析にする。

どうぞ宜しくお願いします。

No.11335 Re: 大量の観測項目の間接効果  【波音】 2009/11/27(Fri) 17:10

間接効果の違いを見る方法については分かりませんが,あげている3点について:

常套手段としては類似した項目(因子分析によって分類された項目)ごとの評価点を合計したものを尺度得点として用いることが考えられると思います(これが1.のことでしょうか・・・)。

因子分析モデルの当てはまりが良い場合(つまり共通性が高いor独自性が低い場合)は因子得点を用いても良いですが,因子得点を利用している例を心理学の分野ではあまり見かけないように思います。

以上の2点について,SEMを行うなら因子間の関係を含んだモデルを作成するのがSEMを用いるメリットだと思います。

2.にあげているのは,例えば,PCA回帰のような発想だと思われますが,主成分得点を用いてSEMを行うのがどれほど(慣例的に)受け入れられるか灰色のような気がします(^_^;)

主成分分析は情報の集約が目的ですから,「なるべく項目を削除することなく分析に生かす」という点についていえば,主成分得点(合成変量, 主成分)を2次的に解析に使用するのは有効な方法だと思います。

No.11357 Re: 大量の観測項目の間接効果  【統計初学生】 2009/11/30(Mon) 18:03

波音さん,貴重なアドバイスを有難うございます。

早速,因子平均を尺度得点とした,因子間のパス解析(平均共分散構造分析)を行ってみたところ,許容範囲の適合度を得ました。

ところが,因子得点(SEMの構成概念スコア)を用いて,同上のパス解析を行ってみたところ,パス係数・共分散に差が見られ,同様のモデルとはみなしにくい結果となってしまいました。(因子分析での共通性は全観測項目が0.25以上ありました)

何故このような食い違いが起きるのでしょうか?
このまま尺度得点を用いることとし,因子得点の結果を無視して問題ないのでしょうか?

また,因子得点を用いて,各サンプルのクラスタリング等も行いたいと考えていますので,その点からも上記の差異が気になります。

ご指導をお願いします。

No.11359 Re: 大量の観測項目の間接効果  【波音】 2009/11/30(Mon) 20:10

> 何故このような食い違いが起きるのでしょうか?

因子平均というのが何を指しているのか 少し不明なのですが(^_^;) 先の記事で述べたように,因子分析モデルの当てはまりがよければ,尺度得点(因子に含まれるとされる質問項目の合計点) を用いた場合とでさほど違いはでないでしょう。ただし,元々はまったく別の変数を用いているわけですから,完全に一致することはありえないものと考える方 が自然です。

> このまま尺度得点を用いることとし,因子得点の結果を無視して問題ないのでしょうか?

尺度得点を用いるか,それとも因子得点を用いるかは分析者の判断です。これも繰り返しになりますが,因子分析モデルの当てはまりがよいのなら,因子得点を用いることに妥当性が出てくるということです。

ちなみに,潜在変数(因子)をF,観測変数(質問項目)をX1, X2, X3とするなら,因子分析モデルというのは:

F = α1X1 + e1
F = α2X2 + e2
F = α3X3 + e3

で表されます。αが因子負荷量,eが独自性(誤差:観測変数で説できなかった部分)で,共通性は 1 - e で求められます。要するに因子分析というのは,潜在変数を応答変数,観測変数を説明変数とした回帰分析モデルの集合なわけです。

因子得点というのは,上の式より推定されたFの値のことです(回帰分析でいえば予測値にあたります)。当然,あてはまりが悪ければ(eの独自性が大きければ),因子得点Fの値も「使えない」ということになるでしょう?

これに対して尺度得点を使用することは,因子分析モデルの当てはまりは関係ないので当てはまりが悪い場合でも使えるわけです。この場合,因子分析は単に項目分類のために利用されたということがいえそうです^^;

No.11368 Re: 大量の観測項目の間接効果  【にゃんちゅう】 2009/12/01(Tue) 16:05

項目と潜在因子の関係をつけるのには代表的に3つがあります。
(1)個々の項目を潜在因子からそれぞれ矢印をつける。
(2)項目の組を複数つくり潜在因子へと矢印をつける。(例えば12項目が1つの潜在因子に関係するとして,4項目の和から3つの指標をつくりその指標を潜在因子から矢印をつける。(parcel)
(3)潜在因子の項目を全部合計する。
の3つの方法です。日本では(1)がポピュラーなようですが,信頼性や適合度の関係からあまりいい方法ではありません。ただし,項目の取捨選択に威力があります。
(2)は英語圏ではある程度つかわれています。
(3)は誤差を評価できないという点で望ましくありません。

もっとも(2)でもいろいろ問題があって,分割する手法がいろいろあるなど任意性があります。また,1次元性については別途示さなくてはいけません。それらの限界はありますが,安定した指標としてはparcelがすすめられるでしょう。

なお,因子得点については,直交解か斜交解か。もとのデータが直交解で正しいかなどによって判断は変わってきます。

No.11369 Re: 大量の観測項目の間接効果  【にゃんちゅう】 2009/12/01(Tue) 16:17

Larry J. Williams ⁎, Ernest H. O'Boyle Jr. 1 2008. Measurement models for linking latent variables and indicators: A review of human resource management research using parcels. Human Resource Management Review, 18, 233–242
んどを参照してください。

No.11371 Re: 大量の観測項目の間接効果  【統計初学生】 2009/12/01(Tue) 16:38

波音さん,早速にコメントを頂き有難うございます。

用語の解釈について少しこんがらがってきましたので,確認させて下さい。

<尺度得点>
観測項目の各得点の,単純合計または加算平均,もしくは重み付き合計等,幾つか作成方法があるようですが正しいでしょうか?
波音さんが仰っているのは,このうちの単純合計による尺度得点ですね?

SEMの平均構造分析で算出される因子平均は,因子負荷量で決定する重み付き合計により算出されると理解しています。(ちょうど,上記式のFが観測項目,Xが因子となる。)

その意味で,前回の質問で「因子平均を尺度得点として」と表現しまして,因子のパス解析つまり多重指標モデルを作成しました。

ですのでこの場合は,因子分析モデルの各因子に分類される観測項目の因子負荷量を使用して尺度得点を算出するため,モデルの当てはまりに影響されるかと思いますが,解釈がおかしいでしょうか?

<因子得点>
各因子の得点算出にあたって,全観測項目の得点を重み付きで合計した値。
前回の質問では,因子得点値をあらたに観測項目得点とみなして,パス解析しました。

<合成変数>
各変数に重みをかけて合計したもの。
→尺度得点と同じ意味でしょうか?

本等によって記載表現が異なり,解釈に苦しんでいます。。
基本的な質問で申し訳ないですが,宜しくお願いします。

No.11382 Re: 大量の観測項目の間接効果  【統計初学生】 2009/12/02(Wed) 10:05

にゃんちゅうさん

アドバイスを有難うございます。
早速,教えていただいた文献を取り寄せています。

因子分析は,斜交解(プロマックス)で,因子同士の相関も0.2〜0.7程度あります。
因子得点は,その結果をSEMでCFAを行うことで算出しています。
この場合は,因子得点についてどう判断すべきでしょうか?

どうぞ宜しくお願いします。

No.11383 Re: 大量の観測項目の間接効果  【波音】 2009/12/02(Wed) 10:36

> 上記式のFが観測項目,Xが因子となる。

すみません,私が書き間違えていました。正しくは,ご指摘の通り

X1 = F + e1
X2 = F + e2
X3 = F + e3

ですね(^_^;) だから「応答変数を観測変数,説明変数を因子とした回帰モデルの集まり」です。

---

詳しいことはにゃんちゅう先生があげてくださった文献を読まれるとよいと思いますが:

> 波音さんが仰っているのは,このうちの単純合計による尺度得点ですね?

その通りです。各項目の評価点を合計する以外の方法で用いる方法も(たぶん私が知らないだけで)たくさんあるのだと思います。

投 げやりな言い方になってしまうかもしれませんが,No. 11368でにゃんちゅう先生が挙げてくださっているような,各々のフィールドで常套手段とされる方法があるので,基本的な手順はそれに従えばよいと思い ます。ただ,SEMは「解析する」という作業自体が経験則に左右されるものなので,統計初学生さんの行った手順とそれに対する解釈が正しいかどうかは,何 ともいえません(ここで私が下手に助言をすると余計に混乱を引き起こすでしょう・・・)。

それから,合成変数というのはたぶん色々な意味合いがあって,項目同士の合計点というのも合成変数といえるでしょうし,主成分分析における主成分も合成変数,ある意味では因子(得点)も合成変数と解釈できないこともないでしょう。

No.11398 Re: 大量の観測項目の間接効果  【統計初学生】 2009/12/03(Thu) 09:25

波音さん

素人質問に丁寧に回答下さり有難うございます。

まずは常套手段として教えて頂いた方法を色々試してみることにします。

● 「統計学関連なんでもあり」の過去ログ--- 043 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る