相関係数行列を求める
使用するデータセット
dataset1.dat データセットのダウンロード 注:ダウンロードの方法
このデータセットは,6 変数 25 ケースからなるデータである。
1 行目は変数名で,6 つの変数をそれぞれ,Var_X,Var_Y,Var_Z,New_X,New_Y,New_Z と名付けている。
元の変数 Var_X,Var_Y,Var_Z は,CGI プログラムにより,表 1 に示す相関関係を持つように作られたものを変数変換したものである。
表 1 変数 Var_X,Var_Y,Var_Z の相関係数行列
Var_X 1.00000
Var_Y 0.60000 1.00000
Var_Z 0.40000 0.50000 1.00000
Var_X Var_Y Var_Z
New_X,New_Y,New_Z はこれらを以下の式により,変数変換したものである。
New_X = Var_X*2
New_Y = Var_Y+10
New_Z = Var_Z*5+20
分析によって明らかになること
- New_X の平均値は,Var_X の平均値の 2 倍になる
- New_X の不偏分散は,Var_X の不偏分散の 4 倍になる
- New_X の標準偏差は,Var_X の標準偏差の 2 倍になる
- New_Y の平均値は,Var_Y の平均値より 10 大きくなる
- New_Y の不偏分散は,Var_Y の不偏分散と同じである
- New_Y の標準偏差は,Var_Y の標準偏差と同じである
- New_Z の平均値は,Var_Z の平均値を 5 倍して 20 を加えたものになる
- New_Z の不偏分散は,Var_Z の不偏分散の 25 倍になる
- New_Z の標準偏差は,Var_Z の標準偏差の 5 倍になる
- Var_X,Var_Y,Var_Z の間の相関係数は,(まるめの誤差の範囲内で)表 1 に示したものになる
- New_X,New_Y,New_Z の間の相関係数も,(まるめの誤差の範囲内で)表 1 に示したものになる
- Var_X,Var_Y,Var_Z の間の相関係数と New_X,New_Y,New_Z の間の相関係数は同じになる(Var_X と Var_Y の相関係数が,New_X と New_Y の相関係数と同じになる...など)
分析プロシージャの指定
Black-Box の中の,「相関係数行列」を指定する
分析オプションの指定
- 1 回目の分析では「variables=1-3」とする。
すなわち,Var_X,Var_Y,Var_Z(1 番目から 3 番目の変数)について分析することを指示する。
- 2 回目の分析では「variables=4-6」とする。
すなわち,New_X,New_Y,New_Z(4 番目から 6 番目の変数)について分析することを指示する。
分析結果
1 回目の分析の結果
相関係数行列 Wed Jul 22 11:24:19 1998
データセット名: dataset1.dat
ケース数: 25
変数の個数: 6
有効ケース数: 25
平均値 不偏分散 標準偏差
Var_X 21.960000000 104.04666667 10.200326792
Var_Y 9.9920000000 26.151600000 5.1138635101
Var_Z 23.896000000 16.727066667 4.0898736737
***** 相関係数行列 *****
Var_X 1.00000
Var_Y 0.60032 1.00000
Var_Z 0.40060 0.50187 1.00000
Var_X Var_Y Var_Z
2 回目の分析の結果
相関係数行列 Wed Jul 22 11:25:29 1998
データセット名: dataset1.dat
ケース数: 25
変数の個数: 6
有効ケース数: 25
平均値 不偏分散 標準偏差
New_X 43.920000000 416.18666667 20.400653584
new_Y 19.992000000 26.151600000 5.1138635101
new_Z 139.48000000 418.17666667 20.449368368
***** 相関係数行列 *****
New_X 1.00000
new_Y 0.60032 1.00000
new_Z 0.40060 0.50187 1.00000
New_X new_Y new_Z
演習
- オプションに何も指定しないで分析をしてみよ。
- 2 変数の組み合わせで散布図を描いてみよ。
直前のページへ戻る E-mail to Shigenobu AOKI