No.13485 2値データを含む変数間の相関  【れな】 2010/09/24(Fri) 06:04

いつも拝見しております。

質問紙調査でスコア化して求めた認知要因間の相関係数の求め方について,質問させてください。

変数の種類は,
・0-1の順序尺度(元々1-4の順序尺度を2値にまとめたもの)
・1-5又は1-4の順序(間隔)尺度
・複数項目(順序(間隔)尺度)の合計スコア※→間隔尺度?
の混合です。(どの変数も正規分布には従いません)

  ※行動科学分野の場合,例えば,1.そう思う 2.まぁそう思う 3.どちらともいえない  4.あまりそう思わない 5.そう思わない 等の回答項目より得られたデータは,選択肢間を「ほぼ等価」であると見て「間隔尺度データとして扱う」こともあるようです。そのため,※のような加減計算 を実行しています。

この場合,全変数を順序尺度とみなし,spearmanの順位相関係数を求めるのが正しいのでしょうか。
それとも,2値変数を含むので,少なくとも当該変数に関する相関を求めるにはクラメールの連関係数を用いた方が良いのでしょうか。

私がどうしても引っかかっているのは,
[spearmanを用いた場合]
・2値変数を含む変数間の散布図から相関関係をイメージできない
→求められた相関係数に自信がもてない(感覚的な問題ですみません)
[クラメールの連関係数を用いた場合]
・2値変数は順序尺度(0.あまりない/ない 1.ややある/ある)で,名義尺度ではない
(これは大した問題ではないかもしれませんが)
・多くの変数との分割表において度数が5より小さいセルが多数生まれてしまい,カテゴリーの統合等を行う必要が出てきてしまうということです。
私としては,順位相関係数で済むに越したことはないのですが…。

過去ログ(投稿者:あや 2010/05/05(Wed) 10:37 No. 12569)を拝見し,spearmanで問題ないのかもしれないと思いましたが,問題にしている箇所が違いましたので新規投稿させて頂きました。

どうぞ宜しくお願い致します。

No.13486 Re: 2値データを含む変数間の相関  【青木繁伸】 2010/09/24(Fri) 08:13

順位相関係数でよいでしょう

> 2値変数を含む変数間の散布図から相関関係をイメージできない

散布図に描くとドットが重なってしまう(1つのドットにしか見えない)からでしょう。jitter を加えるとか度数に比例した半径を持つ円で描くなどすれば,分割表を図示したものになるでしょう。散布図の他にモザイクプロットなどもよい表現法です。

> 2値変数は順序尺度(0.あまりない/ない 1.ややある/ある)で,名義尺度ではない

「はい」,「いいえ」というのは順序尺度でしょうが,「男」,「女」というのも二値変数ですがそれは名義尺度でしょう?驚くべき事に,二値変数は間隔尺度でもあるのですよ。点双列相関係数や重回帰分析などのダミー変数の例を考えると納得できるでしょう。

No.13492 Re: 2値データを含む変数間の相関  【れな】 2010/09/25(Sat) 14:21

青木先生

早速のご回答有難うございます。
ご提案していただいた表現方法を是非試してみようと思います。
これまで主に連続変数しか扱ったことがなかったので,とても勉強になりました。

引き続き,2値データに関してご質問させてください。
先生からのご回答を参考にすると,例えば,
・2値(yes/no)×2値(yes/no)
・2値(yes/no)×5値("strongly agree" to "strongly disagree")
などの相関係数もspearmanで問題ないということでよろしいでしょうか。
そして,その理由として,「2×2分割表ではφ係数,l×m分割表ではクラメールの連関係数を求めることになっているが,上記尺度は全て順位尺度かつ間隔尺度であるため,わざわざ名義尺度として捉える必要はない」というのは適当でしょうか。

度々で申し訳ございませんが,どうぞ宜しくお願い致します。

No.13493 Re: 2値データを含む変数間の相関  【青木繁伸】 2010/09/25(Sat) 14:30

> ・2値(yes/no)×2値(yes/no)
> ・2値(yes/no)×5値("strongly agree" to "strongly disagree")
> などの相関係数もspearmanで問題ないということでよろしいでしょうか

全く問題ありません。

> 2×2分割表ではφ係数

2つの2値データ変数を集計して2×2分割表からφ係数を計算し,別途,もとの2値データを使ってピアソンの積率相関係数を計算してみてください。両者は完全に同じ値になります。

No.13494 Re: 2値データを含む変数間の相関  【れな】 2010/09/25(Sat) 15:28

青木先生

とてもよく理解することができました。
「一見順序尺度に見えるデータを間隔尺度としても扱うこと」「順位データを含む相関のイメージを掴むこと」への不慣れさが理解を妨げていたように思います。

初歩的な質問にも関わらず大変丁寧に回答して下さり,本当に有難うございました。

● 「統計学関連なんでもあり」の過去ログ--- 043 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る