No.13486 Re: 2値データを含む変数間の相関 【青木繁伸】 2010/09/24(Fri) 08:13
順位相関係数でよいでしょう
> 2値変数を含む変数間の散布図から相関関係をイメージできない
散布図に描くとドットが重なってしまう(1つのドットにしか見えない)からでしょう。jitter を加えるとか度数に比例した半径を持つ円で描くなどすれば,分割表を図示したものになるでしょう。散布図の他にモザイクプロットなどもよい表現法です。
> 2値変数は順序尺度(0.あまりない/ない 1.ややある/ある)で,名義尺度ではない
「はい」,「いいえ」というのは順序尺度でしょうが,「男」,「女」というのも二値変数ですがそれは名義尺度でしょう?驚くべき事に,二値変数は間隔尺度でもあるのですよ。点双列相関係数や重回帰分析などのダミー変数の例を考えると納得できるでしょう。
No.13492 Re: 2値データを含む変数間の相関 【れな】 2010/09/25(Sat) 14:21
青木先生
早速のご回答有難うございます。
ご提案していただいた表現方法を是非試してみようと思います。
これまで主に連続変数しか扱ったことがなかったので,とても勉強になりました。
引き続き,2値データに関してご質問させてください。
先生からのご回答を参考にすると,例えば,
・2値(yes/no)×2値(yes/no)
・2値(yes/no)×5値("strongly agree" to "strongly disagree")
などの相関係数もspearmanで問題ないということでよろしいでしょうか。
そして,その理由として,「2×2分割表ではφ係数,l×m分割表ではクラメールの連関係数を求めることになっているが,上記尺度は全て順位尺度かつ間隔尺度であるため,わざわざ名義尺度として捉える必要はない」というのは適当でしょうか。
度々で申し訳ございませんが,どうぞ宜しくお願い致します。
No.13493 Re: 2値データを含む変数間の相関 【青木繁伸】 2010/09/25(Sat) 14:30
> ・2値(yes/no)×2値(yes/no)
> ・2値(yes/no)×5値("strongly agree" to "strongly disagree")
> などの相関係数もspearmanで問題ないということでよろしいでしょうか
全く問題ありません。
> 2×2分割表ではφ係数
2つの2値データ変数を集計して2×2分割表からφ係数を計算し,別途,もとの2値データを使ってピアソンの積率相関係数を計算してみてください。両者は完全に同じ値になります。
No.13494 Re: 2値データを含む変数間の相関 【れな】 2010/09/25(Sat) 15:28
青木先生
とてもよく理解することができました。
「一見順序尺度に見えるデータを間隔尺度としても扱うこと」「順位データを含む相関のイメージを掴むこと」への不慣れさが理解を妨げていたように思います。
初歩的な質問にも関わらず大変丁寧に回答して下さり,本当に有難うございました。
● 「統計学関連なんでもあり」の過去ログ--- 043 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る