★ 正規分布してないときの相関係数 ★

 1 正規分布してないときの相関係数  kinnui  2000/01/23 (日) 10:02
  2 Re: 正規分布してないときの相関係数  ひの  2000/01/23 (日) 11:49
   3 Re^2: 正規分布してないときの相関係数  kinnui  2000/01/23 (日) 19:55
    7 Re^3: 正規分布してないときの相関係数  出口慎二  2000/01/24 (月) 04:04
     19 Re^4: 正規分布してないときの相関係数  kinnui  2000/01/24 (月) 23:08
      24 Re^5: 正規分布してないときの相関係数  出口慎二(2)  2000/01/25 (火) 01:27
       30 Re^6: 正規分布してないときの相関係数  青木繁伸  2000/01/25 (火) 10:43
        37 Re^7: 正規分布してないときの相関係数  出口慎二  2000/01/25 (火) 14:16
       29 Re^6: 正規分布してないときの相関係数  青木繁伸  2000/01/25 (火) 10:40
        35 Re^7: 正規分布してないときの相関係数  出口慎二  2000/01/25 (火) 14:16
         38 Re^8: 正規分布してないときの相関係数  青木繁伸  2000/01/25 (火) 14:42
       28 Re^6: 正規分布してないときの相関係数  青木繁伸  2000/01/25 (火) 10:38
        36 Re^7: 正規分布してないときの相関係数  出口慎二  2000/01/25 (火) 14:16
      23 Re^5: 正規分布してないときの相関係数(1)  出口慎二  2000/01/25 (火) 01:27
       110 Re^6: 正規分布してないときの相関係数(1)  kinnui  2000/01/28 (金) 21:58
        111 Re^7: 正規分布してないときの相関係数(1)  マンボウ  2000/01/28 (金) 23:11
         272 Re^8: 正規分布してないときの相関係数(1)  kinnui  2000/02/05 (土) 12:55
    5 Re^3: 正規分布してないときの相関係数  マンボウ  2000/01/23 (日) 23:39
     18 Re^4: 正規分布してないときの相関係数  kinnui  2000/01/24 (月) 23:00


1. 正規分布してないときの相関係数  kinnui  2000/01/23 (日) 10:02
みなさん こんにちは。分からなかった点をお訊ねします。

ある商品の販売額と得意先の販売額(全体の販売額)の相関を知りたいのですが,標本について度数分布を調べたところ左端に近いところに山がくる逆J(?)型になっていました。(得意先の販売額)
ピアソンの相関係数は正規分布が前提と教わりましたのでこれは使えないと思っています。スピアマンのρでは0.73,ケンドールのτbでは0.366という結果が出ているのですがこの2つを使うことは正しいのでしょうか。正しいとすれば両者で数値に開きがあるのをどう解釈すれば良いでしょうか。
宜しくお願いします。

     [このページのトップへ]


2. Re: 正規分布してないときの相関係数  ひの  2000/01/23 (日) 11:49
> ピアソンの相関係数は正規分布が前提と教わりましたのでこれは使えないと思っています。スピアマンのρでは0.73,ケンドールのτbでは0.366という結果が出ているのですがこの2つを使うことは正しいのでしょうか。正しいとすれば両者で数値に開きがあるのをどう解釈すれば良いでしょうか。

両者は計算方法が異なりますから,相関係数の値は一般に一致しません。しかし,有意性検定の結果はほとんど変わらないと思います。
つまり,上記の結果から,スピアマンの相関を求めた方がより大きな相関が認められたということにはなりません。両者の数値の比較は意味がありません。

     [このページのトップへ]


3. Re^2: 正規分布してないときの相関係数  kinnui  2000/01/23 (日) 19:55
ひのさん コメントありがとうございます。

> 両者は計算方法が異なりますから,相関係数の値は一般に一致しません。しかし,有意性検定の結果はほとんど変わらないと思います。
おっしゃるように有意性検定の結果は両者で変わりませんでした。
スピアマンでは「強い相関がある」となり,ケンドールでは「弱い相関」となっているのでどっちが本当なの?という単純な疑問なのですがこの点はどうでしょうか。
基本的な質問で恐縮です(私が全くわかっていないためです)がケンドールやスピアマンを当てはめて判断することは正しいのでしょうか。
よろしくお願いします。

     [このページのトップへ]


7. Re^3: 正規分布してないときの相関係数  出口慎二  2000/01/24 (月) 04:04
> スピアマンでは「強い相関がある」となり,ケンドールでは「弱い相関」となっているのでどっちが本当なの?という単純な疑問なのですがこの点はどうでしょうか。

2変量の関係なら,散布図を書いてみたらどうですか?スピアマンがいくつでケンドールがいくだろうと,散布図は同じです.同じ関係を,「強い」といったり「弱い」といったりする理由が分かりません.

スピアマンは分散の計算をしています.ケンドールは確率の計算をしています.他の方も指摘しているとおり,両者の数値を比較しても意味はないと思います.

但,両者の関係をあらわす式というのはあるようですが.

-1 ≦ 3 * ケンドール - 2 * スピアマン ≦ 1
SiegelとCastellan(1988),STATISTICA_HELPより

     [このページのトップへ]


19. Re^4: 正規分布してないときの相関係数  kinnui  2000/01/24 (月) 23:08
コメント有り難うございます。
> 散布図は同じです.同じ関係を,「強い」といったり「弱い」といったりする理由が分かりません.

初心者の立場で言いますとどうして同じ相関なのに数値がこんなに違うのだろうということになり,質問したわけです。

> スピアマンは分散の計算をしています.ケンドールは確率の計算をしています.
ケンドールの場合は2つの要素が関係している確率を言っている。つまり「今回の例では30数パーセントである」という理解で良いのでしょうか。

重ね重ねで恐縮ですが身につけたいと思っていますので宜しくお願いします。

     [このページのトップへ]


24. Re^5: 正規分布してないときの相関係数  出口慎二(2)  2000/01/25 (火) 01:27
ところで,どうしてもしっくり来ないこと.

ピアソンの積率相関係数で,「0.7」より値が大きいとき,「強い」相関がある,という目安の存在は,知ってはいます.出所は知りませんが.

でも,よく考えてください.ピアソンの積率相関係数やスピアマンの順位相関係数の有意性の,棄却域5%の両側検定では,nが6とか7なら,|r|=0.7でも有意ではありません.n=100なら,|r|=0.2でも有意です.「0.7」を境に「強い」とか「弱い」とか言う意味はどれほどのものでしょう.

2変量の関係,特に,はずれ値や分布の多峰性(という言葉はありましたっけ?)の影響が出にくい順位量同士なら,散布図は,とても見易く説得力をもって,両変数の直線関係を表現すると思うのですが.

因みに,ちょっと思いついたこと.

とりあえず行われた,やけに質問数の多いアンケートで見かけるのが,やたらと相関係数の絶対値が大きい質問同士.「おや?」と思ってみてみると,実質同じことを聞いてるような質問が複数まざってただけだった,というケース.相関係数の絶対値が大きいことと,実際に何か意味のある知見が得られることとは,必ずしも一致しません.一応念のため.

     [このページのトップへ]


30. Re^6: 正規分布してないときの相関係数  青木繁伸  2000/01/25 (火) 10:43
> とりあえず行われた,やけに質問数の多いアンケートで見かけるのが,やたらと相関係数の絶対値が大きい質問同士.「おや?」と思ってみてみると,実質同じことを聞いてるような質問が複数まざってただけだった,というケース.相関係数の絶対値が大きいことと,実際に何か意味のある知見が得られることとは,必ずしも一致しません.一応念のため.

意義を申し立てるつもりは毛頭ないのですが...

いろいろな質問紙調査票を作るとき,「尺度」を構成する質問項目は互いに似ている項目をあえて(?)集めるような傾向もありますよね。尺度の中に異質な質問が入っているとそちらの方が問題です。

程度問題なんでしょうけど。

     [このページのトップへ]


37. Re^7: 正規分布してないときの相関係数  出口慎二  2000/01/25 (火) 14:16
> いろいろな質問紙調査票を作るとき,「尺度」を構成する質問項目は互いに似ている項目をあえて(?)集めるような傾向もありますよね。尺度の中に異質な質問が入っているとそちらの方が問題です。
>
> 程度問題なんでしょうけど。

そうですよね,程度の問題なんですよね.潜在的な因子を想定する場合,背後の因子に共通点があるという意味での同種の質問が必要だったりしますし.

で,程度の問題として,(スピアマンの)相関係数が「0.7」という数値が,可能な限り条件を統制して行われる実験のような場合でなく,一般的なアンケートの類で出てきたら,素直に採る前に,ちょっと疑って見ることも必要だよ,といった意味合いです.

     [このページのトップへ]


29. Re^6: 正規分布してないときの相関係数  青木繁伸  2000/01/25 (火) 10:40
> でも,よく考えてください.ピアソンの積率相関係数やスピアマンの順位相関係数の有意性の,棄却域5%の両側検定では,nが6とか7なら,|r|=0.7でも有意ではありません.n=100なら,|r|=0.2でも有意です.「0.7」を境に「強い」とか「弱い」とか言う意味はどれほどのものでしょう.

検定結果が有意であることと,実質的な意味があるかどうかということは全く別の話です。
http://aoki2.si.gunma-u.ac.jp/Hanasi/StatTalk/jissainoimi.html

     [このページのトップへ]


35. Re^7: 正規分布してないときの相関係数  出口慎二  2000/01/25 (火) 14:16
> 検定結果が有意であることと,実質的な意味があるかどうかということは全く別の話です。
> http://aoki2.si.gunma-u.ac.jp/Hanasi/StatTalk/jissainoimi.html

以下2点,同感です.

・意味のない仮説を検定する無意味さ.
・nが非常に大きい場合,検出力が高くなりすぎる.

但,私の発言の意図するところは,迷ったら散布図を描いてみよう,ということです.順位量なので,数値そのままの図かもしれませんが,どのくらい両変数間に直線関係があるのかが一目瞭然,という意味で,「強い」のか「弱い」のか,ということが実感としてつかめると思います.

そういえば,他でご指摘頂きましたr^2ですが,どれだけ分散を説明したか,でもって,相関係数同士の大小関係を考える,というように「比較」しての「強い」「弱い」は使いますね.この比較対象が「常識」的に,というものになったときが,分散の半分,すなわち相関係数の絶対値「0.7」か,とあらためて納得.

     [このページのトップへ]


38. Re^8: 正規分布してないときの相関係数  青木繁伸  2000/01/25 (火) 14:42
> 但,私の発言の意図するところは,迷ったら散布図を描いてみよう,ということです.順位量なので,数値そのままの図かもしれませんが,どのくらい両変数間に直線関係があるのかが一目瞭然,という意味で,「強い」のか「弱い」のか,ということが実感としてつかめると思います.

これは非常に正しい意見ですね。
「迷ったら」どころではなく,「いつも散布図を描くべし」という人も多いです。

http://aoki2.si.gunma-u.ac.jp/lecture/Soukan/pearson.html
の,数式の下の方に,「相関係数の大きさと散布図の関係のアニメーション表示」というリンクがあります。2変量正規分布において散布図と相関係数の対応をみることができます。
私は「相関係数が0.7程度でも随分と点は散らばっているな〜」と思うほうです。
皆さんはどう思いますか。

     [このページのトップへ]


28. Re^6: 正規分布してないときの相関係数  青木繁伸  2000/01/25 (火) 10:38
> ところで,どうしてもしっくり来ないこと.
>
> ピアソンの積率相関係数で,「0.7」より値が大きいとき,「強い」相関がある,という目安の存在は,知ってはいます.出所は知りませんが.

大本の出処は実は私も知りませんが,書いてある本は多いですね(そんな無責任な ^_^)。

蛇足:理論的根拠

単回帰分析(直線回帰分析)の拡張が重回帰分析であることと関係するのですが,二変数間の相関係数を二乗した数値は,一方を独立変数他方を従属変数としたときの重相関係数の二乗値(決定係数)であることがわかります。

つまり,相関係数の二乗値は,一方の変数が他の変数の分散を説明できる割合を表しているのです。相関係数が0.7のときその二乗値は0.49で,一方の変数が他の変数のほぼ半分を説明できるということになります。分野,対象にもよりますが相関係数が 0.7 というのはそうそう出てくる数値ではないので,0.7 を基準にするのもあながち間違いではないだろうかと思います。

     [このページのトップへ]


36. Re^7: 正規分布してないときの相関係数  出口慎二  2000/01/25 (火) 14:16
> つまり,相関係数の二乗値は,一方の変数が他の変数の分散を説明できる割合を表しているのです。相関係数が0.7のときその二乗値は0.49で,一方の変数が他の変数のほぼ半分を説明できるということになります。分野,対象にもよりますが相関係数が 0.7 というのはそうそう出てくる数値ではないので,0.7 を基準にするのもあながち間違いではないだろうかと思います。

あ,なるほど.確かに.0.7^2は,ほぼ0.5ですね.妙に納得しました.ご指摘ありがとうございました.

     [このページのトップへ]


23. Re^5: 正規分布してないときの相関係数(1)  出口慎二  2000/01/25 (火) 01:27
> 初心者の立場で言いますとどうして同じ相関なのに…

繰り返します.異なる数値です.「同じ」ではありません.

> …2つの要素が関係している…

この「関係」というものの捉え方が,スピアマンとケンドールで異なります.回帰直線上にどれだけデータが集まってくるのかに注目するのがスピアマン.データの2変量における順位の大小関係が一致している組が一致していない組よりどれだけ多いかを,全組み合わせに対する割合で表現したのがケンドール.これだけでは十分な説明はできませんが,表現方法が別物だ,ということは伝わりませんでしょうか.

> …「今回の例では30数パーセントである」…

何が「30数パーセント」なのですか?理解すべきはこの「何が」の部分です.

> 重ね重ねで恐縮ですが身につけたいと思っていますので宜し
> くお願いします。

残念ながら私は適当なテキストを知りません.が,やはり何か良いテキストを見つけて,とにかく繰り返し計算をなぞるしかないのでは,と思います.あまり薦めませんが,私がこれらの統計量を学んだ本は,下記のものです.が,プログラムの本です.

『パソコン統計解析ハンドブック1基礎統計編』

     [このページのトップへ]


110. Re^6: 正規分布してないときの相関係数(1)  kinnui  2000/01/28 (金) 21:58
> > 初心者の立場で言いますとどうして同じ相関なのに…
>
> 繰り返します.異なる数値です.「同じ」ではありません.
数値が同じとは思っていませんが。散布図に書けば同じものがどうして違う数値をとるのかという意味で書いたのです。(こういうのを同じ相関とは言わないのであれば私の表現が誤っています)


> 何が「30数パーセント」なのですか?理解すべきはこの「何が」の部分です.
わたしには「何が」なのかよく分かりませんでした。
分からないことが沢山ある中で何とか手がかりをつかみたいという必死の思いと取っていただければ有り難いのですが。


> 『パソコン統計解析ハンドブック1基礎統計編』
わざわざ有り難うございます。一度見てみます。

     [このページのトップへ]


111. Re^7: 正規分布してないときの相関係数(1)  マンボウ  2000/01/28 (金) 23:11
> 数値が同じとは思っていませんが。散布図に書けば同じものがどうして違う数値をとるのかという意味で書いたのです。

たとえになるか,理解の助けになるかどうかわかりませんが,
データの分布の位置を表す指標には,「平均値」,「中央値」,「最頻値」という三種類があり,さらに平均値は「算術平均値」,「幾何平均値」,「調和平均値」という三種があります。

同じデータの分布の位置を表すのに,これらの数値は必ずしも同じではありません。

     [このページのトップへ]


272. Re^8: 正規分布してないときの相関係数(1)  kinnui  2000/02/05 (土) 12:55
マンボウさん こんにちは
分かり易いたとえでしたのでよく分かりました。
ありがとうございます。
数値に頼らずに散布図で必ず確認した方が良さそうですね。
数値だけで相関が強い,弱いといってもケンドールとスピアマンで同じ散布状況にもかかわらず数値が倍も違うとこれだけで判断は危険だと感じました。

     [このページのトップへ]


5. Re^3: 正規分布してないときの相関係数  マンボウ  2000/01/23 (日) 23:39
> スピアマンでは「強い相関がある」となり,ケンドールでは「弱い相関」となっているのでどっちが本当なの?という単純な疑問なのですがこの点はどうでしょうか。

絶対値が0.7以上のときに強い相関がある,ってやつですか。
あれは,ピアソンの積率相関係数と,スピアマンの順位相関係数に関してであって,ケンドールの順位相関係数に適用するものではないと思います。

(スピアマンの順位相関係数は,素データを順位変換したものに対して,ピアソンの積率相関係数の計算式を適用したものですから,基本的にはピアソンの積率相関係数とスピアマンの順位相関係数を同じように扱います。無相関検定に同じ検定公式が使われるのもそのためです。と私は理解している。)

     [このページのトップへ]


18. Re^4: 正規分布してないときの相関係数  kinnui  2000/01/24 (月) 23:00
コメント有り難うございます。
> 絶対値が0.7以上のときに強い相関がある,ってやつですか。あれは,ピアソンの積率相関係数と,スピアマンの順位相関係数に関してであって,ケンドールの順位相関係数に適用するものではないと思います。
こういうことも分かってない初心者ですのでこのように説明していただけると非常に助かります。
 ケンドールのτbの場合は相関関係の強弱をあらわすものは何かあるのでしょうか。(相関係数という言葉が適切かどうか不明ですが)もしあるとすればどういう数値の時に相関が強いと言えるのでしょうか。
宜しくお願いします。 

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 006 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る