No.08410 相関係数の計算について  【ここ】 2008/11/27(Thu) 11:59

基礎統計学の勉強をしています。Pearsonの積率相関係数の計算方法について教えて下さい。
定義から,xとy の相関係数=(xとy共分散)/(平方根[xの分散]*平方根[yの分散]),で与えられていますが,ここで用いる分散/共分散は,偏差平方和/偏差積和 をデータ数nで割った値なのでしょうか。それとも,(n-1)で割った不偏推定量を用いるべきなのでしょうか。どちらを使っても相関係数rの値は変わりま せんが,原理としてはどちらが正しいのでしょうか。

同様に,回帰直線の傾きbを最小二乗法によって求める場合についても,原理としては不偏推定量を用いるべきなのでしょうか。手計算で平均値,分散,共分散,とデータ分析を進めていくにあたって,どちらを使うのか分からなくなってしまいました。

母集団と標本の関係が,混乱しております。基本的な質問で恐縮ですが,ご教示よろしくお願いします。

No.08417 Re: 相関係数の計算について  【青木繁伸】 2008/11/27(Thu) 15:12

> どちらを使っても相関係数rの値は変わりませんが,原理としてはどちらが正しいのでしょうか

「原理的に」と考えること自体に意味がないと思います。しいて意味づけしたければ,分散というのはデータ1個あたりの変動つまり,変動の平均値ということからいえば分散のほうが,説明はつけやすいかも。

回帰分析の場合も同じ。

No.08437 Re: 相関係数の計算について  【ここ】 2008/11/28(Fri) 11:59

お返事ありがとうございます。結果的に分散や共分散で表されると考えると,原理を考える意味がないかもしれませんね。

相 関の有意性を検定する際に標本相関係数と母相関係数を考えるので,標本相関係数を計算する場合は不偏推定量を用いるのかなと考えました。幾つかの本やネッ ト上の講義録を調べましたが,不偏推定量を用いると書いてあるのは1例のみで,後は全て分散をつかっていた(不偏推定量を使うのは間違いと書いてあるもの もあった)ので,質問させて頂いた次第です。

変動の平均値という観点から考えます。ありがとうございました。

No.08440 Re: 相関係数の計算について  【青木繁伸】 2008/11/28(Fri) 15:38

> 幾つかの本やネット上の講義録を調べましたが,不偏推定量を用いると書いてあるのは1例のみで,後は全て分散をつかっていた

ざっと見ただけですが,共変動,変動を使うものが一番多いようですよ。

http://ja.wikipedia.org/wiki/%E7%9B%B8%E9%96%A2%E4%BF%82%E6%95%B0
http://takeno.iee.niit.ac.jp/~shige/math/lecture/graduate/corel1/node2.html
http://agutoukeigaku.blogspot.com/2008/08/blog-post_15.html
エクセルのヘルプ
東京大学教養学部統計学教室編「基礎統計学I 統計学入門」東大出版会
千葉大学統計グループ訳「ケンドール統計学用語事典」丸善
三宅・山本「SPSS統計パッケージI 基礎編」東洋経済
Robert R. Socal, F. James Rohlf "Biometry", Freeman
スネデカー,コクラン「統計的方法 原書第6版」,岩波書店

は,共変動と変動で定義しています(n で割ろうと n-1 で割ろうと,間違えて n-3 で割ろうと,同じ相関係数が得られるのですから,議論の意味はないでしょう)

http://www39.atwiki.jp/stat_semi/pages/39.html

は,「2つのデータの共分散をそれぞれのデータの標準偏差の積で割ったもの」と定義しているが,その共分散は n-1 で割ったもの。r の定義式には共変動・変動を使っている n-1 を約分している。

http://www.econ.hokudai.ac.jp/~kakizawa/Excel/Excel8-3.html

は,n で割ったものを使っている。

> 不偏推定量を使うのは間違いと書いてあるものもあった

出典を知りたいですね

No.08565 Re: 相関係数の計算について  【ここ】 2008/12/08(Mon) 22:58

返信を頂いてるとは思わず,しばらく掲示板をチェックしておりませんでした。返事が遅くなってすみません。

相関係数の計算ですが,手元の本を再確認しました。おっしゃる通り,共変動と分散を使って定義しているものが多いようでした。
市原清「バイオサイエンスの統計学」南江堂
奥田千恵子「医薬研究者の視点からみた道具としての統計学」金芳堂

また,分散を使って定義したもの
宮川公男「基本統計学」有斐閣

不変推定量を使って定義したもの
瀧澤毅「薬学系学生のための基礎統計学」ムイスリ出版

は上記の通りです。

授 業で2次元データ(x,y)について平均値,分散,共分散を求め,さらに相関係数(直線回帰係数)を求めろという課題がありました。分散は偏差平方和から 求めるのではなく,[x^2の平均値ー(xの平均値)^2]として計算した方が(私は)やりやすいため,分散を使って定義してある方が分かりやすいです。 といっても,実際にデータを扱う際は手計算で相関係数などを求めていく事はまずないのでしょうが…

「分散の不偏推定量を用いるのは間違い」とある出典は,よく読むと「分子が共分散の場合は」という前提があるのだと思われます。私の解釈間違いでした。

http://www.hi.is.uec.ac.jp/lecture/misc/stat2003/exam/comment09.pdf

No.08568 Re: 相関係数の計算について  【青木繁伸】 2008/12/09(Tue) 06:47

> 「分散の不偏推定量を用いるのは間違い」とある出典は,よく読むと「分子が共分散の場合は」という前提があるのだと思われます

共分散だって,n で割るか n-1 で割るか,二通りあります。Excel では n で割る方しかないだけ。

> [x^2の平均値ー(xの平均値)^2]として計算した方が(私は)やりやすいため

コンピュータで計算するときやコンピュータプログラムを書くときには,この計算法の利用には注意が必要。

No.08570 Re: 相関係数の計算について  【ここ】 2008/12/09(Tue) 14:47

ご返信ありがとうございます。

分散の計算方法ですが,どのような注意点が必要なのでしょうか?
現段階でプログラムを書く事はないのですが,今後の参考までに教えて頂ければ有難いです。

No.08572 Re: 相関係数の計算について  【青木繁伸】 2008/12/09(Tue) 17:45

「数値計算の落とし穴」
http://aoki2.si.gunma-u.ac.jp/Hanasi/Algo/letsc/1-body.html
の,「3. 積み残し・積み過ぎ」

Excelもチョンボをやっていたという例
http://aoki2.si.gunma-u.ac.jp/Hanasi/StatTalk/11-2.html

No.08584 Re: 相関係数の計算について  【ここ】 2008/12/10(Wed) 15:58

ご返信ありがとうございます。
プログラムを書く際には,偏差平方和から求めるようにします。

● 「統計学関連なんでもあり」の過去ログ--- 042 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る