No.13729 相関係数から距離への変換  【とろぴかる】 2010/11/06(Sat) 17:14

http://aoki2.si.gunma-u.ac.jp/lecture/misc/clustan.html
上記ページに相関係数を距離に変換する式があります。
上記ページでは明記されていませんが,この式は「相関係数をユークリッド平方距離に変換する」式なのでしょうか。
ユークリッド平方距離は比尺度で,相関係数は間隔尺度未満のような気がするのです。
どうなのでしょうか?

No.13730 Re: 相関係数から距離への変換  【青木繁伸】 2010/11/06(Sat) 18:55

> この式は「相関係数をユークリッド平方距離に変換する」式なのでしょうか。

そうですけど?

相 関係数は比尺度でないのは当然で,なおかつ間隔尺度でも順序尺度でもましてや名義尺度でもありません。そもそも,統計量をデータとして扱うのは不適切で しょう。どこかのページで相関係数は間隔尺度以未満などと書かれていたところがあったようにも思いますけど,間隔尺度未満順序尺度以上等という水準はない でしょうね。

なお,「ユークリッド平方距離は比尺度」というのは嘘っぽいですね。距離 0 は存在するし,方向付きの距離を考えれば,「負の距離」もあります。ということで,この二つの性質をもつものは,比尺度ではありません。

長 さ n で,ノルム 1 のベクトル x, y が n 次元空間あるとき,第二余弦定理で,ベクトル x, y の頂点(矢印の先)の間の距離は,d^2 = x^2+y^2-2xy cos θ = 2-2 cosθ = 2(1-r)。x, y のなす角をθとすれば,cos θが相関係数 r。つまり,(x,y の内積)/(x の長さ)/(y の長さ)= r。よって,d^2 = 2*(1-r)。(詳しくは http://econom01.cc.sophia.ac.jp/seminar/semi06/stat3.htm などが参考になるでしょうけど)

No.13731 Re: 相関係数から距離への変換  【とろぴかる】 2010/11/06(Sat) 21:04

青木様

早速のご回答ありがとうございました。

> 第二余弦定理で,ベクトル x, y の頂点(矢印の先)の間の距離は,d^2 = x^2+y^2-2xy cos θ = 2-2 cosθ = 2(1-r)。

なるほど。第二余弦定理にまでには考えが至りませんでした。

> 間隔尺度未満順序尺度以上等という水準はないでしょうね。

言葉足らずでしたが,私が言いたかったのは,「相関係数は間隔尺度と順序尺度の間の水準」ということではなく「相関係数は少なくとも間隔尺度ではない」ということです。

> 相関係数は比尺度でないのは当然で,なおかつ間隔尺度でも順序尺度でもましてや名義尺度でもありません。そもそも,統計量をデータとして扱うのは不適切でしょう。

ここで指摘されていることは,「尺度水準とは,測定で得られたデータそのものの性質を分類し,その分類に合った統計値を出すための指針を与えるものであって,測定で得られたデータをもとに算出した統計値にまで拡大適用してはならない」ということですよね。
た だ,「相関係数0.8は相関係数0.5より相関が高い」というような解釈をしますが,これは「相関係数を順序尺度的に解釈している」と言えなくもないと思 います。決して,相関係数に対して順序尺度に適用できる統計処理を加えることができると言っている訳ではなく,そういう感覚で相関係数の値を見ている,と いうことです。

さて,私が今回質問し,ご回答をいただいたなかで,一つ違和を感じているところがあります。それは「尺度(的なもの)の異なる二つの数値がイコール(=)でつながっている」ということです。
私なりの理解は,「2つの数値を,その素性は置いといて,幾何学的にとらえて数式変換をすればイコールなんだよ。別にここでは統計学的にどうこうというところまで保証するつもりはないんだよ」という感じです。

● 「統計学関連なんでもあり」の過去ログ--- 044 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る