No.03750 よろしくお願いします  【とやま】 2007/06/25(Mon) 10:15

はじめまして.
以下の件,誠に申し訳ありませんが良きアドバイスの方よろしくお願いします.

現在,AとBの2つがあり,これに全く関係ないCがあります.このCがA,Bどちらの傾向に類似しているか,統計的に判断できないか悩んでおります.

たとえば,北海道(A)と鹿児島県(B)の年間の月別平均気温の推移グラフがあり,これに福岡県(C)の月別平均気温のグラフをプロットしたとします.
このとき,福岡県(C)の月別平均気温の推移の傾向は,北海道(A)と鹿児島県(B)のどちらに類似しているかといったようなものです.

形状的には鹿児島県(C)に類似しているのですが,何をもって類似しているというか...

各月の平均気温の差の検定を行うことも考えられますが,全ての月が必ずしも差がないというわけでもないですし,何か統計的な観点から類似しているということができるのでしょうか.

よろしくお願いします

No.03751 Re: よろしくお願いします  【青木繁伸】 2007/06/25(Mon) 10:49

相関係数でも求めてみたらいかがでしょうか?
相関係数はパターンというか,完全に比例関係の場合に,似ているとされるでしょう。

距離(今の場合はユークリッド距離か)を求めるというのもあり。
距離は,文字通り,近いだけでパターンが違っても似ているということになりますね。

結局,何をもって似ているとするか,明確に定義しておく必要があるということです。
> A <- c(10, 18, 12) # 10, 18, 12
> B <- c(5, 9, 6) # 5, 9, 6 A の 1/2
> C <- c(11, 10 13) # 11, 17, 13 A の近辺(でもないけど)

> cor(cbind(A, B, C)) # A, B, C 間の相関係数
A B C
A 1.0000000 1.0000000 -0.5765567
B 1.0000000 1.0000000 -0.5765567 # A と B の相関は 1 !!!
C -0.5765567 -0.5765567 1.0000000 # A と C は,逆相関 !!!

> dist(rbind(A, B, C)) # A, B, C 間のユークリッド距離
B 11.916375
C 8.124038 9.273618 # A, C がもっとも近い

No.03752 Re: よろしくお願いします  【とやま】 2007/06/25(Mon) 11:33

青木先生

さっそくのご返信ありがとうございます.

大変参考になりました.

● 「統計学関連なんでもあり」の過去ログ--- 040 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る