No.02799 canberraとは  【もこもこ】 2007/02/20(Tue) 15:50

こんにちは。

Rの距離の計算をする際に,「canberra」という計算方法があるようです。
聞いたこともなく,周りの人間もみんな同じようで,どういうものなのかもわかりません。
ネットで検索しても式すら出てきません。

どういうものなのでしょうか?

No.02800 Re: canberraとは  【青木繁伸】 2007/02/20(Tue) 16:33

"canberra distance" で最初に出てくるページ
http://people.revoledu.com/kardi/tutorial/Similarity/CanberraDistance.html
では,実際に計算してみることもできますよ。

No.02801 Re: canberraとは  【ファン】 2007/02/20(Tue) 16:33

マンハッタン市街図 http://www.laterra-net.co.jp/citymap/usa/311101.htm
キャンベラ市街図 http://www.laterra-net.co.jp/citymap/aus/6191.htm
キャンベラ距離 = 相対マンハッタン距離 http://fconyx.ncifcrf.gov/~lukeb/ClassCK/cck-dmet.html
だそうです。統計学の話なんだろうか(汗

No.02809 Re: canberraとは  【青木繁伸】 2007/02/20(Tue) 19:46

> 統計学の話なんだろうか

十分に統計学ですよ。クラスター分析などにおける距離行列の定義の話ですからねえ。

No.02812 Re: canberraとは  【もこもこ】 2007/02/21(Wed) 04:25

レスありがとうございます。

canberra metric というような名前で呼ばれているサイトもあるようでした。

この分母に書かれている対象の和はどういう意味でしょうか?

No.02818 Re: canberraとは  【ファン】 2007/02/21(Wed) 13:37

No.2801
>クラスター分析などにおける距離行列の定義の話ですからねえ。

勉強になります(汗

No.2812
>この分母に書かれている対象の和はどういう意味でしょうか?

ググってみたら,以下のようなエコロジーの例がありました。(http://www.pitt.edu/~csna/reports/janowitz.pdf)
"Species Abundance Paradox" from P. Legendre and L. Legendre, Numerical Ecology, Second English ed., Elsevier, Amsterdam, 1998.
[種の頻度]          種1       種2       種3
地点 s1 0 1 1
地点 s2 1 0 0
地点 s3 0 4 8
[距離] d(s1, s2) d(s1, s3) d(s2, s3)
Squared Euclidean 3 58 81
Manhattan 3 10 13
Canberra 3 1.378 3
Bray-Curtis 1 0.7143 1

自乗ユークリッド距離やマンハッタン距離だと,共通の種が存在しない地点 s1 と s2 が距離最小つまり類似度最大になってしまう。

● 「統計学関連なんでもあり」の過去ログ--- 040 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る