No.15886 単位換算  【統計勉強家】 2011/12/06(Tue) 13:34

こちらでいつも勉強させていただいています。

いくつかある説明変数と被説明変数の単位を揃えたいと考えているのですが,どうすればよいのかが分かりません。
いろいろと調べたのですが,全くありませんでした。
例えば,キロメートルから人に単位を変換したりしたいのです。
そして,距離行列を作って,クラスターする予定です。
しかし,樹形図を作る際に,determinantで行いたいのですが,これもさっぱり分かりません。

分かる方がいらっしゃいましたら,教えていただけませんか。
どうか,宜しくお願い致します。

No.15887 Re: 単位換算  【青木繁伸】 2011/12/06(Tue) 16:03

> キロメートルから人に単位を変換

「人」ですか? どういう意味でしょう。「キロメートル」を「人」になんか,変換できるわけないでしょう。

様々 な単位がある場合に,揃える唯一の方法は,標準化する(つまり,単位をなくする)ことでしょう。平均値=0,標準偏差=1に変換するのです。標準化した データから距離を求めればよいですね。例えば,iris データの 1 〜 4 列のデータを各列ごとに標準化して,距離行列を求めるには dist(scale(iris[,1:4])) とすればよいです。

> 樹形図を作る際に,determinantで行う

というのも,意味が分かりません。
determinant って,行列式(一つの値)ですよね。
det {base}
Calculate the Determinant of a Matrix
> ( x <- matrix(c(3, 4, 2, 7), 2, 2) )
[,1] [,2]
[1,] 3 2
[2,] 4 7
> det(x)
[1] 13

No.15888 Re: 単位換算  【統計愛好家】 2011/12/06(Tue) 17:11

青木先生

ご返信ありがとうございます。

なるほど,標準化ですね。
全ての単位を統一させたかったのです。
説明変数1と説明変数2があって,単位が異なるがために回帰をかけたときに,影響力に偏りがでてはいけないと考えたからです。
この考え方はあっているのでしょうか?

クラスターについては,私もdeterminantで行う意味が分からなかったので,やはり群平均法で行うのが一番好ましいのでしょうか?

No.15889 Re: 単位換算  【青木繁伸】 2011/12/06(Tue) 18:07

> 説明変数1と説明変数2があって,単位が異なるがために回帰をかけたときに,影響力に偏りがでてはいけないと考えたからです。
> この考え方はあっているのでしょうか?

重回帰分析で「予測」をする場合には標準化はしないでしょう。
被 説明変数にどの説明変数がより大きい影響を与えるかという場合には「標準化偏回帰係数」を比較します。標準化偏回帰係数は,説明変数,被説明変数全てを標 準化したデータで計算される偏回帰係数に等しいのですが,データを前もって標準化してから重回帰分析を行うというような無駄な計算はしなくても,偏回帰係 数と説明変数,被説明変数の分散から簡単に計算することができます。以下を参照のこと。
http://aoki2.si.gunma-u.ac.jp/lecture/Regression/mreg/mreg2.html

クラスター分析の場合には,分析に用いる全変数を前もって標準化すればよいでしょう。

ところで,どこに「determinant で行う」なんて書いてあったのでしょうか?

最も好ましいのは,Ward 法,complete 法でしょう。

No.15890 Re: 単位換算  【統計勉強家】 2011/12/06(Tue) 23:54

ご返信ありがとうございます。

重回帰分析では予測は行う予定はないので,標準化した方がよさそうです。
クラスター分析をするので,結局標準化する他なさそうです。

determinantで行うことは知人から聞いたのですが,おそらく間違っていそうです。
ward法やcomplete法を勉強していこうと思います。

本当にありがとうございました。

No.15891 Re: 単位換算  【統計勉強家】 2011/12/07(Wed) 02:10

青木先生
こんばんは。
determinantについてですが,determinant基準というものがあるらしく,それでクラスター分析を行うというものでした。
しかし,クラスター分析をdeterminant基準で行うとは,どういうことなのかが全く分かりません。
青木先生はご存知でしょうか?

No.15892 Re: 単位換算  【青木繁伸】 2011/12/07(Wed) 06:39

> determinant基準というものがあるらしく,それでクラスター分析を行う

k-means クラスター関連で,
http://www.msi.co.jp/vmstudio/materials/tech_web/cluster.html
に "determinant" が出てきますけどね。

No.15898 Re: 単位換算  【統計愛好家】 2011/12/07(Wed) 23:51

ご返信ありがとうございます。
なるほど,k-meansの時に出てくるのですね。
色々とこれから調べてみます。
ありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 045 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る