★ たんぽぽ ★

9619. たんぽぽ 記述統計でゼロを含めて計算する意味 2006/03/11 (土) 16:50
└9620. Re: たんぽぽ 青木繁伸 2006/03/11 (土) 19:41
 ├9623. Re^2: たんぽぽ ひの 2006/03/12 (日) 01:22
 └9622. Re^2: たんぽぽ 記述統計でゼロを含めて計算する意味 2006/03/12 (日) 00:58
  └9624. Re^3: たんぽぽ 青木繁伸 2006/03/12 (日) 10:20
   └9651. Re^4: たんぽぽ HRPTV5C 2006/03/14 (火) 21:50


9619. たんぽぽ 記述統計でゼロを含めて計算する意味  2006/03/11 (土) 16:50
平均,標準偏差を求めて,変動係数を算出し,複数の変数間のばらつきの大きさを評価したいのですが,最小値が0であるケースが複数ある変数がある場合,変動係数を比較する意味はあるでしょうか?変動係数というより,平均や標準偏差を求める意味はあるでしょうか。
具体的には,大学進学者数,高校進学者数を地域別に比較したいのですが,市町村単位でみると,大学進学者数はゼロという市町村が複数でます。その場合,大学進学者数の変動係数と高校進学者数の変動係数の大きさを比較して,よいでしょうか。

     [このページのトップへ]


9620. Re: たんぽぽ 青木繁伸  2006/03/11 (土) 19:41
変動係数というのは実に使いでのない統計量です。

ちなみに,定義の上からは変動係数は比尺度でないと定義できないです。

よって,0のあるデータは比尺度ではないですから,変動係数は定義できません。

     [このページのトップへ]


9623. Re^2: たんぽぽ ひの  2006/03/12 (日) 01:22

> よって,0のあるデータは比尺度ではないですから,変動係数は定義できません。

そうでしたっけ?比例尺度は0を基点とする量ですから,0を含むこと自体は問題ないのでは?

     [このページのトップへ]


9622. Re^2: たんぽぽ 記述統計でゼロを含めて計算する意味  2006/03/12 (日) 00:58
標準偏差が平均値の何倍であるかを示すのが変動係数と考えると,ご指摘のとおり,比例尺度でないと意味がないということですよね。。たしかにそうですね。

ただ,実際問題として,国語テストと算数テストのばらつきを比較しようとするときなどで,テストの点数がゼロということは多くありますよね。そういう場合も変動係数は意味がないということになりますね?

変動係数があまり使いがってがよくないということはわかりましたが,二つの変数のばらつきの大きさ(単位がことなる)を比較したいときは,何を使えばよいのでしょうか。

     [このページのトップへ]


9624. Re^3: たんぽぽ 青木繁伸  2006/03/12 (日) 10:20
> 実際問題として,国語テストと算数テストのばらつきを比較しようとするときなどで,テストの点数がゼロということは多くありますよね。そういう場合も変動係数は意味がないということになりますね?

平均値が0や負の値にならなければ,実際上は変動係数は計算できます。
摂氏で表現された毎日定時に観測される東京の気温の一年間のデータの変動係数は計算できますが,南極の場合の変動係数は計算できないでしょう(たぶん平均値はマイナスだろうと思うんですが)。
絶対温度に換算した場合には,どちらの場合も変動係数は計算できます。

> 二つの変数のばらつきの大きさ(単位がことなる)を比較したいときは,何を使えばよいのでしょうか。

単位が異なるものの(mとcmのようなのは換算ができるので同じ単位)の比較はできないでしょう。上の例で言えば,東京の温度の変動係数と風速の変動係数を比較しても,??なだけではないですか。

場合によっては,単位が同じであっても比較はできないことがありますよね。東京の風速の変動係数と江戸川の流速の変動係数。そんなもの比較してどうするのってことで。

では,数学と国語の変動係数は比較できるか??
いろいろ微妙なんでしょうね。

上の記述中の,「変動係数」という用語を,「平均値」や「分散」に置き換えて,それぞれが正しいかどうか考えてみるのも暇つぶしになるかもしれません。

     [このページのトップへ]


9651. Re^4: たんぽぽ HRPTV5C  2006/03/14 (火) 21:50
始めまして,変動係数 CV%については昔,色々悩まされましたので,つい懐かしくなり,コメントします。この言葉はエッペンドルフなどの分注器などの性能表示で見かけましたが,どちらかと言うと見かけ良くする手段に使われていたようですね。変動係数のおかしさは10gと100gの秤量精度とか,恒温槽の設定温度精度などを考えれば分るとは思いますが,どこがおかしいのか認識するまでは大変ですね。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 037 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る