一変量データの分布の数値表現     Last modified: Jun 03, 2002

 データの全体を度数分布表の形にまとめ,ヒストグラムまたは度数多角形を描くことにより,データの全体の分布の様子を直感的に把握できるようになるが,さらにいくつかの度数分布を比較したり,分布に関する情報を簡潔に伝達したりするためには,数量的な要約が必要になる。データ全体の表す度数分布を要約するというのは,比較的少数の要約値でそれを表現することであるが,実際に何個の要約値が必要であろうか。これは,その分布が単純であるか複雑であるかにもより,また,何を目的として要約するかにもよる。

 要約値には以下のようなものがある。


データの水準に応じた統計量

 変数の尺度水準によって以下の統計量・結果が有効である。ある尺度水準の変数で有効な統計量は,それより上位の尺度水準の変数でも全てが有効である。

 以下の表で,比尺度変数の欄には幾何平均,調和平均,変動係数しかないが,それより上に書いてある統計量も有効である。

名義尺度変数
有効ケース数最頻値度数分布
順序尺度変数 + 最大値最小値中央値第1四分位数第3四分位数
間隔尺度変数 + 平均値分散不偏分散標準偏差平均偏差範囲四分偏差歪度尖度
比尺度変数 + 幾何平均調和平均変動係数


演習問題

全ての測定値を 10 倍したデータの平均値は元のデータの平均値とどのような関係にあるだろうか。
不偏分散は?標準偏差は?

答え(pdf ファイルです)


応用問題

群ごとの平均値・不偏分散が求められているとき,全体の平均値・不偏分散を求めるにはどうするか?


・ 直前のページへ戻る  ・ E-mail to Shigenobu AOKI