データの全体を度数分布表の形にまとめ,ヒストグラムまたは度数多角形を描くことにより,データの全体の分布の様子を直感的に把握できるようになるが,さらにいくつかの度数分布を比較したり,分布に関する情報を簡潔に伝達したりするためには,数量的な要約が必要になる。データ全体の表す度数分布を要約するというのは,比較的少数の要約値でそれを表現することであるが,実際に何個の要約値が必要であろうか。これは,その分布が単純であるか複雑であるかにもより,また,何を目的として要約するかにもよる。
要約値には以下のようなものがある。
データの水準に応じた統計量
変数の尺度水準によって以下の統計量・結果が有効である。ある尺度水準の変数で有効な統計量は,それより上位の尺度水準の変数でも全てが有効である。
以下の表で,比尺度変数の欄には幾何平均,調和平均,変動係数しかないが,それより上に書いてある統計量も有効である。
名義尺度変数 | 有効ケース数,最頻値,度数分布 | |
---|---|---|
順序尺度変数 | + | 最大値,最小値,中央値,第1四分位数,第3四分位数 |
間隔尺度変数 | + | 平均値,分散,不偏分散,標準偏差,平均偏差,範囲,四分偏差,歪度,尖度 |
比尺度変数 | + | 幾何平均,調和平均,変動係数 |
演習問題:
全ての測定値を 10 倍したデータの平均値は元のデータの平均値とどのような関係にあるだろうか。
不偏分散は?標準偏差は?
答え(pdf ファイルです)
応用問題:
群ごとの平均値・不偏分散が求められているとき,全体の平均値・不偏分散を求めるにはどうするか?