度数分布表の階級数,級限界,階級幅を決めるときにはいくつかの注意が必要である。
度数分布図を作成する場合,階級数が大きすぎると不規則な凹凸が生じ,分布の把握に障害が出る。逆に少なすぎても情報量が失われる。
スタージェスは,データの個数を $n$ としたとき,次式による $C$ を階級数とすればよいという目安を与えた。表 1 にケース数が 2 のべき乗のときの値を示す。
級限界(階級の開始値),階級幅は切りのよい数値にしたほうがよい。 \[ C = 1 + \frac{\log n}{\log 2} ≒ 1+3.3\ \log_{10} n \]
ケース数($n$) | 32 | 64 | 128 | 256 | 512 | 1024 | 2048 | 4096 | 8192 |
---|---|---|---|---|---|---|---|---|---|
階級数 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 |