箱髭図     Last modified: Jun 01, 2006

 Tukey の箱髭図}は,図 1 のようなものである。

figure

図 1.箱髭図の例

箱髭図は以下のようにして描かれる。

  1. 長方形の下側の辺は第1四分位数,上側の辺は第3四分位数である。
  2. 長方形の中央の線は中央値である。
  3. 長方形の下側の辺から伸びる点線の先端は,実際に存在するデータで「第1四分位数-1.5×IQR」より大きいデータ点である。
  4. 長方形の上側の辺から伸びる点線の先端は,実際に存在するデータで「第3四分位数+1.5×IQR」より小さいデータ点である。
  5. 「第1四分位数-1.5IQR」より小さいデータ点と,「第3四分位数+1.5IQR」より大きいデータは外れ値として 1 個ずつ記号で表示される。
注1: IQR とは,四分範囲のことである。
IQR = 第3四分位数-第1四分位数
注2: 長方形を平均値±標準偏差で描いたり,髭を最大値・最小値まで伸ばすという図が描かれる場合があるが,本来の箱髭図と混乱するので避ける方がよい。
注3: データの分布をより詳しく表示するにはいくつかの方法がある。

以下の 21 個のデータがある。これを箱髭図で表現してみよう。
59, 64, 41, 44, 58, 34, 63, 68, 51, 38, 66, 65, 41, 46, 61, 32, 54, 45, 67, 62, 100

  1. まず,小さい順に並べ,最小値,第1四分位数,中央値,第3四分位数,最大値の 5 つの要約値を求める
    32, 34, 38, 41, 41, 44, 45, 46, 51, 54, 58, 59, 61, 62, 63, 64, 65, 66, 67, 68, 100
  2. 最小値=32,第1四分位数=44,中央値=58,第3四分位数=64,最大値=100
  3. 四分範囲(IQR)=64-44=20
  4. 上側の髭は,実際に存在するデータ値で,64+1.5×20=94 より小さいもの,ということで 68
  5. 下側の髭は,実際に存在するデータ値で,44-1.5×20=14 より大きいもの,ということで 32
  6. 64+1.5×20=94 より大きいもの,44-1.5×20=14 より小さいものは 100 というデータ値 1 個である

注:R の fivenum 関数と quantile 関数は同じ 5 数要約値を返すが,定義が若干異なっており(quantile 関数は 9 通りものアルゴリズムをサポートしている),第1四分位数・第3四分位数については場合によっては両者の結果は一致しない。

figure

図 2.箱髭図


演習問題

 「表 1 のデータを箱髭図で表しなさい。」

表 1.箱髭図を描くデータ
0.84 1.05 1.13 1.26 1.54
0.86 1.05 1.14 1.26 1.57
0.90 1.06 1.16 1.28 1.62
0.92 1.06 1.17 1.33 1.66
0.93 1.07 1.18 1.35 1.74
0.98 1.08 1.19 1.35 1.87
1.01 1.09 1.20 1.35 2.00
1.02 1.10 1.22 1.39
1.03 1.12 1.23 1.42
1.04 1.13 1.24 1.46


問題1 中央値を求めなさい。答えを解答欄に記入し,送信ボタンをクリックしなさい。

解答欄:    

問題2 第 1 四分位数を求めなさい。答えを解答欄に記入し,送信ボタンをクリックしなさい。

解答欄:    

問題3 第 3 四分位数を求めなさい。答えを解答欄に記入し,送信ボタンをクリックしなさい。

解答欄:    

問題4 箱髭図を描きなさい。

R による解答


応用問題


・ 直前のページへ戻る  ・ E-mail to Shigenobu AOKI