No.04374 平均値に標準偏差を追加したグラフについて  【M】 2007/09/20(Thu) 17:32

難しい統計の話ではないのですが誰に聞いても明確な答えが返ってこないので教えてください。
仮に生徒11人の筆箱に入っているペンの数を調べると以下のようであったとします。
1,1,15,1,1,2,2,2,3,4,7
合計39本 平均3.5本 標準偏差±4.2
これを棒グラフにしたときにエラーバーの範囲が0以下に入ってしまいます。
68.27パーセントのが平均±標準偏差に入るといいますがマイナスに入ることは
ペンの数なので不自然だと思います。このような場合エラーバーを正の数の範囲だけ表示すればよいのでしょうか,そのまま表示するのが良いのでしょうか?

No.04375 Re: 平均値に標準偏差を追加したグラフについて  【青木繁伸】 2007/09/20(Thu) 18:24

エラーバーの意味を考えればよいことです
そして,そもそもエラーバーが定義された意味をもつのは,データがどのような分布であるときのことかということです。

与えられたデータは,正規分布に従っていないということが,そもそもの原因なのです。
正 規分布に従っていれば,平均値±1標準偏差にデータの68.27%が収まるだろうというわけです。元のデータが正規分布に従っていないならそんなことはい えません。たとえば,100個のデータ中,99個が50という値,1個だけ100という値を取るようなデータは明らかに正規分布ではない。平均値は (99*50+1*100)/100=50.5,標準偏差は5ですね。平均±標準偏差は45.5〜55.5ですね。その範囲には99個の50というデータ が入っています。つまりこの場合は平均値±標準偏差の範囲には99%のデータが含まれるということです。分布が正規分布じゃないので理論に合わなくて当然 ですね。

正規分布じゃないデータにおいては,エラーバーには意味がないということです。

No.04376 Re: 平均値に標準偏差を追加したグラフについて  【M】 2007/09/20(Thu) 19:16

青木先生
分りやすい説明ありがとうございました。正規分布のデータでないと使う意味がないのですね。筆箱 に入っているペンの数を複数のクラスで集計すると約5本くらいを平均に正規分布しました。しかし,1クラスだけ色ペンを揃えることが流行しているらしく, 大きくばらついていたのを表現したかったのです。頻度分布図を書くよりエラーバーでばらつきをグラフに表現した方が簡潔だと思ったのですが,他に良い表現 はあるのでしょうか?

No.04377 Re: 平均値に標準偏差を追加したグラフについて  【青木繁伸】 2007/09/20(Thu) 19:23

boxplot(箱髭図)を書けばよいです。
boxplot は平均値や標準偏差を使いません。データの分布状況が一目で分かります。
髭がマイナス領域に入り込んだりしません。

頻度分布図もよいですが,例数が少ない場合には,データそのものの分布が読み取れるグラフがよいでしょう。
http://aoki2.si.gunma-u.ac.jp/R/dot_plot.html
にあるような図も参考までに。

No.04378 Re: 平均値に標準偏差を追加したグラフについて  【M】 2007/09/20(Thu) 19:41

箱髭図
http://aoki2.si.gunma-u.ac.jp/lecture/Dosuu/box-and-whisker.html
こちらも青木先生が分り易く解説されていて助かりました。
群別データ分布図は初めて知りました。これから使ってみようと思います。
問題が解決できてすっきりしました。本当にありがとうございます。

● 「統計学関連なんでもあり」の過去ログ--- 040 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る