No.06943 関数histogram( )とhist( )の使い分け  【ボラーノ広場】 2008/07/04(Fri) 22:39

いつも掲示板を参考にさせていただいております。
いくつかのヒストグラムを書いて比較する場合,上記の関数の使い分けについて教えていただきたいと思います。
library(lattice) のhistogram( )の場合はY軸が%になり,一方hist()の場合はY軸が頻度(frequency)になります。比較する標本数が異なる場合は,前者を使っています。 これでよろしいのでしょうか?とても不安です。ご教示いただければ幸いです。

No.06944 Re: 関数histogram( )とhist( )の使い分け  【青木繁伸】 2008/07/04(Fri) 23:39

それで良いと思います。
hist には,freq 引数があり,デフォルトが TRUE となっており,縦軸は度数 Frequency ですが,サンプルサイズの違うデータの比較には freq=FALSE にすればよいです。ただ,このとき,縦軸は Density になります。つまり,ヒストグラムの全部の面積が1になるように設定されます。サンプルサイズの違うデータの比較には,縦軸を%にするというのが普通に使 われるので,その点から言えば R の設定はちょっと変わっているなあということになるのでしょう。しかし,MASS ライブラリの truehist のオンラインヘルプを読むと,"This plots a true histogram, a density estimate of total area 1." という記述があるのに気づくでしょう。つまり,hist の freq=FALSE は,ちっとも変じゃないのです。

まあ,理屈はいろいろですが縦軸がパーセントというのは分かりやすいと言えばわかりやすいので,そういう意味で lattice の histogram を使うというのは,妥当な選択でしょう。

No.06945 Re: 関数histogram( )とhist( )の使い分け  【ボラーノ広場】 2008/07/05(Sat) 08:54

青木様 わかりやすい説明ありがとうございました。
不安が解消しました。
もう一つ質問させてください。いくつかのヒストグラムを重ねて
同じ階級で描く方法を教えていただけないでしょうか?
よろしくお願いいたします。

No.06951 Re: 関数histogram( )とhist( )の使い分け  【青木繁伸】 2008/07/06(Sun) 20:50

example(barplot) を検証してご覧になれば?

● 「統計学関連なんでもあり」の過去ログ--- 041 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る