No.08669 データの表現について  【グラフ】 2008/12/18(Thu) 14:41

こんにちわ。グラフ作成に関して教えていただきたく,投稿いたしました。

現在,♂♀交代でヒナの世話をするスズメ類が,どのように交代するかを見ています(n = 15)。
約2〜3時間おきに交代するのですが,途中ペアの一羽に目印に足環をつけたため,その鳥は途中で巣を離れてしまい,その後パートナーが戻るまでは空白の時間ができました。
そこで,この足環の影響を目で見てわかるグラフしたいのですが,どのような方法がわかりやすいでしょうか?
見せたいのは,「A: 足環を着けた直後のパートナーの巣内滞在時間と,B: それを除いた全体の巣内滞在時間の比較」です。2つの平均の比較の検定では,有意な差はありませんでしたが,95%信頼区間は,A: 2.61~2.9,B: 2.3~2.60と異なりました。

データ(単位は時間)
A: 3 3 3 3 3 2 3 1 4
B: 2 3 2 2 2 2 1 3 3 2 2 4 1 1 1 2 2 2・・・

どのようなアドバイスでもいただけたらとてもありがたく思います。
また,統計ソフトはRしか持っていませんので(初心者ですが),Rでできる作図の範囲でご教授いただけたらなお助かります。
どうぞよろしくお願いいたします。

No.08671 Re: データの表現について  【青木繁伸】 2008/12/18(Thu) 15:01

要するに A と B のような2種類のデータがあって,それを表示すればよいのですか?

単純には,plot 関数で描く(しかし,測定値が整数値なので,データ点が重なってしまい,情けないグラフになるので,なんとかなりませんか。。。ということかな?)

http://aoki2.si.gunma-u.ac.jp/R/dot_plot.html
のようなものを描くとか?でも,測定値が整数値なので,すかすかなグラフになってしまうのは,避けられませんね。

データの詳細はわからないけど,boxplot で描くとか。

No.08673 Re: データの表現について  【ぐらふ】 2008/12/18(Thu) 15:37

青木さま,みなさま

ご返信をいただきありがとうございます。
サンプル数が異なるため(10と50),どのようなグラフを書いてもイマイチわかりずらくなっています。
測定値が整数の場合,わかりやすいのが描けなくても仕方ないのですね。

そして,群別の作図関数をご紹介いただきありがとうございます。
私の今回のデータではあまりフィットしませんでしたが(どちらも頻度1−4なためとサンプルサイズが異なるため),今後使ってみたいと思います。

まずは,ご回答いただいたお礼まで。
ありがとうございます。

No.08674 Re: データの表現について  【にゃんちゅう】 2008/12/18(Thu) 16:06

単純に考えればboxplot じゃないですか。

http://www.okada.jp.org/RWiki/?%A5%B0%A5%E9%A5%D5%A5%A3%A5%C3%A5%AF%A5%B9%BB%B2%B9%CD%BC%C2%CE%E3%BD%B8%A1%A7%C8%A2%B7%BF%BF%DE
に例があります。途中できれそうだから,
google でboxplot を検索してください。

No.08687 Re: データの表現について  【ぐらふ】 2008/12/19(Fri) 12:24

にゃんちゅうさん,みなさま

ご返信ありがとうございます。

やはりboxplotがいいでしょうか?サンプルサイズがA:10とB:40(範囲:1−4)なのですが,Aは3当たりに集中しています。
そのため,Aはboxにならずに中央値を示す線のみとなっているのです。そして,データ分布範囲が同じため,一見するとデータがどう異なるのかよくわかりません。

このサンプルサイズ問題を克服するために,割合データにすると,分布が異なることが目で見てわかるのですが,できれば比率ではなくそのまま見せられたらと思い,質問させていただきました。
グラフは見易さ優先であれば,比率でもいいと思うのですが,いかがでしょうか?
意見などいただけたら幸いです。お願いします。

No.08688 Re: データの表現について  【青木繁伸】 2008/12/19(Fri) 12:30

> 割合データにすると,分布が異なることが目で見てわかる

何を分母にするんですか?(ついでに,分子も何になるんですか?)

No.08690 Re: データの表現について  【ぐらふ】 2008/12/19(Fri) 12:44

青木さま,みなさま

ご返信ありがとうございます。

>何を分母にするんですか?(ついでに,分子も何になるんですか?)

データ(単位は時間)
A: 3 3 3 3 3 2 3 1 4 3 (n=10)
B: 2 3 2 2 2 2 1 3 3 2 2 4 1 1 1 2 2 2・・・(n=50)

1 2 3 4
A 1 1 7 1
B 10 18 19 3 (値)
これを元に,それぞれをサンプルサイズ(10,50)で割りました。

1 2 3 4
A 10 10 70 10
B 20 36 38 6 (%)
としました。
これでわかりますでしょうか?

No.08693 Re: データの表現について  【青木繁伸】 2008/12/19(Fri) 13:03

割合にすればわかりやすいというのは賛否両論あると思う。
例で言えば,3のときの70%と38%を比較するとAの方が多いというのは相対的な比較と言うこと。単に数値だけ見ていると,分母が幾つだったか考慮の対象から外れてしまう。
最 初の質問では B のデータの詳細が不明だったので図を呈示しなかったが,参考例で挙げたページ中で定義している dot.plot を使うと添付図のようになる。これだと,データの全体も,違いもわかることはわかる。でも,本質的には,このグラフは,度数分布表を表したものだ(1度数 が,○1個に対応)n度数を○n個ではなく面積nの図形を描いてもよいが。


No.08694 Re: データの表現について  【ぐらふ】 2008/12/19(Fri) 13:18

青木さま,みなさま

賛否両論あるという意見,ありがとうございます。
騙すつもりであったわけではないですが,"自分のストーリーにあった絵"を無意識に見せたいと思っていたことに気づきました(→サンプルサイズが少ないことを補いたい気持ち)。

教えていただいた図の方が,より多い情報量を含んでいて,読み手から正しい判断を引き出せるように思います。なので,こちらを採用したいと思います。
(実は,前回URLから,dot.plotで作成しましたが,ちょっと群間がアンバランスでいやだなーと思いましたが,必要な情報ですよね)。

勉強になりました。ありがとうございます。

No.08695 Re: データの表現について  【青木繁伸】 2008/12/19(Fri) 13:40

> ちょっと群間がアンバランスでいやだなーと思いました

では,こういう図ではいかが?面積が度数を表します。


No.08696 Re: データの表現について  【ぐらふ】 2008/12/19(Fri) 14:02

青木さま

こういうグラフもあるんですね。
この図を定義しているページもあるのでしょうか?
Googleで調べてみましたが,すぐにはわかりませんでした。

こちらの図も作ってみたいので,ご紹介いただけたら幸いです。
お願いします。

No.08697 Re: データの表現について  【青木繁伸】 2008/12/19(Fri) 14:15

R の関数を探すとあると思うけど...
さっきちょっとやっつけ仕事的に作ったので,汎用化していない
# http://aoki2.si.gunma-u.ac.jp/R/plot.html の関数を引用するので,準備を

plot.mark <- function(x, xlim=NULL, ylim=NULL, ...)
{
nr <- nrow(x)
nc <- ncol(x)
mx <- sqrt(max(x))/min(nr, nc)*5
if (is.null(xlim)) xlim <- c(-1, nc+1)
if (is.null(ylim)) ylim <- c(-1, nr+1)
plot(c(1, nc), c(1, nr), type="n", xlim=xlim, ylim=ylim, asp=1, axes=FALSE, ...)
axis(1, at=1:4)
axis(2, at=1:2, labels=c("B", "A"))
for (ix in 1:nc) {
for (jy in 1:nr) {
plot.circlef(ix, nr+1-jy, sqrt(x[jy, ix])/mx, col=2, border=2)
}
}
}
x <- matrix(c(1,1,7,1,10,18,19,3),byrow=TRUE,ncol=4)
plot.mark(x, xlim=c(0.5,4.5), ylim=c(0.5,2.5), xlab="hour", ylab="group")

No.08698 Re: データの表現について  【青木繁伸】 2008/12/19(Fri) 14:20

やはりありますね。
gregmisc の balloonplot
そのほかにも,もっとありそう。。。

No.08699 Re: データの表現について  【ぐらふ】 2008/12/19(Fri) 14:50

ありがとうございます。
参考にさせていただきます。
お手数をおかけしました。

● 「統計学関連なんでもあり」の過去ログ--- 042 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る