No.07289 学校の課題  【Riko】 2008/08/05(Tue) 08:36

1,変動係数の単位は,SDを平均で割ったものですから,単位はないですよね?

2, 100 120 120 130 140 170 180 210 220 250 300 450
の幹葉図を作ってみたんですが,これでいいんでしょうか?
1.00 20 20 30 40
1,70 80
2.10 20
2,50
3.00
4,50

. :00,10,20,30,40
, :50,70,80(←本当は×なのですが,小さい×がないので・・・)

3,身近なデータの中で,平均値の誤用例を挙げろと言われたら,
・データの中に,離れ値が含まれている場合。
・データの中に,とび離れ値が含まれている場合。
でいいんでしょうか?

No.07290 Re: 学校の課題  【青木繁伸】 2008/08/05(Tue) 10:41

1. その通り
2. leaf は1個の数字です
3. 離れ値と飛び離れ値の違いは何?
分布の位置を表す統計量として,平均値の他に何があるか,それらはどういう特徴があるかを考えれば他の例も思い浮かぶはず

No.07291 Re: 学校の課題  【Riko】 2008/08/05(Tue) 11:48

お返事ありがとうございました。

2,管理人様のアドバイスを参考に書き直しました。
  これでいいんでしょうか?
1.02234
1,78
2.12
2,5
3.0
4,5

. :0,1,2,3,4
, :5,7,8(←本当は×なのですが,小さい×がないので・・・)

1の位がすべて0のときは,0を省略してもいいのでしょうか?

3,平均値のほかには,分布の位置を表す統計量としては,中央値,モードでしょうか?
  中央値は,測定値を小さい順に並べたときの,真ん中の値,モードは度数が最も多い値ですよね?そこまではわかりますが,その後が思いつきません・・・

No.07292 Re: 学校の課題  【青木繁伸】 2008/08/05(Tue) 13:24

> . :0,1,2,3,4
> , :5,7,8(←本当は×なのですが,小さい×がないので・・・)

これは,広く行われている慣例的なものはないので任意です
ただし,leaf のない stem もちゃんと描かないと分布を正確に表すことができませんから注意。
> x
[1] 100 120 120 130 140 170 180 210 220 250 300 450
> stem(x)

The decimal point is 2 digit(s) to the right of the |

1 | 0223478
2 | 125
3 | 0
4 | 5

> stem(x, 2)

The decimal point is 2 digit(s) to the right of the |

1 | 02234
1 | 78
2 | 12
2 | 5
3 | 0
3 |
4 |
4 | 5
> 1の位がすべて0のときは,0を省略してもいいのでしょうか?

0 を省略したら,データがあることがわからなくなりますよね

3. 世帯の貯蓄額についてヒストグラムを描き(探し),平均値,中央値,最頻値(モード)を調べてみてください。

No.07293 Re: 学校の課題  【Riko】 2008/08/05(Tue) 13:29

2,管理人様のアドバイスを参考に書き直しました。
  これでいいんでしょうか?
1.02234
1,78
2.12
2,5
3.0
4,5

. :00,10,20,30,40
, :50,80,70,80,90(←本当は×なのですが,小さい×がないので・・・)

1の位がすべて0のときは,0を省略してはいけないということですか?

3,http://www.maznami.biz/images/4z5_1.gifを見てみました。
平均値が中央値よりも大きく,平均値がモードよりも大きく,
中央値がモードよりも大きいことがわかりました。

No.07294 Re: 学校の課題  【青木繁伸】 2008/08/05(Tue) 13:53

> これでいいんでしょうか?

だめですよ。「leaf のない stem もちゃんと描かないと分布を正確に表すことができませんから注意。」って,書いておいたでしょう?2つめの例が貴方が描くべきもの。そこで
  3 | 0
3 |
4 |
4 | 5
となっているでしょう?

> 1の位がすべて0のときは,0を省略してはいけないということですか?

これも,書いたし,例を見ればわかるはず。1.02234 と 1.2234 は違うでしょう?
それとも貴方は別のことを言っているのかな?
. :00,10,20,30,40
, :50,80,70,80,90(←本当は×なのですが,小さい×がないので・・・)
という凡例(?)がヘン!

> 平均値が中央値よりも大きく,平均値がモードよりも大きく,中央値がモードよりも大きいことがわかりました。

で,問題点もわかりましたよね。

No.07295 Re: 学校の課題  【Riko】 2008/08/05(Tue) 14:22

2,管理人様のアドバイスを参考に書き直しました。
  これでいいんでしょうか?
1.02234
1,78
2.12
2,5
3.0
3,
4.
4,5

「. :00,10,20,30,40
 , :50,80,70,80,90(←本当は×なのですが,小さい×がないので・・・)

という凡例(?)がヘン!」というお返事がありましたが,このような記述自体をしないほうがよいのでしょうか?

3,「平均値が中央値よりも大きく,平均値がモードよりも大きく,中央値がモードよりも大きいこと」から,問題点がわかりません・・・ 外れ値がある場合,平均値が中央値,モードより大きくなるということでしょうか?

No.07296 Re: 学校の課題  【青木繁伸】 2008/08/05(Tue) 14:58

> このような記述自体をしないほうがよいのでしょうか?

何のための,何を表す凡例かわからない
 , :50,80,70,80,90 は
 , :50,60,70,80,90 の間違いかな?
そうすると,元のようなデータのときにはいいけど,小数点以下何桁もあるデータについて凡例を付けるのはやっかいなことになりますね。
例:100.1231 120.311 120.1435 130.543 140.434 170.978 180.153 210.352 220.542 250.524 300.5435261 450.5342534 588.82728273635267
そんなことしなくても,. の後には0〜4の数値,,の後には 5〜9 の数値が来るのは,わかりますよね。

> 外れ値がある場合,平均値が中央値,モードより大きくなるということでしょうか?

まだ問題点を把握できていませんね。
外れ値というのは,どういう定義ですか?
先ほどの貯蓄額のデータではどれが(どの部分が)外れ値ですか?
「日本の世帯で,平均的な貯蓄額は1728万円です」という表現で一般の人が思い浮かべるのは,最頻値ですか?中央値ですか?算術平均値ですか?
「平均より多い人と平均より少ない人は半々だ」と思う人が多いとは思いませんか?

まず考えてから,以下を読むべし
1世帯当たりの平均貯蓄額1681万円

No.07297 Re: 学校の課題  【青木繁伸】 2008/08/05(Tue) 15:05

貴方が繰り返し書いていたこと

> 1の位がすべて0のときは,0を省略してはいけないということですか?

そ の意味するところは,私の言っていた「リーフがなくてもステムは描かなくてはならない」ということと同じことなんですね。つまり,上の例で,ステムが 「3,」や「4.」の*デ*ー*タ*は*な*い*けど,「3,」や「4.」は描かなければならない。つまり「空のデータ」ですね。

そういう状態は,「1の位がすべて0のとき」じゃないでしょう。
正確に表現しないと伝わりません。

No.07300 Re: 学校の課題  【Riko】 2008/08/05(Tue) 15:22

「何のための,何を表す凡例かわからない」
大学(東京理科大学です。)の「統計工学」の授業で,担当教授がこのように記述すると言っていたんですが・・・

「外れ値というのは,どういう定義ですか?」
外れ値とは,分布の中心から極端に外れた値です。

「先ほどの貯蓄額のデータではどれが(どの部分が)外れ値ですか?」
4000万円以上です。

「日本の世帯で,平均的な貯蓄額は1728万円です」という表現で一般の人が思い浮かべるのは,最頻値ですか?中央値ですか?算術平均値ですか?
私としては,算術平均値だと思います。

● 「統計学関連なんでもあり」の過去ログ--- 042 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る