No.16784 よろしくお願い致します  【きのこ】 2012/04/18(Wed) 19:34

初めまして。
統計学のみならず,数学の初心者であります。。
先日,大学で統計学の授業があったのですが,体調不良で欠席してしまいました。
初日の遅れを取り戻そうと,配られたレジュメの練習問題にチャレンジしようとしたところ,以下の問題が全く分かりませんでした。先生の解説は授業中に終えてしまっていて完全にお手上げ状態です。
どなたかご教授頂けませんでしょうか。

以下の分布を用い,各問に答えよ

区間中央値   50  150  250  350  450  550  650  750  850  950
頻度    6.6% 12.7% 13.9% 13.3% 10.0% 8.9% 7.1% 6.2% 5.1% 3.9%
区間中央値  1050  1150  1250  1350  1450  1550  1650  1750  1850  1950  2050
頻度    3.0% 2.1% 1.7% 1.3% 0.9% 0.9% 0.5% 0.4% 0.2% 0.2% 1.2%

1・平均値・中央値・最頻値・標準偏差・2σ区間を求めよ
2・平均より値の大きい者の割合を%で答えよ
3・2σ区間に入る者の割合を%で答えよ

インターネットで調べたところ,統計学には標本の存在が欠かせないと知りました。しかし,こちらの練習問題には標本の情報が無く,『区間中央値』と『頻度』の値しかありません。
この『区間中央値』と『頻度』についても調べてみたのですが,『信頼区間』と『最頻値』についてしかわかりませんでした。
これらの値は一体何を示しているのでしょうか・・・。
添付ファイルは,この問題を記したPDFファイルです。
どうかよろしくお願いいたします。

No.16785 Re: よろしくお願い致します  【きのこ】 2012/04/18(Wed) 19:38

すみません。アップロードが上手くいかなかったので,PNGファイルで再送致します><。


No.16786 Re: よろしくお願い致します  【青木繁伸】 2012/04/18(Wed) 21:59

> 統計学には標本の存在が欠かせないと知りました。しかし,こちらの練習問題には標本の情報が無く,『区間中央値』と『頻度』の値しかありません。

区間中央値というのは,区間の真ん中の値ということです。
たとえば,100から200の区間の真ん中の値は150ですね。
全 部で1001個のデータがあったとすれば(頻度の合計が100.1%になるので),区間100から200に12.7%のデータが含まれるということ は,127個のデータがあるということです。しかし,それらが取る値はわからないので,全部が区間中央値(つまり100から200までの値の平均的な値) を取ると考えようということ。他の区間についても同じ。これで,1001個のデータがそれぞれどのような値を取るかわかったので,平均値,中央値,最頻 値,標準偏差,2σ区間を計算することが出来るでしょう。もっとも,それぞれの定義が分かっていないと,たとえデータの正確な値が分かっていても,計算は 出来ませんね。
「平均より値の大きい者の割合」と「2σ区間に入る者の割合」は,平均値が区間内の値になるので,比例配分しないといけないでしょう。
比例配分ということが面倒なら,127個のデータが100から200までに(100と200は含まない方がよいけど)均等に分布しているというように考えてもよいけど,コンピュータを使わないとかえって面倒かも。

http://aoki2.si.gunma-u.ac.jp/lecture/Univariate/arithmetic-mean.html
http://aoki2.si.gunma-u.ac.jp/lecture/Univariate/u-variance.html
http://aoki2.si.gunma-u.ac.jp/lecture/Univariate/median.html
などを参照すれば少しは参考になるかな。

割合の合計が1000%にならないとか,区間中央値 2050 に対する割合がどうもそれより上の区間全部の和になっているとか,問題がよくないですね。なんで,こんな問題をだすかなあ。
ちゃんと理解が出来ているかどうかをレポートさせるなら,度数分布表じゃなく,30 個程度の生データを分析させる方がよいと思うけどなあ。
もっとも,度数分布表に基づいて計算することを要求しているのなら別だけど,そんなのは,今の世の中では,前近代的なものだねえ。

> アップロードが上手くいかなかったので

上の,「利用上の注意」を読まなかったのですね。はじめて,こういう所を使うに当たっての礼儀ですよ。
そこに書いてあるように,ここでは,PNG ファイルしかアップロードできないのです。

また,上の方に書いてあるように,直接の答えは教えることが出来ませんので,上の程度のヒントに基づき,自分でやってみてください。

No.16794 Re: よろしくお願い致します  【きのこ】 2012/04/19(Thu) 19:23

>>青木先生
ご教授して頂きまして本当にありがとうございます。
大変助かります。青木先生の自習ノートもよく読んで参考にします。
また,「利用上の注意」をよく読んでおらず,大変失礼致しました。以後気を付けたいと思います。。

最後にもう1つだけ質問させて頂きたいのですが,,
? 『頻度』の゛%゛とは,゛度数゛と変換して答えるものなのでしょうか?この問題の算術平均値を求める際,例えば「区間中央値 1450・頻度0.9%」の部分は『1450×0.9』と計算するべきなのでしょうか。そうではなく『1450×9』と計算するべきなのでしょうか。

何度も申し訳ありません。
もし可能でしたらご教授して下さると幸いです。。。

No.16795 Re: よろしくお願い致します  【青木繁伸】 2012/04/19(Thu) 20:36

サンプルサイズをnとすれば,あるカテゴリーのパーセントがpなら,そのカテゴリーの度数はn×(p/100)で しょう。区間中央値をuとすれば,平均は,u×n×p/100の総和をn×p/100の総和で割ればよいでしょう。分子,分母にn/100があるので約分 できる(計算に無関係)ということがわかるでしょう。計算式にそのまま代入するのではなく,意味を考えましょう。

No.16797 Re: よろしくお願い致します  【きのこ】 2012/04/19(Thu) 22:33

>>青木先生
ありがとうございます。
大変参考になります。
統計学の初歩の初歩を丁寧にご教授して下さって,本当に助かりました><。

● 「統計学関連なんでもあり」の過去ログ--- 045 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る