★ 変数の平均の計算法について ★

4567. 変数の平均の計算法について どんぐり 2004/10/11 (月) 15:01
└4568. Re: 変数の平均の計算法について 青木繁伸 2004/10/11 (月) 16:01
 └4599. Re^2: 変数の平均の計算法について どんぐり 2004/10/13 (水) 09:39
  └4613. Re^3: 変数の平均の計算法について 青木繁伸 2004/10/13 (水) 22:25


4567. 変数の平均の計算法について どんぐり  2004/10/11 (月) 15:01
独学しているものです。変数の平均の計り方について質問します。

ある途上国の国勢調査から得られた都市/町レベ ルの人口及び経済社会データを分析しています。この国には1991年現在,約1,400の都市/町が存在し,上は人口1,200万人規模の大都市から,下 は人口2万人程度の町まで人口サイズは大小様々ですが,対数正規分布しています。

各々の都市/町の1961年から1991年の過去30年 間における工業セクター,サービスセクター,etcに従事する労働者数の増加率の平均,そして1961年度及び1991年度における識字率の平均を計算し たいのですが,単純平均にすべきか,加重平均にすべきか迷っています。加重平均にすると,大都市のこれら変数の平均値に対する影響が多大になりますし,単 純平均を採用すると,逆に中小都市の平均値に対する影響が相対的に増します。

こういう場合,平均値ではなく中央値のほうが適切なのかな と思ってみたり,あるいは単純平均と加重平均をたして二で割るのはどうかなどと考えています。ちなみに,各都市/町の工業,サービスセクターの労働者増加 率をそれぞれ分布図で表示してみると,非対称分布していているのがわかる一方で,識字率のそれはほとんど正規分布しているのがわかります。

平均という概念は単純なもので簡単に計算できてしまうと思いがちですが,このケースの場合,考えれば考えるほどどのように算出すればよいのか迷ってしまします。どういう方法が一番適切なのでしょうか。

     [このページのトップへ]


4568. Re: 変数の平均の計算法について 青木繁伸  2004/10/11 (月) 16:01
> 各々の都市/町の1961年から1991年の過去30年間における工業セクター,サービスセクター,etcに従事する労働者数の増加率の平均,

そんなに長い期間の平均値が意味があるかどうか疑問に思います。

> そして1961年度及び1991年度における識字率の平均を計算したいのですが,単純平均にすべきか,加重平均にすべきか迷っています。加重平均にする と,大都市のこれら変数の平均値に対する影響が多大になりますし,単純平均を採用すると,逆に中小都市の平均値に対する影響が相対的に増します。

ある年度において都市・町ごとの統計数値があるんですね。その平均値というか,要するに母数を推定したいのでしょう?だったら,加重平均しかないでしょう。加重平均の意味を考えればわかると思いますが。

> こういう場合,平均値ではなく中央値のほうが適切なのかなと思ってみたり,

都市・町のデータがあって,その中央値を取る(意図しているのは単純中央値でしょうが)のは無意味では(単純平均を取るのが無意味なのと同じ)。

>あるいは単純平均と加重平均をたして二で割るのはどうかなどと考えています。

そんな方法があるのですか。

     [このページのトップへ]


4599. Re^2: 変数の平均の計算法について どんぐり  2004/10/13 (水) 09:39

青木先生,御回答ありがとうございます。

先生の回答を参考にしながら,現在データ分析をすすめているところです。

> >あるいは単純平均と加重平均をたして二で割るのはどうかなどと考えています。

> そんな方法があるのですか。

大都市と中小都市の平均値に対するそれぞれの影響を相殺するために考えついた,苦し紛れの案でした。(学生時代,統計学のコースを一つも取らなかったのは大失敗だったと痛感しています。)


> > 各々の都市/町の1961年から1991年の過去30年間における工業セクター,サービスセクター,etcに従事する労働者数の増加率の平均,

> そんなに長い期間の平均値が意味があるかどうか疑問に思います。

どうして疑問に思われるのか,詳しく説明して頂けないでしょうか?

最 後にもう一つ追加の質問があります。1,400の都市/町をある判定基準を使って,工業都市,流通都市,サービス都市,その他というふうに分類したのです が,それぞれのグループの都市の平均人口を測定したいのですが,この場合,単純平均と中央値のどちらがより適切なのでしょうか?私としては,中央値かなと 思っているのですが。

宜しくお願いします。

     [このページのトップへ]


4613. Re^3: 変数の平均の計算法について 青木繁伸  2004/10/13 (水) 22:25
> > そんなに長い期間の平均値が意味があるかどうか疑問に思います。
>
> どうして疑問に思われるのか,詳しく説明して頂けないでしょうか?

平 均を取るということが意味を持つのは,ある程度同じようなデータである場合ですね。たとえば我が国の何らかの時系列データの平均を取るとしたとき,戦前と 戦後を一緒にして良いかはかなり疑問であり,戦後に限っても,高度経済成長以前,途中,以後,その後,バブル期,バブル崩壊,不況というような時期のデー タをひとまとめに平均を取っていよいものかも疑問でしょう。
その程度のことですので,どんぐりさんのデータがそんなことはないのだというなら,それでいいです。

> 最後にもう一つ追加の質問があります。1,400の都市/町をある判定基準を使って,工業都市,流通都市,サービス都市,その他というふうに分類したので すが,それぞれのグループの都市の平均人口を測定したいのですが,この場合,単純平均と中央値のどちらがより適切なのでしょうか?私としては,中央値かな と思っているのですが。

中央値と平均値の特性を比較して,外れ値に影響されないと言う指標が欲しければ,中央値ということになるでしょう。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 030 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る