No.00878 分散を求める数式について  【かずえ】 2006/08/11(Fri) 10:25

はじめまして。
最近,統計を勉強し始めて疑問に思って調べたり聞いたりしていることがあります。
「分散」を求める数式についてなのですが,観測値から平均値を引いて,そのデータを元にバラツキを調べるのは納得がいくのですが,その時にマイナスを想定して,絶対値ではなく,わざわざ2乗するのはどうしてですか?
いろんな人に聞き,ガウス関数から導き出したのではないかとか,いろいろ聞きましたが,納得のいく回答が得られませんでした。
なぜ,マイナスを消すために,絶対値ではなく,2乗する方法を取るのでしょうか?
どうでもいい質問ですいませんが,気になってしょうがありません。

No.00879 Re: 分散を求める数式について  【コン】 2006/08/11(Fri) 11:13

私は統計学は全く門外漢の文系人間ですが,金融機関でデリバティブ業務に従事しているので,
必要に迫られ て統計を勉強しました。数学がわからないくせに,分からないとこだわってしまうので,かずえさんと同じ点で思考が停止しました。そして,調べまくりまし た。聞きまくりました。幸い,数学科出身者が回りに4人いたので全員に聞いたのですが,そのうち,一人だけが納得の行く回答をしてくれました。
「2乗は微分できるが,絶対値は微分できない。」
2乗して符号を揃えると,その後も数学的に処理が出来ますが,絶対値で処理すると,その後の数学的展開が出来なくなってしまいます。
絶対値の方がバラツキを示すのに単純で分かりやすく良いと思いますが,その後の数学的展開の可能性から,仕方なく2乗を選択した,と言うところだと思います。
次は,標本数Nの時,母平均出すのになぜ,(N−1)で割るのか?
というところで止まってください。(笑)

No.00880 Re: 分散を求める数式について  【かずえ】 2006/08/11(Fri) 12:15

ありがとうございます!!

No.00881 Re: 分散を求める数式について  【かずえ】 2006/08/11(Fri) 13:46

そして,あっという間にN−1で止まりました。
なぜ母集団の分散はNで割るのに,標本の分散はN−1で割るんだろう・・・。
なぞは深まるばかりです(*_*)
ちなみに,先ほどの回答は,積分ではなく微分ですか?どちらにしても,絶対値からの展開は聞いたことがないので,できなそうですね♪

No.00886 Re: 分散を求める数式について  【コン】 2006/08/11(Fri) 17:46

微分にしろ積分にしろ数学的に処理可能か?と言うことだと思います。
すいません。私間違ってました。標本数Nの時,母平均を推定するにはNで割るのに,母分散を推定するにはなぜNー1で割るのか?ですよね。イメージで説明するのと数式で説明するのとあると思いますが,どっちにします?
どっちにしろ長くて分かりにくいですけど…。

No.00906 Re: 分散を求める数式について  【韮澤】 2006/08/16(Wed) 12:02

理系である私は,数式を見て「なるほど」と思って納得するので,お悩みの点が,いま一つ分からないのですが,基本の答えは,

○ 二乗するのは,マイナスを打ち消す為ではなく,バラツキを見る為に,二乗する関数を使うのが良いとの見地から
○ n-1を使うのは,抜取りで検査をする時に,nを使うよりn-1を使うのが良いとの見地から

それぞれの見地は,ちとやっかいな数式に基づきますが,統計の本には書いてあるはずです。

理系である私と同じ様には納得いかないかも知れませんが,私の知る範囲では,以下の本が,一番分かりやすく納得のいく本でした。「統計を作った人達」という感じの説明を含みますので,単に数式を見るよりは,納得いくのではないかと思います。ご参考に。

蓑谷 千鳳彦「推定統計のはなし」 東京図書

No.00987 Re: 分散を求める数式について  【かずえ】 2006/08/28(Mon) 11:24

お返事をありがとうございますm(_ _)m
2週間ほど,研修で不在にしておりお返事が遅れました。

コンさま,説明していただけるのでしたら,どちらの説明も大変興味があります。
韮澤さま,本をすすめていただいてありがとうございました。バラツキを見る際に,絶対値ではなく,2乗してルートを取った値の方が数値が小さくなることまでは分かりました。

ところで,研修の先生(残留農薬の精度管理の専門家@ハンガリー人)に,同じ質問をしたところ,
分散を2乗する疑問については「Only the variation(分散)is additive.」
と言われました。とても謎です。
N−1については,sample populationは最後の一つは確定できるからという理由でした。なので,検量線などの直線の自由度はN−2になるそうです。
平均値を求める際に,最後の一つは確定できる,直線を求める際に2点は確定するという理由は理解できますが,そうすると,そもそも自由度とは何なのかが分からなくなってきます。英語ではdegree of freedomだそうですが,全然意味が分かりません。
平均化するための何かだとは思うのですが・・・。
統計は本当に謎ですが,オススメいただいた本を探してみます!(>_<)!

● 「統計学関連なんでもあり」の過去ログ--- 039 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る