★ 標準偏差の式 ★

 204 標準偏差の式  りさ  2001/09/10 (月) 12:06
  219 Re: 標準偏差の式  マスオ  2001/09/12 (水) 19:15
   220 Re^2: 標準偏差の式  りさ@お腹せっぷく  2001/09/12 (水) 23:23
    221 Re^3: 標準偏差の式  マンボウ  2001/09/12 (水) 23:49
     225 Re^4: 標準偏差の式  マスオ  2001/09/13 (木) 13:32
      226 Re^5: 標準偏差の式  青木繁伸  2001/09/13 (木) 15:10
       228 Re^6: 標準偏差の式  マスオ  2001/09/14 (金) 19:49
        231 みなさん,ありがとうございました。  りさ@お腹せっぷく  2001/09/18 (火) 18:40
  208 Re: 標準偏差の式  ひの  2001/09/10 (月) 23:59
   215 ありがとうございます。  りさ  2001/09/12 (水) 17:23
  205 Re: 標準偏差の式  名無しさん  2001/09/10 (月) 13:11
   206 Re^2: 標準偏差の式  りさ@お腹いっぱい  2001/09/10 (月) 15:09
    210 Re^3: 標準偏差の式  DISIR  2001/09/11 (火) 17:06
     216 ありがとうございます。  りさ  2001/09/12 (水) 17:58
      217 Re: ありがとうございます。  名無しさん  2001/09/12 (水) 18:30
       223 Re^2: ありがとうございます。  DISIR  2001/09/13 (木) 10:07
       218 Re^2: ありがとうございます。  りさ@お腹せっぷく  2001/09/12 (水) 19:02
    207 Re^2: の続き  りさ@お腹いっぱい  2001/09/10 (月) 15:10


204. 標準偏差の式  りさ  2001/09/10 (月) 12:06
標準偏差の式について教えていただけないでしょうか?
(式の書き方が悪かったらすみません)
標準偏差 s=root(square(sum(Xi-Xave))/(n-1))
で示されますが,この時,どうして分母の(n-1)にまでルートがかかるのでしょうか?
2乗しているのは(平均-観測値)の部分だと思うのですが。。。
いろいろ本を読んでも「もとの次元に戻すためにルートを取ります」の記述のもとに一括して分母,分子にルートをかけています。

定義だからといわれてしまえばそれまでですが,今ひとつ引っかかっているので,もし理由をご存じの方がいましたらお願いします。

     [このページのトップへ]


219. Re: 標準偏差の式  マスオ  2001/09/12 (水) 19:15
> この時,どうして分母の(n-1)にまでルートがかかるのでしょうか?

皆さんがおっしゃっている事と同じだとは思いますが...

nでなくなぜ n-1で割るのかを別にして,nで考えたらわかりやすいでしょう.偏差平方和は偏差平方を n個加えたものだから,1要素あたりにならすために nで割る.それを次元をもどすために平方に開くと考えればよいのでは?

sum(i=1〜n; xi)/n はセットで考えてください.
分子のみを rootなどで関数変換すると分母 nとの関係が変わってしまいますよね.
(x1+x2+...+xn)/n = x1/n+x2/n+...+xn/n が成り立たなくなる.

後で nで割るとすれば,和をとる前に次元をもどして,
sum(root(square(Xi-Xave)))/n = sum(absolute(Xi-Xave))/n = 偏差絶対値の平均
ということで,標準偏差とは別の,やはり nによらないばらつきの指標の統計量がでます.

問題の root(sum(square(Xi-Xave)))/(n-1) sum()/(n-1) をくくれば
root([sum(square(Xi-Xave))/(n-1)]/(n-1)) ということになってしまいます.

ところでこれは標準誤差とほぼ同じものですね.これは偶然でしょうか?どなたか説明がつきますか?

     [このページのトップへ]


220. Re^2: 標準偏差の式  りさ@お腹せっぷく  2001/09/12 (水) 23:23
マスオ様

> 皆さんがおっしゃっている事と同じだとは思いますが...

名無しさんとほぼ同じですね(^_^;
でも,みなさんのいろいろな考え方があって勉強になります。

> sum(i=1〜n; xi)/n はセットで考えてください.

ここが何でセットになるか,分からなかったんですよね。
計算してみたら,当然分母にもルートかけないとおかしいですね。
どうやら私の頭の回路が変な繋がり方をしていたみたいです。

> 標準偏差とは別の,やはり nによらないばらつきの指標の統計量がでます.

これを指標にしてもいいはずですよね。
ただ,めんどいのでやる気はしないですが・・(^_^;
これを元に1から組み立てて行けば,ドクターとれるかな?
(世間に認められるかどうか,実用的かどうかは別として)

> ところでこれは標準誤差とほぼ同じものですね.これは偶然でしょうか?どなたか説明がつきますか?

ほぼというか,全く同じですよね。
SE=SD/root(n)
う〜ん。不思議。

     [このページのトップへ]


221. Re^3: 標準偏差の式  マンボウ  2001/09/12 (水) 23:49
> > 標準偏差とは別の,やはり nによらないばらつきの指標の統計量がでます.
>
> これを指標にしてもいいはずですよね。
> ただ,めんどいのでやる気はしないですが・・(^_^;
> これを元に1から組み立てて行けば,ドクターとれるかな?
> (世間に認められるかどうか,実用的かどうかは別として)

洒落ですか??
それって,平均偏差でしょ?
昔からあるし,役に立たないのも実証済みです。

     [このページのトップへ]


225. Re^4: 標準偏差の式  マスオ  2001/09/13 (木) 13:32
マンボウ様,サポありがとうございます.

> それって,平均偏差でしょ?
> 昔からあるし,役に立たないのも実証済みです。

どおりで定義は見たことがあるものの,それ以上のことは見かけないわけですね.
「統計学的には扱いが難しいのであまり使われることはない。」 (http://aoki2.si.gunma-u.ac.jp/lecture/Univariate/mean-dev.html)
とは聞いていましたが,実証済みとは知りませんでした.どこがまずいんでしょうか.主な理由をひとこと教えていただけるとうれしいです.割とよくヒトから聞かれるのですが,「扱いが難しいらしい」としか答えられないのです.

     [このページのトップへ]


226. Re^5: 標準偏差の式  青木繁伸  2001/09/13 (木) 15:10
> 「統計学的には扱いが難しいのであまり使われることはない。」
> (http://aoki2.si.gunma-u.ac.jp/lecture/Univariate/mean-dev.html)

の意図はですね,「たとえば,微分するのも面倒だ」ということです。

     [このページのトップへ]


228. Re^6: 標準偏差の式  マスオ  2001/09/14 (金) 19:49
青木先生

> > 「統計学的には扱いが難しいのであまり使われることはない。」
> の意図はですね,「たとえば,微分するのも面倒だ」ということです。

青木先生にご足労いただき申し訳ありません.
「平均偏差」で過去ログを検索した時には引っかからなかったので見逃していました.kyarakoさんとのスレッドが他にもいろいろあったのですね.

ご挨拶が遅れましたが,しばらく前にこちらへたどり着き,勉強させていただいていました.
一応目を通してからと思っていたのですが,何せこのサイトは広いので,まだまだ見落としが多いようです.
このようなサイトをありがとうございます.これからもよろしくお願いします.

マンボウ様

マンボウさんのスレッドも見つけました.実証済みとは,「経験的実証」済みということですね.

りさ様

皆さん総出で教えていただきましたね.これからも頑張って勉強しましょう.

     [このページのトップへ]


231. みなさん,ありがとうございました。  りさ@お腹せっぷく  2001/09/18 (火) 18:40
つまらない質問にみなさんで答えていただきありがとうございました。

> りさ様
>
> 皆さん総出で教えていただきましたね.これからも頑張って勉強しましょう.

マスオ様

ですね(^_^;
がんばって勉強していきます。

     [このページのトップへ]


208. Re: 標準偏差の式  ひの  2001/09/10 (月) 23:59
> 2乗しているのは(平均-観測値)の部分だと思うのですが。。。
> いろいろ本を読んでも「もとの次元に戻すためにルートを取ります」の記述のもとに一括して分母,分子にルートをかけています。

実際に計算してみると分かりますが,分子だけ平方根をとると,分母の値は標本サイズに比例し,分子の値は標本サイズの平方根に比例します。このため標準偏差が標本サイズの平方根に反比例することになります。標準偏差がばらつきの程度を表わす指数であるためには,標本サイズに依存しない値である必要がありますからこれではマズイことがわかるでしょう。

     [このページのトップへ]


215. ありがとうございます。  りさ  2001/09/12 (水) 17:23
ひの様

ご指摘の通り計算してみました。データとして「1,5」と「1,1,1,5,5,5」として計算した(分母は「n」で)ところ,
全体の平方根を取った場合,両方のペア共に「2」(root(8/2)とroot(24/6))
分母のみ平方根の場合は前者が「1.44」,後者が「0.816」(root(8)/2とroot(24)/6))
でした。確かに,サンプル数が増えるほどSDがちっちゃくなっちゃいますね(^_^;

やっと疑問が解けた気がします。
ひの様の御回答をもう一度,今度は式で整理したいと思います。
ありがとうございました。

     [このページのトップへ]


205. Re: 標準偏差の式  名無しさん  2001/09/10 (月) 13:11
> 標準偏差 s=root(square(sum(Xi-Xave))/(n-1))
 標準偏差 s=root(sum(square(Xi-Xave))/(n-1))
でしょう。この違いは単なる間違いですか。

観測値から平均値を引いた(偏差)の二乗の平均値が分散ですから,その平方根をとるのは,その全体で分母の n-1 も含めたものでしょう。

この手の疑問は,質問者にとっては重大なのかもしれませんが,説明するのが難しいですね。
定義だから!!で,いいのではないでしょうか?
たとえば,なんで「観測値から平均値を引いた(偏差)の二乗」なの?「観測値から平均値を引いた(偏差)の1.578乗」ではだめなの?という疑問は起こらないですよね。

     [このページのトップへ]


206. Re^2: 標準偏差の式  りさ@お腹いっぱい  2001/09/10 (月) 15:09
早速のお答えありがとうございます。

> > 標準偏差 s=root(square(sum(Xi-Xave))/(n-1))
>  標準偏差 s=root(sum(square(Xi-Xave))/(n-1))
> でしょう。この違いは単なる間違いですか。

ですね。打ち間違えました(^_^;

> 観測値から平均値を引いた(偏差)の二乗の平均値が分散ですから,その平方根をとるのは,その全体で分母の n-1 も含めたものでしょう。

確かに,「生物統計学p.49あたり」でもその表記はありますね。分散の定義は名無しさんの説明で「ああ,なるほど!」とは思うのですが,標準偏差でそのままルートを取るとなると「ん!?」って思っちゃうんですよね。(^_^;

> この手の疑問は,質問者にとっては重大なのかもしれませんが,説明するのが難しいですね。
> 定義だから!!で,いいのではないでしょうか?

ですね。案外,昔の偉い先生が,「いちいち平方根を取る位置を変えるよりも一気に平方根を取ってしまって,それを元に理論?を組み立てていった方が楽だから」とかの理由かもしれませんね。

     [このページのトップへ]


210. Re^3: 標準偏差の式  DISIR  2001/09/11 (火) 17:06
平均偏差(データ)ベクトルをx,xの次数をnとすれば,変数xの分散=1/n×(x,x)です。
標準偏差はその平方根ですから,ルートが全体にかかることは不思議でもなんでもありません。
なお,母集団のパラメータを推定する際はnがn-1になります。
なぜ,2乗するのか納得できないのならば,ピタゴラスの定理を考えればいいのです。
(x,x)の正の平方根はベクトルの長さです。

     [このページのトップへ]


216. ありがとうございます。  りさ  2001/09/12 (水) 17:58
DISIR様

ご回答,ありがとうございます。
ただ,せっかく時間を割いていただいてお答えくださったのに,不才なため理解できませんでした。申し訳ありません。
「平均偏差」と「x,xの次数n」の意味が分かりませんでした。
前者に関してはsokal&rolfの本を見たのですが,それらしき語句を見つけられませんでした。後者に関しては完全な当方の勉強不足だと思います。
今後精進致します。

     [このページのトップへ]


217. Re: ありがとうございます。  名無しさん  2001/09/12 (水) 18:30
> 「平均偏差」と「x,xの次数n」の意味が分かりませんでした。

平均偏差ベクトルをx
xの次数n
と書いてあるのです。

平均偏差とは,個々の測定値から平均値を引いたもの,その値を並べたベクトルが平均偏差ベクトルです。
x の次数とは,ベクトルの要素数ですね。

測定値が1,2,3,4,5 という5個の場合,平均値は3,従って平均偏差ベクトルは
x' = (-2,-1,0,1,2)で,要素数は5です。
通常,ベクトルは列ベクトルを考えるので,上のように行ベクトルで書くときは x' としてベクトル x の転置であるとかきわけるのです。

>変数xの分散=1/n×(x,x)
というのは,正確に書くと 変数xの分散=1/n×(x',x) で,(x',x) はベクトルの内積です。
上の例で言うと,(x',x) = (-2)*(-2)+(-1)*(-1)+0*0+1*1+2*2 で,これは Σ(xi-mean)^2と書くものと同じです。

     [このページのトップへ]


223. Re^2: ありがとうございます。  DISIR  2001/09/13 (木) 10:07
解説していただき恐縮です.....
Σで考えるとイメージが浮かびにくいので,せっかく習った幾何の知識と絡めて眺めた方が見通しはよいのではと思ったのです。x=(3,4)を二次元の直交座標上にとり,原点(0,0)からの距離を求めるのには,どういう計算をするかってことを考えれば,納得されるかなと思ったのです。ベクトルや行列で理解しておけば,2次元も100次元も同じですから...

     [このページのトップへ]


218. Re^2: ありがとうございます。  りさ@お腹せっぷく  2001/09/12 (水) 19:02
名無しさん様

私のようなアホのために,2度も書き込みありがとうございます。

> 平均偏差ベクトルをx
> xの次数n
> と書いてあるのです。

やはりそうでしたか。一瞬そうかなとも思ったのですが・・。
改めて自分の知識のなさに思い知らされました。

以下,詳しい解説ありがとうございます。これでやっと理解できました。(^_^;
「内積」の言葉自体を聞いたのが高校以来とちょっと恥ずかしい限りです。
ベクトルなど,3次以上になると視覚的にかけないのでちょっと理解しにくいのですが,これも慣れなんでしょうね。
がんばってみます。重ね重ねありがとうございました。

※ところで名無しさんはやっぱり「壺」の方なんですか(^_^?

     [このページのトップへ]


207. Re^2: の続き  りさ@お腹いっぱい  2001/09/10 (月) 15:10
続き

> たとえば,なんで「観測値から平均値を引いた(偏差)の二乗」なの?「観測値から平均値を引いた(偏差)の1.578乗」ではだめなの?という疑問は起こらないですよね。

最初のは「サンプルの大きさ(例えば100付近で散らばるか,1000付近で散らばるか)の影響と,合計したときに(-)の値があると0になるから」と言う理由ですよね。何で「2」乗なのかは,「計算しやすいから」位の答えしか出てこないですが・・・。
後者は,やっぱり「そんな計算めんどいじゃん」ってなるんでしょうね。

何となく,疑問が解けたような気がします。ありがとうございました。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 015 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る