No.08510 分布  【kmj】 2008/12/04(Thu) 20:40

一般正規分布 N(μ,σ^2) の値 x を,標準化する場合,z = (x-μ)/σ と計算します。 そこで質問ですが,分布には他にも,カイ2乗分布,F分布がありますが,これらにも同じく「標準化」された分布というものはあるのでしょうか? 

A,B 群において,各被験者ごとにある測定値におけるヒストグラムを作成しました。「A,B両群間に,この測定値の分布のばらつき方が違うか?」を検討するため に,これら各被験者のヒストグラムを「標準化」し,各群ごとに重ね合わせて,比較したいと考えています。しかし,ヒストグラムの形を見ると,正規分布とい うよりは,カイ2乗分布やF分布に近い形をしています。この場合でも,標準正規分布に従うとして,計算してもよいのか,それともほかに計算の仕方があるの か,わからなかったので質問させていただきました。

よろしくお願いいたします。

No.08511 Re: 分布  【青木繁伸】 2008/12/04(Thu) 20:52

正規分布は全部,相似型なのです。
標準化というのは,単に平均値を0,分散を1に線形変換するだけで,正 規分布に特有の変換ではありません。正規分布の場合は,このような「標準化」をすることによって,標準正規分布表を用意しておけば平均値±k・標準偏差に 全体のp%が存在するということを求めることが出来ると言うだけでした。現在は,標準化しないでも,コンピュータを使えばどんな平均値・分散を持つ場合に も,そのような計算は簡単に行うことが出来るので,標準正規分布表などというのもあまり必要ではなくなりましたね。
というか,平均値も分散も違うどんな正規分布でも,標準化したら,どれも同じ標準正規分布になるのですよ。平均値0,分散1で,分布の違いは全くなくなるのです。

なお,どんな分布も,平均値0,分散1に「標準化」することは出来ますが,標準化することによって,得ることは何もないので,そのようなことをしないというだけでしょう。

> 「A,B両群間に,この測定値の分布のばらつき方が違うか?」を検討するために

分 布の違いは,標準化しなくても検討できるでしょう。というか,例えば平均値なら,標準化してしまったら,両方とも平均値0になって,差が無くなってしまい ますし,分散の比較をしたいのなら等分散性の検定をすればよいし,分布の形が違うのなら,分布の差の検定(カイ二乗検定)を行えばよいのです。

あなたが定義する「分布のバラツキ方」というのが,何を示しているのかがわからないからなのですが。

> 正規分布というよりは,カイ2乗分布やF分布に近い形をしています。この場合でも,標準正規分布に従うとして,計算してもよいのか

「カイ2乗分布やF分布に近い分布を,標準正規分布に従うとして」といって,何を比較するのでしょうか?よくわかりません。

No.08512 Re: 分布  【kmj】 2008/12/04(Thu) 21:10

青木先生,さっそくご回答いただきましてありがとうございます。

もう少し具体的に説明させていただくと次のようなことです。
コ ントロール群と低血液量群において,それぞれ被験者に暑熱負荷を加え,体温を上昇させました。体温の上昇とともに,両群ともに発汗神経活動が更新しまし た。しかし,神経活動発火バーストの振幅(高さ)の平均値には,両群間で差がありませんでした。 これであきらめきれずに,今度は振幅の分布を調べてみる ことにしました。平均値には差がないけれど,「コントロール群において,低血液量群に比べて,振幅の大きいバーストの数が多い」ということが示せないか, 考えています。 直感的に,この分布が標準化できれば,調べやすいのではないかと思い,質問させていただきました。

ご回答いただけると幸いです。

No.08513 Re: 分布  【青木繁伸】 2008/12/04(Thu) 21:15

「「コントロール群において,低血液量群に比べて,振幅の大きいバーストの数が多い」ということが示せないか」分野の専門用語が入っていて,分野外の私には分からないのですが。

「振幅の大きいバーストの数」って,その分野の話ではなく,単にデータという観点からは何を表しているのでしょうか。「平均値は同じだが,分散が違う」ということを言っているのですか?
だったら,等分散かどうかの検定をすればよいだけではないでしょうか?

No.08514 Re: 分布  【kmj】 2008/12/04(Thu) 21:53

大変失礼いたしました。

A,B群で,神経活動に差があるか否かを検討します。神経活動を比べるときは,通常,その発生頻度(F)と,一つ一つの活動の大きさ(Amp)を比べます。さらに複雑なことに,神経活動には3つの成分が混ざっている可能性があります。

方法としては,
#1.F, Ampの平均値を比べる。
→ 結果: ともに有意差なし。

#2.各被験者ごとに Amp の標準偏差を求めて,統計を行う。
→ 結果: 有意差あり。

そ こで,神経活動に含まれる3成分の比率に違いがあるのではないか,と考えました。しかし,この3成分を区別するすべは今のところありません。そこで, Ampの分布に違いはないか検討することにしました。 例えば,単純化して,Ampには,大・中・小の3成分が含まれていると仮定するとき,「A群ではB 群に比べて,大きいAmpの比率がが大きい」ということがいえないかどうか?

等分散の検定,カイ2乗検定以外にも,さまざまな方法を試したいので,標準化の方法など,ご教授いただけると幸いです。

ちなみに,カイ2乗検定は,「母分散に対して,ある標本の分散が違うかどうか」という検定だと思いますが,今回のような,2群の比較にも使えるのでしょうか?

No.08515 Re: 分布  【青木繁伸】 2008/12/04(Thu) 22:01

> カイ2乗検定は,「母分散に対して,ある標本の分散が違うかどうか」という検定だと思いますが

仰る検定は「母分散の検定」です。
http://aoki2.si.gunma-u.ac.jp/lecture/Average/bobunsan.html

カ イ二乗分布を使う検定をなんでもかんでも「カイ二乗分布」と呼ぶと,このような曖昧な自体が生じます。t分布を使う検定を「t検定」と呼んでも,平均値の 差の検定も,相関係数の検定も,偏回帰係数の検定も,そのほかも,色々な検定があるのです。同じようなことが「F検定」とか「分散比の検定」とかにも言え ます。何の分散を取るかによって(対象によって)別物なんですよねえ。

> 2群の比較にも使えるのでしょうか?

分布の差の検定にもカイ二乗分布を使うものがあるということです。
http://aoki2.si.gunma-u.ac.jp/lecture/Cross/differenceofdist.html

No.08520 Re: 分布  【kmj】 2008/12/05(Fri) 09:57

ご回答いただきまして,ありがとうございました。

「分布の差の検定にもカイ二乗分布を使うものが あるということです」ということで,ご紹介いただいたサイトを見させていただきました。カイ2乗の計算式が載っています。これを見ると,(Oij- Eij)^2/Eij のように,期待値で割っていますが,期待値がゼロの場合はどうするのでしょうか? 期待値がゼロにならないということが,前提なのでしょうか?

あともう一つお聞きしたいことは,一番最初にご回答いただいた中に,「正規分布は全部,相似型なのです。」とありましたが,その意味を具体的に教えていただけると幸いです。そうだとすると何なのか,何ができて何ができないのか,というようなことです。

お忙しいところを大変申し訳ございませんが,よろしくお願いいたします。

No.08521 Re: 分布  【青木繁伸】 2008/12/05(Fri) 10:38

> (Oij-Eij)^2/Eij のように,期待値で割っていますが,期待値がゼロの場合はどうするのでしょうか? 期待値がゼロにならないということが,前提なのでしょうか?

期待値が0になることは,ありません。
も し,その分割表の周辺和(行和,または,列和)が0になることがあるじゃないか,そういう場合には期待値だって0になるじゃないかとお思いでしょうが,そ もそもそういう行とか列は分割表に含めてはいけません(だって,自由度がいくつにだって調整できてしまうじゃないですか)。

> 「正規分布は全部,相似型なのです。」とありましたが,その意味を具体的に教えていただけると幸いです。

標 準化というのは,平行移動(平均値が0になるように)とスケール変更(標準偏差が1になるように)ということですよ。これをしたら,どんな正規分布でも標 準正規分布になるということですね。あなたが最初に書いた正規分布以外は,平行移動とスケール変更してもある一つの分布になるということはないのです。

> そうだとすると何なのか,何ができて何ができないのか,というようなことです。

と いうわけで,例えばある試験を2群に行ったとき,得点分布は両群とも正規分布に従った,しかし,平均値も分散も有意な差があったというとき,試験成績を各 群で標準化して,そのあとに,二群の平均値や分散の検定をしても,差はないということになりますよね。だって,両群とも平均値0,分散1なのですから。
「い やいや,二群を一緒にして正規化するんですよ」ということかもしれないですが,それは,試験の成績を両群同時に平行移動してスケール変更するわけですか ら,両群の相対的な位置関係と分布には何の影響もないわけです。もし影響があるとしたら,困ったことになりますよ。両群同時の平行移動とスケール変更はた とえば温度を摂氏で測っていたものを華氏で測るようにすること,摂氏で測っていたときには有意差はなかったけど華氏で測ったら有意差が出るようになったな んてことがあったら大変です(いや,便利かもしれない。だって,恣意的に平行移動とスケール変更したら,有意だろうと有意でなかろうとどんな結果だって出 せることになってしまうのだから)。

No.08523 Re: 分布  【kmj】 2008/12/05(Fri) 11:22

先生ありがとうございます。

> 期待値が0になることは,ありません。
もし,その分割表の周辺和(行和,または,列和)が0になることがあるじゃないか,そういう場合には期待値だって0になるじゃないかとお思いでしょうが,そもそもそういう行とか列は分割表に含めてはいけません

ということですが,それでは,ゼロの項が含まれてしまった場合に,その項を省いて,分割表を作り,自由度や期待値を求め,カイ2乗を計算してもよいのでしょうか? それとも,ゼロが含まれる時点で,カイ2乗を計算してはならないのでしょうか?

もう一つの質問についてですが,恥ずかしながら,先生のご説明により,私が解析を進めていく中で,データを標準化することが意味のないことであることをやっと認識することができました。 他力本願で本当に申し訳なく思います。  

No.08525 Re: 分布  【青木繁伸】 2008/12/05(Fri) 12:15

> それでは,ゼロの項が含まれてしまった場合に,その項を省いて,分割表を作り,自由度や期待値を求め,カイ2乗を計算してもよいのでしょうか?

測定値が0のものを除くのではないです。
分割表を作って,その列和(行和)が0の列(行)は省くということです。
例えば以下のような集計表で40〜49の列は省かないといけないということに過ぎません。
列和,行和が0になる行がないかぎり,期待値は0にはなりません。従って,カイ二乗統計量を計算するときに分母が0になることはありません。
測定値 0~9 10~19 20~29 30~39 40~49  合計
A群  ○○  ○○  ○○  ○○  0 ○○
B群  ○○  ○○  ○○  ○○  0 ○○
合計  ○○  ○○  ○○  ○○  0 ○○

No.08526 Re: 分布  【kmj】 2008/12/05(Fri) 12:21

青木先生,丁寧なご説明ありがとうございました。
納得できました。

● 「統計学関連なんでもあり」の過去ログ--- 042 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る