★ Haberman法の標準化残差の「標準化」の意味について ★

639. Haberman法の標準化残差の「標準化」の意味について Koji 2003/09/12 (金) 11:42
└644. Re: Haberman法の標準化残差の「標準化」の意味について 青木繁伸 2003/09/12 (金) 14:16
 └646. Re^2: Haberman法の標準化残差の「標準化」の意味について Koji 2003/09/12 (金) 16:27
  ├648. Re^3: Haberman法の標準化残差の「標準化」の意味について 青木繁伸 2003/09/12 (金) 18:10
  └647. Re^3: Haberman法の標準化残差の「標準化」の意味について 青木繁伸 2003/09/12 (金) 18:10
   └655. Re^4: Haberman法の標準化残差の「標準化」の意味について Koji 2003/09/16 (火) 18:53
    └656. Re^5: Haberman法の標準化残差の「標準化」の意味について 青木繁伸 2003/09/16 (火) 19:45
     └657. Re^6: Haberman法の標準化残差の「標準化」の意味について Koji 2003/09/16 (火) 20:19


639. Haberman法の標準化残差の「標準化」の意味について Koji  2003/09/12 (金) 11:42
はじめまして。
Haberman法で出てくる標準化残差について調べておりまして,
http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc003/223.html
を参考にさせていただきました。ここでは,「標準化された残差が1.96より大きければ,そのセルは有意に大きい。-1.96より小さければ,そのセルは有意に小さい。」と述べられていましたが,
B.S.エヴェリット『質的データの解析』新曜社 3.4.3 残差分析(p49-50)
をあたったところ,2つの疑問点にぶつかりました。

(1)上記記述では,「標準化された残差」→「調整済みの標準化残差」が正しいのではないでしょうか?

(2)そうだとすると,「標準化された残差」の「標準化」の意味はどういうことなのでしょうか?つまり,何をもって「標準化」されているということなのでしょうか?

それから,もう一点,ご意見を伺いたいことがあります。

(3)2つのセルが,調整済みの標準化残差によって,ともに有意に大きい(あるいは,小さい)とされた場合,(例えばP<0.01),その二つの大小関係を比較することに意味はあるのでしょうか?
調整済みの標準化残差は,有意なカイ二乗値をもたらしたカテゴリを特定するために用いられていますが,2変数の各カテゴリ間の結びつきの強さの尺度として用いてしまっても問題はないでしょうか?

よろしくお願いいたします。

     [このページのトップへ]


644. Re: Haberman法の標準化残差の「標準化」の意味について 青木繁伸  2003/09/12 (金) 14:16
> はじめまして。
> Haberman法で出てくる標準化残差について調べておりまして,
> http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc003/223.html
> を参考にさせていただきました。ここでは,「標準化された残差が1.96より大きければ,そのセルは有意に大きい。-1.96より小さければ,そのセルは有意に小さい。」と述べられていましたが,
> B.S.エヴェリット『質的データの解析』新曜社 3.4.3 残差分析(p49-50)
>> (1)上記記述では,「標準化された残差」→「調整済みの標準化残差」が正しいのではないでしょうか?

http://web.uccs.edu/lbecker/SPSS/ctabs1.htm
を参照すると,どちらでも良いということでしょう。

> (2)そうだとすると,「標準化された残差」の「標準化」の意味はどういうことなのでしょうか?つまり,何をもって「標準化」されているということなのでしょうか?

標準化は,平均値からの偏差を標準偏差で割るということでの標準化(標準得点を得る)という意味です。(観察値-期待値)/√期待値は Z 得点。それを二乗すると自由度1のカイ二乗値。

それをさらに (1-ni./N)(1-n.j/N) の平方根で割るのは,「行合計と列合計について【調整】している」のですね。

調整の必要性があるかどうかは,場合によるのかもしれません。
多くの場合は調整してもしなくても,同じような結論になるのかと思います(周辺和がアンバランスだと調整が必要かも)。

> (3)2つのセルが,調整済みの標準化残差によって,ともに有意に大きい(あるいは,小さい)とされた場合,(例えばP<0.01),その二つの大小関係を比較することに意味はあるのでしょうか?

この場合は,P 値は調整済み標準化残差と比例関係になり,調整済み標準化残差は,期待値と観察値の乖離の程度と比例しているので,三段論法で Koji さんのいっていることは正しいでしょう。
(二つの別々の検定の P 値は一比較しても意味がありませんが)

> 調整済みの標準化残差は,有意なカイ二乗値をもたらしたカテゴリを特定するために用いられていますが,2変数の各カテゴリ間の結びつきの強さの尺度として用いてしまっても問題はないでしょうか?

ただ,この Haberman の方法は,検定の多重性という点で私は疑問だと思っています。

     [このページのトップへ]


646. Re^2: Haberman法の標準化残差の「標準化」の意味について Koji  2003/09/12 (金) 16:27
早速の回答,大変ありがとうございました。
> http://web.uccs.edu/lbecker/SPSS/ctabs1.htm
を見てみました。

> 標準化は,平均値からの偏差を標準偏差で割るということでの標準化(標準得点を得る)> という意味です。(観察値-期待値)/√期待値は Z 得点。

おっしゃる標準化の意味はわかるのですが,標準化残差の式では,標準偏差ではなく,√期待値で割ってしまっている点が理解できないのです。

また,上記のサイトでは,(調整前の)標準化残差で平均が0,標準偏差が1と書かれていますが,読んだ本では,調整済みの標準化残差で平均が0,標準偏差が1となっています。
両方とも正しいのでしょうか?

> それをさらに (1-ni./N)(1-n.j/N) の平方根で割るのは,「行合計と列合計について【調整】している」のですね。
>

調整するということの意味もよく理解できません。標準化残差を√分散の推定値(つまり,標準偏差の推定値)で割るということですから,ここで初めて標準化の分母の部分の操作を行なっているようにも思えるのです。

また,分散の推定値が(1-ni./N)(1-n.j/N)になる点についても,読んだ本には解説されていなかったので,理解できていないのです。何か,わかりやすく解説されている文献などご存知でしたら,教えていただけませんでしょうか。

> この場合は,P 値は調整済み標準化残差と比例関係になり,調整済み標準化残差は,期待値と観察値の乖離の程度と比例しているので,三段論法で Koji さんのいっていることは正しいでしょう。
> (二つの別々の検定の P 値は一比較しても意味がありませんが)

申し訳ありません。
私の書き方が紛らわしかったので,誤解を招いてしまったようです。私がお尋ねしたかったのは,P値の比較ではなく,(調整済みの)標準化残差の比較についてなのです。これは,期待値と実測値の乖離の程度を表しているので,2変数の両カテゴリ間の結びつきの強さを表していると見ても問題ないか,ということなのです
例えば,3×2のクロス表(変数1がA, B, C,変数2がX, Yのカテゴリに別れているとします)において,変数1のカテゴリAと変数2のカテゴリYがぶつかるセルの(調整済みの)標準化残差が最大だったら,この表では,AとYの結びつきが最も強いと言ってしまってもよいのでしょうか?

何度も恐縮ですが,何卒よろしくお願いいたします。

     [このページのトップへ]


648. Re^3: Haberman法の標準化残差の「標準化」の意味について 青木繁伸  2003/09/12 (金) 18:10
> 調整するということの意味もよく理解できません。標準化残差を√分散の推定値(つまり,標準偏差の推定値)で割るということですから,ここで初めて標準化の分母の部分の操作を行なっているようにも思えるのです。

残差というのは,「観察値-期待値」で,それを標準偏差で割って,標準化しているのです。
それをさらに,行和・列和で調整しているんでしょう。

> また,分散の推定値が(1-ni./N)(1-n.j/N)になる点についても,読んだ本には解説されていなかったので,理解できていないのです。何か,わかりやすく解説されている文献などご存知でしたら,教えていただけませんでしょうか。

わかりやすいかどうかはともかく,Haberman の原著を見るのが確かでしょう。

> 私がお尋ねしたかったのは,P値の比較ではなく,(調整済みの)標準化残差の比較についてなのです。これは,期待値と実測値の乖離の程度を表しているので,2変数の両カテゴリ間の結びつきの強さを表していると見ても問題ないか,ということなのです

同じでしょう。P値の大小順,標準化残差の大小順,調整済みの標準化残差の大小順は,同じ分割表の中では一致します。

> 例えば,3×2のクロス表(変数1がA, B, C,変数2がX, Yのカテゴリに別れているとします)において,変数1のカテゴリAと変数2のカテゴリYがぶつかるセルの(調整済みの)標準化残差が最大だったら,この表では,AとYの結びつきが最も強いと言ってしまってもよいのでしょうか?

結びつきが強いということは,どういうことでしょう。
「結びつきが強いなら,両者は同じように変化するはずだから,観察値と期待値の差が大きく異なるはずはない,したがって,標準化残差だって,調整済みの標準化残差だって小さくなる」という解釈だってできるでしょう。あなたの考え方はべつなんでしょうけど。

二要因のカテゴリーがどのような位置関係にあるかは,クロス集計表に基づく双対尺度を考えるといいのではないでしょうか。
たくさんのカテゴリー変数のカテゴリー相互の位置関係を多変量的に考えるのが,それと関係の深い数量化III類です。

     [このページのトップへ]


647. Re^3: Haberman法の標準化残差の「標準化」の意味について 青木繁伸  2003/09/12 (金) 18:10
> おっしゃる標準化の意味はわかるのですが,標準化残差の式では,標準偏差ではなく,√期待値で割ってしまっている点が理解できないのです。

√期待値 が,まさに推定された標準偏差なのです。
Agresti の Categorical Data Analysis などを参照すればいいと思います。

> また,上記のサイトでは,(調整前の)標準化残差で平均が0,標準偏差が1と書かれていますが,読んだ本では,調整済みの標準化残差で平均が0,標準偏差が1となっています。
> 両方とも正しいのでしょうか?

両方とも正しいです。

     [このページのトップへ]


655. Re^4: Haberman法の標準化残差の「標準化」の意味について Koji  2003/09/16 (火) 18:53
ご回答,ありがとうございます。
しばらく,ネットと離れた環境にいたため,お礼を申し上げるのが,遅くなってしまい大変申し訳ありません。
とても参考になりました。
是非,教えていただいた文献を当たってみようと思います。

何度も蒸し返すようで,大変恐縮ないのですが,もうひとつだけお聞きしてよろしいでしょうか。

> > また,上記のサイトでは,(調整前の)標準化残差で平均が0,標準偏差が1と書かれていますが,読んだ本では,調整済みの標準化残差で平均が0,標準偏差が1となっています。
> > 両方とも正しいのでしょうか?
>
> 両方とも正しいです。

その点について,やや疑問が残っております。
調整前の標準化残差をSR, 調整済みの標準化残差をASRとすると,
(1-ni./N)(1-n.j/N) < 1ですから,
(SRの絶対値)> (ASRの絶対値)になるはずで,
両者の平均を0としたら,直感的には,標準偏差はSRの方がASRよりも大きくなるのではないか思うのです。
その点について,ご教授いただけませんでしょうか。
よろしくお願いいたしますm(_ _)m。

     [このページのトップへ]


656. Re^5: Haberman法の標準化残差の「標準化」の意味について 青木繁伸  2003/09/16 (火) 19:45
> (1-ni./N)(1-n.j/N) < 1ですから,
> (SRの絶対値)> (ASRの絶対値)になるはずで,
> 両者の平均を0としたら,直感的には,標準偏差はSRの方がASRよりも大きくなるのではないか思うのです。

その通でしょう。
普通考えればそうだし,実際の例を見ても,調整された方が有意になりやすいですよね。明らかです。
そのあたりをどういう風に説明しているかは,「原著論文を見てください」ということです。

わかったら,教えてくださいね。

     [このページのトップへ]


657. Re^6: Haberman法の標準化残差の「標準化」の意味について Koji  2003/09/16 (火) 20:19
どうもありがとうござました。
謎がとけたら,またご報告します。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 025 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る