No.13615 反復測定を含むGLMの決定係数について  【SP】 2010/10/15(Fri) 15:39

はじめまして。心理学を専攻する院生です。
周囲に以下の件について相談できる先生がいなかったため,こちらでご相談させてさせていただきたく存じます。

ご相談したいことは,一般線形モデルの決定係数(重相関係数R2)の必要性と算出方法についてです。

実験を行い,その結果について次のようなモデルの分析を行うことになりました。
要因A(2水準,参加者間要因)×要因B(連続変量,個人差要因)×要因C(2水準,参加者内要因)

要因Bを,たとえば高群・低群というように便宜的にカテゴリカルに分割すれば,混合デザインのANOVAでも分析できるのですが,理論上の前提から要因Bは連続変量で扱うことがより妥当と考えられたため,GLMによって分析しようと考えました。
具体的には,SPSS(17.0)で,「一般線形モデル-->反復測定」の「共変量」のところに要因Bを入れ,「モデル」で交互作用を設定しました。

その分析の結果として,主効果や交互作用効果,効果量偏η2などは出力されるのですが,決定係数が出力されません。
一方,要因Cのような参加者内要因を含まない分析(SPSSの「一変量」)の場合は,決定係数が出力されます。

GLMがモデルである以上,そのモデルの寄与率の検討はモデルの妥当性の指標として必要ではないかと考えました。
実際,心理学のある論文(国内)にはGLM(繰返しを含まない)の結果として決定係数が記載されています。
しかし,別の心理学雑誌(海外)の論文をいくつか見たところでは,決定係数が記載されていませんでした。

決定係数の有意性の検討が不要なのであれば,以下の疑問は検討不要になります。
決定係数が必要ならば,繰返しを含むモデルの場合の決定係数の算出方法をご教授いただきたく存じます。

平方和の分解モデルの設定として,TypeIIIを用いているのですが,反復測定を含むGLMの場合,決定係数を算出するのに必要と思われる「修正モデル」の平方和や「修正総和」の平方和がSPSSでは出力されません。
要因Aは水準ごとの参加者数が異なるため,少なくとも修正総和平方和が算出できなければ決定係数が求められないと思われるのですが,いくつかの統計学の本を見ても,繰返しを含む場合の修正総和平方和の具体的な算出方法が分かりませんでした。
また,連続変量である要因Bの平方和の算出方法も分かりません。

そのようなわけで,繰返しを含むGLMの決定係数の考え方と算出方法をご教示していただけないでしょうか。
宜しくお願い申し上げます。

No.13658 Re: 反復測定を含むGLMの決定係数について  【SP】 2010/10/22(Fri) 15:49

この質問をさせていただいた後,混合デザインのGLMを実施した結果として決定係数を記載していない海外誌の論文を,2本みつけました。
このことから,GLMの結果に決定係数は必須ではないと推測し,また,ご判断できる方がいらっしゃらないようですので,この質問は近日中に取り下げることにいたします。
お読みいただきましてありがとうございました。

No.13659 Re: 反復測定を含むGLMの決定係数について  【青木繁伸】 2010/10/22(Fri) 17:43

取り下げる必要はありません。というか,取り下げないでください。

SPSS がどういう風になっているのかが分からないのでコメントしませんでした。
一 般的に,決定係数が計算できるのは linear な場合(重回帰分析など)だけで,曲線回帰などの場合には計算できないというか定義できません。論文などに決定係数として記載されている場合でも,単純に 著者の無知から,linear の場合の計算式をそのままつかって決定係数だと思って記載していることもあるようです。また,統計ソフトで「決定係数」が計算・出力される場合があルと思 いますが,それらは pseudo R2 です。ちょうど,以下のページに良くまとめられているので,リンクを示しておきましょう。
http://nhkuma269.blog77.fc2.com/blog-entry-25.html

No.13662 Re: 反復測定を含むGLMの決定係数について  【SP】 2010/10/23(Sat) 17:17

ご回答をありがとうございます。

> SPSSがどういう風になっているのかが分からないので

説明不足で申し訳ございませんでした。
SPSSで出力される決定係数がどの算出方法に則っているか分からない,
ということでしょうか。
それでしたら,SPSS事典 BASE編(小野寺・山本(編集), 2004)によれば,算出方法は

R2 = (修正モデル平方和)/(修正総和平方和)
= 1 - (誤差平方和)/(修正総和平方和)

とのことでした。
自由度調整R2については,今,手元に資料がございません。

pseudo R2というものがあることは知りませんでした。
ご教示ありがとうございます。
今回の分析では,正規分布する変数についての直線回帰を検討したかったとも言え,SPSSでそのように操作しているはずです。
しかし,ご紹介いただいたサイト(random dispersal)の記述から考えると,

・本来はOLSを使用する
(上の式は使用していない)
・pseudo R2の指標には分散を使用する場合があり,基本的な構成はOLSのR2と類似
(分散ではなくて平方和ですが,基本的な構成は類似)

ということになるでしょうか。
つまり,先生が

> 統計ソフトで「決定係数」が計算・出力される場合があルと思いますが,それらは pseudo R2 です。

とおっしゃるように,SPSSで算出されるR2もまたpseudo R2ということで,理解は間違っておりませんでしょうか。

た だ,今回の分析の場合,直線回帰という条件は満たしているはずですし,また,参照した論文の分析も直線回帰であるはずです(これらのことは改めて確認する 必要はあります)。それにもかかわらず,それらの論文には決定係数が掲載されていないことや,SPSSが反復測定を要因に含む場合に決定係数を出力しない ことの理由は,参考サイトにある

> 汎用性の高いR2を見つけようという試み,何を元に判断したらよいのでしょう?(実際,レビューしている文献も歯切れの悪い様子でした)。

といった事情があって,出力したり掲載したりする妥当性に確証が得られないため,と推測されるでしょうか。
また,その場合,SPSSは,反復測定要因を含まないモデルの場合のみpseudo R2を出す根拠を持っている(と考えている),とも考えられるでしょうか。

知識が足りず疑問形ばかりで恐れ入りますが,誤解している点がございましたらご指摘いただけないでしょうか。
引き続き,宜しくお願い申し上げます。

No.13666 Re: 反復測定を含むGLMの決定係数について  【kai】 2010/10/25(Mon) 08:45

> R2 = (修正モデル平方和)/(修正総和平方和)
> = 1 - (誤差平方和)/(修正総和平方和)
> とのことでした。自由度調整R2については,今,手元に資料がございません。

上記の書き方に倣えば自由度調整済決定係数は以下の式で計算されているはずです.

R'2 = 1 - (誤差平均平方)/(修正総和平均平方)

ここで,
 誤差の平均平方=誤差平方和/誤差の自由度
 修正総和平均平方=修正総和平方和/全体の自由度

No.13667 Re: 反復測定を含むGLMの決定係数について  【SP】 2010/10/25(Mon) 17:19

ご教示をありがとうございます。

ある統計学の本を確認したところ,同じ自由度調整済R2の公式が紹介されておりました。
SPSS事典 BASE編(小野寺・山本(編集), 2004)も確認しましたが,自由度調整済みの場合については具体的な説明はありませんでした。
「独立変数の数に影響されないように調整した」とはありましたので,SPSSでも,ご教示いただいたとおりの考え方を用いているのではないかと思われました。

一 般化線形モデル入門原著第2版(Dobson著,田中ら訳, 2008)を見てみたところ,OLSによって求められたR2が紹介されておりました。ただ,適合度指標としては「よく用いられ,また直感的にも理解しやす い指標」ですが,「標本分布が簡単に求められない」ために「やや限界がある」と書かれておりました。
これが具体的にどのような注意を要する限界なのか,恥ずかしながら理解できておりません。しかし,少なくとも,R2は適合度指標としては分かりやすいけども妥当性に難のある指標とする考え方があると分かりました。
それならば,ツールによってR2が簡単に算出される場合はそれを参考として記しておいてもよいけれども,大きな労力をかけて出すほどのものでもない,と考えられるでしょうか。

ご教示いただき,考えを整理することができました。
誠にありがとうございました。

No.13675 Re: 反復測定を含むGLMの決定係数について  【kai】 2010/10/27(Wed) 07:57

参考までに.

私が一般線形モデルにせよ一般化線形モデルにせよ,モデル式にあてはめて解析を行う場合,予測に重点を置いているので,決定係数は全く参考にしていません.
決定係数は得られたデータがモデルでどれだけ説明できているかを示していますが,私が知りたいのは予測の精度なのでRMSE(Root Mean Square Error:誤差の標準偏差)が一番の参考指標になります.

No.13682 Re: 反復測定を含むGLMの決定係数について  【SP】 2010/10/27(Wed) 18:01

参考情報をありがとうございます。

RMSEの出力は,SPSSのGLMの機能にはないようなので,RMSEが利用できるとは考えもしませんでした。
Rならば出せるのでしょうか。
適合指標が必要と指摘されたら,利用を検討することにいたします。
ありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 044 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る