No.13658 Re: 反復測定を含むGLMの決定係数について 【SP】 2010/10/22(Fri) 15:49
この質問をさせていただいた後,混合デザインのGLMを実施した結果として決定係数を記載していない海外誌の論文を,2本みつけました。
このことから,GLMの結果に決定係数は必須ではないと推測し,また,ご判断できる方がいらっしゃらないようですので,この質問は近日中に取り下げることにいたします。
お読みいただきましてありがとうございました。
No.13659 Re: 反復測定を含むGLMの決定係数について 【青木繁伸】 2010/10/22(Fri) 17:43
取り下げる必要はありません。というか,取り下げないでください。
SPSS がどういう風になっているのかが分からないのでコメントしませんでした。
一 般的に,決定係数が計算できるのは linear な場合(重回帰分析など)だけで,曲線回帰などの場合には計算できないというか定義できません。論文などに決定係数として記載されている場合でも,単純に 著者の無知から,linear の場合の計算式をそのままつかって決定係数だと思って記載していることもあるようです。また,統計ソフトで「決定係数」が計算・出力される場合があルと思 いますが,それらは pseudo R2 です。ちょうど,以下のページに良くまとめられているので,リンクを示しておきましょう。
http://nhkuma269.blog77.fc2.com/blog-entry-25.html
No.13662 Re: 反復測定を含むGLMの決定係数について 【SP】 2010/10/23(Sat) 17:17
ご回答をありがとうございます。
> SPSSがどういう風になっているのかが分からないので
説明不足で申し訳ございませんでした。
SPSSで出力される決定係数がどの算出方法に則っているか分からない,
ということでしょうか。
それでしたら,SPSS事典 BASE編(小野寺・山本(編集), 2004)によれば,算出方法は
R2 = (修正モデル平方和)/(修正総和平方和)
= 1 - (誤差平方和)/(修正総和平方和)
とのことでした。
自由度調整R2については,今,手元に資料がございません。
pseudo R2というものがあることは知りませんでした。
ご教示ありがとうございます。
今回の分析では,正規分布する変数についての直線回帰を検討したかったとも言え,SPSSでそのように操作しているはずです。
しかし,ご紹介いただいたサイト(random dispersal)の記述から考えると,
・本来はOLSを使用する
(上の式は使用していない)
・pseudo R2の指標には分散を使用する場合があり,基本的な構成はOLSのR2と類似
(分散ではなくて平方和ですが,基本的な構成は類似)
ということになるでしょうか。
つまり,先生が
> 統計ソフトで「決定係数」が計算・出力される場合があルと思いますが,それらは pseudo R2 です。
とおっしゃるように,SPSSで算出されるR2もまたpseudo R2ということで,理解は間違っておりませんでしょうか。
た だ,今回の分析の場合,直線回帰という条件は満たしているはずですし,また,参照した論文の分析も直線回帰であるはずです(これらのことは改めて確認する 必要はあります)。それにもかかわらず,それらの論文には決定係数が掲載されていないことや,SPSSが反復測定を要因に含む場合に決定係数を出力しない ことの理由は,参考サイトにある
> 汎用性の高いR2を見つけようという試み,何を元に判断したらよいのでしょう?(実際,レビューしている文献も歯切れの悪い様子でした)。
といった事情があって,出力したり掲載したりする妥当性に確証が得られないため,と推測されるでしょうか。
また,その場合,SPSSは,反復測定要因を含まないモデルの場合のみpseudo R2を出す根拠を持っている(と考えている),とも考えられるでしょうか。
知識が足りず疑問形ばかりで恐れ入りますが,誤解している点がございましたらご指摘いただけないでしょうか。
引き続き,宜しくお願い申し上げます。
No.13666 Re: 反復測定を含むGLMの決定係数について 【kai】 2010/10/25(Mon) 08:45
> R2 = (修正モデル平方和)/(修正総和平方和)
> = 1 - (誤差平方和)/(修正総和平方和)
> とのことでした。自由度調整R2については,今,手元に資料がございません。
上記の書き方に倣えば自由度調整済決定係数は以下の式で計算されているはずです.
R'2 = 1 - (誤差平均平方)/(修正総和平均平方)
ここで,
誤差の平均平方=誤差平方和/誤差の自由度
修正総和平均平方=修正総和平方和/全体の自由度
No.13667 Re: 反復測定を含むGLMの決定係数について 【SP】 2010/10/25(Mon) 17:19
ご教示をありがとうございます。
ある統計学の本を確認したところ,同じ自由度調整済R2の公式が紹介されておりました。
SPSS事典 BASE編(小野寺・山本(編集), 2004)も確認しましたが,自由度調整済みの場合については具体的な説明はありませんでした。
「独立変数の数に影響されないように調整した」とはありましたので,SPSSでも,ご教示いただいたとおりの考え方を用いているのではないかと思われました。
一 般化線形モデル入門原著第2版(Dobson著,田中ら訳, 2008)を見てみたところ,OLSによって求められたR2が紹介されておりました。ただ,適合度指標としては「よく用いられ,また直感的にも理解しやす い指標」ですが,「標本分布が簡単に求められない」ために「やや限界がある」と書かれておりました。
これが具体的にどのような注意を要する限界なのか,恥ずかしながら理解できておりません。しかし,少なくとも,R2は適合度指標としては分かりやすいけども妥当性に難のある指標とする考え方があると分かりました。
それならば,ツールによってR2が簡単に算出される場合はそれを参考として記しておいてもよいけれども,大きな労力をかけて出すほどのものでもない,と考えられるでしょうか。
ご教示いただき,考えを整理することができました。
誠にありがとうございました。
No.13675 Re: 反復測定を含むGLMの決定係数について 【kai】 2010/10/27(Wed) 07:57
参考までに.
私が一般線形モデルにせよ一般化線形モデルにせよ,モデル式にあてはめて解析を行う場合,予測に重点を置いているので,決定係数は全く参考にしていません.
決定係数は得られたデータがモデルでどれだけ説明できているかを示していますが,私が知りたいのは予測の精度なのでRMSE(Root Mean Square Error:誤差の標準偏差)が一番の参考指標になります.
No.13682 Re: 反復測定を含むGLMの決定係数について 【SP】 2010/10/27(Wed) 18:01
参考情報をありがとうございます。
RMSEの出力は,SPSSのGLMの機能にはないようなので,RMSEが利用できるとは考えもしませんでした。
Rならば出せるのでしょうか。
適合指標が必要と指摘されたら,利用を検討することにいたします。
ありがとうございました。
● 「統計学関連なんでもあり」の過去ログ--- 044 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る