No.03087 Spearman's rho と多重相関  【ふーんでいぶ】 2007/03/29(Thu) 08:35

ノンパラメトリックなデータに対して計算した Spearman's rho の相関行列を用いて,重相関係数や偏相関係数を計算することが,統計学的に正しいかどうかを教えてください.

とくに目的変数が病期のように 1-4や1-5の整数値の場合や,説明変数も同様に限られた整数値の場合,このような計算をすることはナンセンスであると知り合いの統計学者が言っていましたが,本当でしょうか?

No.03090 Re: Spearman's rho と多重相関  【青木繁伸】 2007/03/29(Thu) 11:10

ナンセンスと思う人は,それなりの考えを持っているのでしょうから,なぜナンセンスなのかよく聞いた方が良いと思います。

二つの二値変数を2×2の分割表にまとめて,二変数の関連を見るとき,φ係数を計算することがあります。このφ係数は,元の変数をたとえば 0/1 として計算したピアソンの相関係数と一致します。

データに順位を付けて,順位をデータとしてピアソンの積率相関係数を計算したものは,スピアマンの順位相関係数と一致します。(この理由から,ピアソンの積率相関係数に対して行うことのできる解析・検定は,スピアマンの順位相関係数に対しても適用できます)

データがいくつかの限られた数値しか取らないのは,元々のその変数の性質であることもあるし,病期のようにそれを正確に測定できないという些細な理由に過ぎないこともあります。

精度の高いデータでなければ解析に値しないというのは,実際的ではないですね。

No.03093 Re: Spearman's rho と多重相関  【ふーんでいぶ】 2007/03/29(Thu) 17:15

早速のご返答ありがとうございました.
スピアマンの順位相関係数においても,ピアソンの相関係数に対して 行うことのできる解析・検定が適用できるとのことで,疑問がひとつ解消いたしました.今まで入手できた統計学の教科書では,どれもピアソンの相関行列をも とに,これらの解析・検定を行っており,スピアマンの順位相関係数に触れているものがなかったので,スピアマンの順位相関係数に適用するのは何か理論的な 問題があるのではないかと疑問に思っていたところでした.

さらに具体的に質問をさせていただきます.(1) 目的変数が腫瘍の組織学的進行度でスコアが1-5までのノンパラメトリックなデータ, 説明変数になるものはいずれもスコアリングの値でノンパラメトリックなデータの場合,(2) 目的変数が腫瘍の実測値で,パラメトリックなデータ, 説明変数になるものは同じく,いずれもスコアリングした値でノンパラメトリックなデータの場合,これら二つのパターンのいずれの場合も,得られたスピアマ ンの順位相関係数をもとに重相関係数や偏相関係数を計算できるのか,というのが質問です.

(1) の場合,目的変数の値が少なく,限定されているので,これらの解析は適用できないというのが件の統計士の回答でした.それならば,(2) の場合はどうなのかと尋ねると,こちらも説明変数の値が少なく,限定されているので,やはりこれらの解析は適用できないといわれました.私としては, (2) の場合は適用してもいいのではないかと思いましたし,(1) の場合も目的変数は,いわゆる病期とは異なり,腫瘍の実測値と密接に相関した一元的なデータであるので,適用してもいいのではないかと思っておりました.

これらのデータに対して,こういった解析・検定を行うことは,的外れのように言われましたが,何か納得できませんでしたのでここに質問を重ねました次第です.
ちなみに母国語が英語ではないものどうしが,英語で行ったディスカッションですので,意思疎通に欠いた点もあったとは思います.それではどうぞよろしくお願いします.

No.03095 Re: Spearman's rho と多重相関  【青木繁伸】 2007/03/29(Thu) 22:40

「ノンパラメトリックなデータ」という言い方は不正確だと思いますが。

(1)目的変数:順序尺度変数,  説明変数:順序尺度変数
(2)目的変数:間隔(比)尺度変数, 説明変数:順序尺度変数

(1)の場合には,説明変数をダミー変数化して多項ロジスティック分析
(2)の場合には,説明変数をダミー変数化して重回帰分析
というのが,最適とは思います。
説明変数が名義尺度の場合でも,ダミー変数化すればよいわけです。

No.03147 Re: Spearman's rho と多重相関  【ふーんでいぶ】 2007/04/07(Sat) 10:46

最初の質問に戻りまして,変数が順序尺度変数や間隔尺度変数に関わらず,二つの変数間の相関を見たい場合に,Spearmanのrhoからなる相関行列を用いて偏相関係数を求めても構わないでしょうか? また,任意の変数に対して重相関係数を算出してもよいでしょうか?

手持ちのデータ(目的変数:間隔尺度変数,説明変数:順序尺度変数)を用いて,順序尺度変数をダミー変数化して,重回帰分析をしてみました.
得 られたRは,Spearmanのrhoからなる相関行列から求めたRよりも高い値となりました.説明変数がすべて間隔尺度変数で,ダミー変数化をしない場 合ならば,このような値の乖離はないと思います.上述した質問にとくに問題がないとすれば,この場合,ダミー変数化して重回帰分析した解析のほうが決定係 数が高くなるので,結果の解釈に際して,こちらをより重視すべきと考えられるのでしょうか? それともダミー変数化した場合,変数の順位性を考慮していな いので,二つの解析は別の尺度によるもので両立すると考えたほうがよいのでしょうか?

最後に,(1)の場合は説明変数をダミー変数化して多項ロジスティック分析とありますが,この解析は数量化II類と同義ですか?

No.03148 Re: Spearman's rho と多重相関  【青木繁伸】 2007/04/07(Sat) 17:24

> 最初の質問に戻りまして,変数が順序尺度変数や間隔尺度変数に関わらず,二つの変数間の相関を見たい場合に,Spearmanのrhoからなる相関行列を 用いて偏相関係数を求めても構わないでしょうか? また,任意の変数に対して重相関係数を算出してもよいでしょうか?

かまわないでしょう。

> 手持ちのデータ(目的変数:間隔尺度変数,説明変数:順序尺度変数)を用いて,順序尺度変数をダミー変数化して,重回帰分析をしてみました.
> 得られたRは,Spearmanのrhoからなる相関行列から求めたRよりも高い値となりました.説明変数がすべて間隔尺度変数で,ダミー変数化をしない場合ならば,このような値の乖離はないと思います.

「説明変数がすべて間隔尺度変数で,ダミー変数化をしない場合ならば,このような値の乖離はないと思います」って,そんなことはないでしょう。

> 上述した質問にとくに問題がないとすれば,この場合,ダミー変数化して重回帰分析した解析のほうが決定係数が高くなるので,結果の解釈に際して,こちらをより重視すべきと考えられるのでしょうか?

それが普通のアプローチだと思いますよ。

> それともダミー変数化した場合,変数の順位性を考慮していないので,二つの解析は別の尺度によるもので両立すると考えたほうがよいのでしょうか?

「ダミー変数化した場合,変数の順位性を考慮していない」ということはないですね。ダミー変数化を行うときに消去したカテゴリーが基準になり,それ以外のカテゴリーは,基準と比べてどれだけ大きい重みを持つかというように,ちゃんと評価されています。

> (1)の場合は説明変数をダミー変数化して多項ロジスティック分析とありますが,この解析は数量化II類と同義ですか?

同義ではありません。

No.03159 Re: Spearman's rho と多重相関  【ふーんでいぶ】 2007/04/10(Tue) 04:22

青木先生,どうもありがとうございました.おかげさまで,ここしばらく疑問に思っていたことが解消したような気がいたします.本当にありがとうございました.

No.03192 Re: Spearman's rho と多重相関  【ふーんでいぶ】 2007/04/12(Thu) 08:16

すみません,打ち止めにしようと思っていたのですが,新たな疑問が生じたため再度質問させていただきます.

従 属変数が間隔(比)尺度変数で,説明変数が順序尺度変数の場合,ダミー変数化して重回帰分析するとよいとあります.説明変数(順序尺度変数)をダミー変数 化する際に,変数を 0 または 1 を与えることによりダミー変数化しました.R を用いる場合,factor 関数を使用してもよいかと思います.ところで,この方法でダミー変数化した場合,変数の順位性をあまり反映しないのではと先に意見を述べましたが, R の rank 関数を使用して,説明変数(順序尺度変数)を変換して,それを重回帰分析すると変数の順位性をより反映するように思いますが,どうでしょうか?

● 「統計学関連なんでもあり」の過去ログ--- 040 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る