No.21045 standardized hazard ratio (HR per 1SD)  【宮本健志】 2014/05/20(Tue) 20:49

いつもお世話になっております。論文で1SD毎のHRといった単位でcox回帰分析をしている論文が散見されますが,これはHRをZスコア化するような計 算式があるのでしょうか。それとも独立変数をそのSD値で割るだけなのでしょうか。統計に弱くご指導いただけると幸いです。失礼します。

No.21046 Re: standardized hazard ratio (HR per 1SD)  【宮本健志】 2014/05/20(Tue) 20:53

論文のTableにHazard ratios for continuous variables shown as standard rations (HR per 1SD).とあり,本文にはAdjusted hazard rations for continuosu variables were described using standard HRs, the HR associated with a 1-SD change in the variabel.とあります。
1−SDの意味もいまいちわかりません。

No.21047 Re: standardized hazard ratio (HR per 1SD)  【青木繁伸】 2014/05/20(Tue) 21:01

rations ???? ratios かな ????

論文の書誌情報,Web で見られるなら,その URL を示せば??
HR の変化を示すのに,変数の1単位の変化がどれだけのHRの変化になるのかを示すこともあり,変数の1SDの変化がどれだけのHRになるのかを示すこともあ りというだけの話では?変数によっては「1単位」というのが比較可能性の点でも劣るので,「1SD」当たりにしているだけでは?たとえば,年齢なんかだ と,1歳あたりというよりは5歳あたりとか10歳あたりの方が分かりやすいとかいうのと同じ文脈では?
一部分だけの(しかも,不正確な)引用で判断しての回答は危険かな。

No.21048 Re: standardized hazard ratio (HR per 1SD)  【scdent】 2014/05/21(Wed) 11:13

補足です。

回帰分析では通常,独立変数の1増分当りの回帰係数が得られます。
その回帰係数では,どの独立変数が大きく寄与しているのかを比べることができません。

例えば,年齢(歳)と身長(mm)があるとき,1歳当りと1mm当りの回帰係数やHRを示すことになるので,mm単位で測定した身長の方は刻みが細かすぎて,回帰係数やHRが小さくなって,影響が少なく見えてしまったりします。

そこで独立変数を標準化して回帰分析することにより,独立変数の間でその寄与の大きさを容易に比較できるようにします(ただし,p値は標準化しないときと変わりません)。

この標準化の方法は,平均を0,標準偏差を1にするのが一般的です。
それで回帰分析した結果が,1増分当りのHR,つまり1SD当りのHR,が得られるということになります。

平均を0,標準偏差を1にするには,

(Val−Mean)/SD

とすればいいのです。

http://www.macromill.com/landing/words/b002.html

統計ソフトにはこの操作も自動的にやってくれるものが多く,標準偏回帰係数として結果が示されます。

No.21051 Re: standardized hazard ratio (HR per 1SD)  【宮本健志】 2014/05/21(Wed) 21:11

皆様,ご指導頂きありがとうございます。文献をネットに記載していいのかもわからず抜粋しましたが誤字脱字がひどく失礼いたしました。
標 準化するということなのですね。血液検査を独立変数としてcox回帰分析をして比較したいのですが,ヒストグラムで対数分布しているため,対数化して,さ らにそれを標準化して解析すればRe: standardized hazard ratio (HR per 1SD)のたんいになるのですね。ありがとうございます。

No.21052 Re: standardized hazard ratio (HR per 1SD)  【青木繁伸】 2014/05/21(Wed) 21:13

> 標準化するということなのですね。血液検査を独立変数としてcox回帰分析をして比較したいのですが,ヒストグラムで対数分布しているため,対数化して, さらにそれを標準化して解析すればRe: standardized hazard ratio (HR per 1SD)のたんいになるのですね。

どれが正しい答えなのかは,適当なデータを作って,分析してみればすぐ分かりますね。
ところで,原論文へのアプローチ法は示さないのですか?

No.21053 Re: standardized hazard ratio (HR per 1SD)  【宮本健志】 2014/05/21(Wed) 21:23

文献は
journal of the American college of cardiology. 2007;50:40-7.
G. Michael Felker, MD. Red Cell Distribution Width as novel prognostic marker in heart failure.
これのp43, line18-23.です。

No.21054 Re: standardized hazard ratio (HR per 1SD)  【青木繁伸】 2014/05/21(Wed) 21:46

インターネットからダウンロードできますね。

http://content.onlinejacc.org/pdfaccess.ashx?ResourceID=2918713&PDFSource=13

ですね。

表 だけ見ましたが,Table 3 で,Hazard Ratio が,その右の 95% CI の範囲内にあるにもかかわらず,右端の列の p Value が 0.05 以下などのものがほとんどということもあり,元のデータを標準化して「標準化 HR」を求めたとは思えない。HR を求めた後,独立変数を 1 標準偏差変化したときの HR ということで表示しているのではないかと思われますが。そのようにして求めても同じなるとは思うが,表を作るといううえでは,不適切きわまりないのでは? よく見逃したな,査読者。
表注:Hazard ratios for continuous variables shown as standardized hazard ratios (HR per 1 SD)

本文中にも,"the HR associated with a 1-SD change in the variable" とありますしね。

Adjusted hazard ratios (HRs) for continuous variables were described using standardized HRs, the HR associated with a 1-SD change in the variable.
とありますが。

どなたか,ちゃんと論文読んでみてくれますか(^_^)

No.21056 Re: standardized hazard ratio (HR per 1SD)  【宮本健志】 2014/05/22(Thu) 11:41

ご指摘のとおりこのFigureと本文の単位が異なっており本文中のRDWの単位はHR1.17 per 1-SD increaseとなっていますね。1から標準偏差を差し引いた単位当たりのHRの意味もよくわからず,あまりに先生のご指摘が高度すぎて半分も理解でき ませんが勉強いたします。
 
 このような血液データですが,複数の単位の違う独立変数をHRで比較するためにSD値を出して標準化すると いうことでしょうが,それで単純に比較できるものなのでじょうか。また,それぞれの血液検査が対数分布しておりすべて対数化した場合はper log increaseの単位となりますが,それで比較するのとまた違うのでしょうか。
  
 変換した対数分布のヒストグラムの横軸の単位がSD値になるということで,SD毎ということになりますが。
 
 このRDWというデータは赤血球のばらつきを変動係数に変換して%表記したのもなのですが,本論文では対数化しそれを標準化しておりますが,それを実際のデータでおこなうと偏ったデータになり,今回の質問をしてしまいました。
  
 まずは私の標準化に対する知識を,先生がたの土俵まで深めます。ありがとうございます。

No.21057 Re: standardized hazard ratio (HR per 1SD)  【宮本健志】 2014/05/22(Thu) 12:12

質問がわかりにくく間違っていたので修正します。
 
 今回の文献ではRDWのHazard ratio per1-SD increaseとなっております。もとデータを標準化してHRを計算すると,1SD分の数値が増加する毎のHazrd比が算出されるとおもうのですが,1-SDの意味がいまいちわからないのです。

  このような血液検査データにおいて,複数の単位の違う独立変数をHRで比較するためにSD値を出して標準化する手法によって,HRが比較できるようになる ものなのでしょうか。単純にヒストグラムをみて対数分布である場合は,すべての独立変数を対数化して比較するだけでは意味がないものでしょうか。特に多変 量解析をする際に,単位が結果に大きく影響するため非常に興味があります。
 
 いろいろご指導ありがとうございました。統計楽しいですね。今後ともよろしくお願いします。先生方の無償の統計魂に深謝したします。

No.21058 Re: standardized hazard ratio (HR per 1SD)  【青木繁伸】 2014/05/22(Thu) 14:58

> 1-SDの意味がいまいちわからないのです。

確かに,2番目の記事にすでにそう書いてありましたね。
私は,まさかと思って,というか,見過ごしていましたよ。

それは,1 マイナス SD (1 から SD を引く)ということではなく,あなたが書いたように 1SD (1 × SD)のことでしょう。

本文中にも
adjusted hazard ratio 1.17 per 1-SD increase
と書いた数行後に
adjusted hazard ratio 1.29 per 1 SD
と書いてあったり
HR associated with a 1-SD change
とか
HR per 1 SD
とか,表示の揺れがありますが。

No.21059 Re: standardized hazard ratio (HR per 1SD)  【青木繁伸】 2014/05/22(Thu) 15:53

R の survival パッケージの example の最初に挙げられているテストデータを使って説明しましょう。

まずは,元のデータを使って分析した結果です。x を量的変数としましょう。
> # Create the simplest test data set 
> test1 <- list(time=c(4,3,1,1,2,2,3),
+ status=c(1,1,1,0,1,1,0),
+ x=c(0,2,1,1,1,0,0),
+ sex=c(0,0,0,0,1,1,1))
> summary(coxph(Surv(time, status) ~ x + strata(sex), test1))
Call:
coxph(formula = Surv(time, status) ~ x + strata(sex), data = test1)

n= 7, number of events= 5

coef exp(coef) se(coef) z Pr(>|z|)
x 0.8023 2.2307 0.8224 0.976 0.329 ★ この行の一番左の数値 0.8023 が回帰係数(a)です ★★この数値を後で使いますよ

exp(coef) exp(-coef) lower .95 upper .95
x 2.231 0.4483 0.4451 11.18 ★ exp(coef) が HR です exp(0.8023) = 2.230666 となっているわけです
★ また,その信頼区間が [0.4451, 11.18] ということです
Concordance= 0.667 (se = 0.362 )
Rsquare= 0.144 (max possible= 0.669 )
Likelihood ratio test= 1.09 on 1 df, p=0.2971
Wald test = 0.95 on 1 df, p=0.3293
Score (logrank) test = 1.05 on 1 df, p=0.3053
次に,x を平均値=0,標準偏差=1に正規化します
> test2 <- test1
> test2$x <- scale(test2$x)
> sd(test1$x)
[1] 0.7559289 ★ この数値 0.7559289 が元の x の標準偏差(b)です ★★この数値を後で使いますよ!
> sd(test2$x)
[1] 1 ★ 標準化した x の標準偏差です ちゃんと 1 になっています

> summary(coxph(Surv(time, status) ~ x + strata(sex), test2)) ★ 標準化した x を使って再分析
Call:
coxph(formula = Surv(time, status) ~ x + strata(sex), data = test2)

n= 7, number of events= 5

coef exp(coef) se(coef) z Pr(>|z|)
x 0.6065 1.8340 0.6217 0.976 0.329 ★ 回帰係数は 0.6065 ですよ。
★ これは,元の x を使った回帰係数(a) 0.8023 に
★ 元の x の標準偏差(b) 0.7559289 を掛けた値になっていますよ
★ 0.8023 * 0.7559289 = 0.6064818
★ つまり,標準化回帰係数は「元の変数を使って得られた回帰係数×それぞれの変数の標準偏差」
★ になるので,変数を標準化して再分析するようなことは不要と言うこと

exp(coef) exp(-coef) lower .95 upper .95
x 1.834 0.5453 0.5423 6.202

Concordance= 0.667 (se = 0.362 )
Rsquare= 0.144 (max possible= 0.669 )
Likelihood ratio test= 1.09 on 1 df, p=0.2971
Wald test = 0.95 on 1 df, p=0.3293
Score (logrank) test = 1.05 on 1 df, p=0.3053
exp(coef) は,変数が 1 増加したときの HR の大きさを表すわけだけど,その HR が小さい場合なんかは特に,たとえば,年齢なんかは年齢が 5 歳あるいは 10 歳変化したときの HR として表した方が分かりやすい(応用しやすい)ということもある。また,単位や,標準偏差が違う変数の HR を比較するには,1 標準偏差増加したときの HR というのを考えないと比較できないということもある。
それが目的。
その目的を達するには,全ての独立変数を標準化して同じ再分析して標準化回帰係数を求める「なんてことはしないで」,元の変数を使って得られた回帰係数に,それぞれの変数の標準偏差を掛けてやれば,それで求まるということ。
で, それらの説明は些細なもので,それぞれの独立変数が1標準偏差(1SDということよ)変化するときの回帰係数が,標準化回帰係数だということ。当たり前で すが,Table 3 に示された Hazard Ratio というのは,exp(元の変数の回帰係数×元の変数の標準誤差) ということですね。

No.21060 Re: standardized hazard ratio (HR per 1SD)  【宮本健志】 2014/05/23(Fri) 14:16

ありがとうございます。再度ハザード分析を勉強します。失礼します。

No.21061 Re: standardized hazard ratio (HR per 1SD)  【宮本健志】 2014/05/24(Sat) 17:40

相談した文献ですが"1-SD"の件ですが「-」はマイナスではなく本文中でわかりやすいように「ハイフン」をいれていただけのようです。勘違いでした。

ちなみに本文献は標準化ハザード比を算出しそのoutcomeの発生への独立変数の寄与度をchi-squareの値で比較していますが一般的な手法なのでしょうか?
この知識は全くの素人的な質問です。ご迷惑をおかけします。

No.21062 Re: standardized hazard ratio (HR per 1SD)  【青木繁伸】 2014/05/24(Sat) 21:18

> 本文献は標準化ハザード比を算出しそのoutcomeの発生への独立変数の寄与度をchi-squareの値で比較していますが一般的な手法なのでしょうか?

SPSSがやっていることですから,いいんじゃないでしょうか?
代替法と比較してみますか?Excel でも(SPSS でも),確かめることは出来ますよ。

> x <- 1.5
> pnorm(x, lower.tail=FALSE)*2 # 標準正規分布の両側確率(これは,近似値)
[1] 0.1336144
> pchisq(x^2, df=1, lower.tail=FALSE) # 自由度が1の場合は,統計量の二乗のχ自乗分布の上側確率と同じ(これは,近似値)
[1] 0.1336144
> pt(x, df=150, lower.tail=FALSE)*2 # 自由度が無限のときに標準正規分布(正確な値)
[1] 0.1357163
> pf(x^2, df1=1, df2=150, lower.tail=FALSE) # 第1自由度が1のとき,統計量の二乗は,第二自由度が自由度のt分布の両側確率と同じ(正確な値)
[1] 0.1357163

No.21063 Re: standardized hazard ratio (HR per 1SD)  【宮本健志】 2014/05/25(Sun) 16:31

SPSSの比例ハザード分析を行うと全体のカイ2乗の得点として数値がでてきます。複数の独立変数を変数増加法で検定すると除外された変数の残渣カイ2乗なつものがひょうじされます。
この文献は,多変量解析で1つ1つのカイ2乗をだしています。
せんのようにRを駆使すればだせるのでしょうか。
web資料も今のところなく本屋にもいってみます。

標準化ハザード比の大きさではなくカイ2乗の値で比較する意義も理解が困難です

少し質問しすぎなので勉強します

No.21064 Re: standardized hazard ratio (HR per 1SD)  【宮本健志】 2014/05/25(Sun) 18:45

この文献のchi-square値はSPSSの結果では,個別に表示されるwald値のことをいっているのでしょうか 。それともAICを最尤推定値と個数を用いて計算した値をいっているのでしょうか。
わかりません。

No.21065 Re: standardized hazard ratio (HR per 1SD)  【青木繁伸】 2014/05/25(Sun) 21:18

> この文献のchi-square値はSPSSの結果では,個別に表示されるwald値のことをいっているのでしょうか 。それともAICを最尤推定値と個数を用いて計算した値をいっているのでしょうか。

「ちょっと,何言っているのかわからない」
Table 3 のことなら,それぞれの独立変数に対する回帰係数の有意性検定を言っているのだろうし?

No.21066 Re: standardized hazard ratio (HR per 1SD)  【宮本健志】 2014/05/25(Sun) 21:56

休日にご迷惑おかけしました。ご返事ありがとうございます。
回帰係数を個別に検討する検定ということですね。
不勉強ですいません。ありがとうございます。

No.21067 Re: standardized hazard ratio (HR per 1SD)  【宮本健志】 2014/05/25(Sun) 22:29

SPSSでは,CO回帰分析をすると以下の結果がでます。11個の連続変数をoutcome17に対して強制投入法でのmultivariate analysisをしました。

まず全体の検定結果です。
モデル係数のオムニバス検定(a)					
全体 (得点) 前のステップからの変更 前のブロックからの変更
-2 対数尤度,カイ2乗 自由度 有意確率 カイ2乗 自由度 有意確率 カイ2乗 自由度 有意確率
68.674, 39.014 11 .000 24.587 11 0.01 24.587 11 0.01
a. 開始ブロック番号 1。方法 = 強制投入法

つぎに各々の結果です。

Exp(B) の 95.0% CI
方程式中の変数 B 標準誤差 Wald 自由度 有意確率 Exp (B) 下限 上限
独立変数1 -0.179 0.611 0.086 1 0.769 0.836 0.252 2.769
独立変数2 0.06 0.402 0.022 1 0.882 1.061 0.483 2.332
独立変数3 0.282 0.704 0.16 1 0.689 1.325 0.333 5.267
独立変数4 0.289 0.669 0.186 1 0.666 1.335 0.359 4.955
独立変数5 -0.267 0.632 0.179 1 0.672 0.765 0.222 2.644
独立変数6 1.134 0.621 3.333 1 0.068 3.107 0.92 10.496
独立変数7 -0.082 0.541 0.023 1 0.879 0.921 0.319 2.657
独立変数8 0.473 0.618 0.586 1 0.444 1.605 0.478 5.384
独立変数9 -0.122 0.715 0.029 1 0.865 0.885 0.218 3.594
独立変数10 0.222 0.323 0.47 1 0.493 1.248 0.662 2.352
独立変数11 0.144 0.518 0.077 1 0.781 1.155 0.419 3.185
す ごくわかりにくいとおもいますが,多変量解析で強制投入をする変数が多く優位な結果はでておりませんが,例えば,このデータで,参考にしている文献の [chi-aquare]がどの数値にあたるのかが,わからず,しつこく相談している次第です。基本的に知識不足で,申し訳ございません。さまざまな書物 を読んだのですがわりません。
もしヒントがあればお願いします。では失礼します。

No.21068 Re: standardized hazard ratio (HR per 1SD)  【scdent】 2014/05/26(Mon) 10:20

"Cox回帰 Wald"などで検索すれば,Wald統計量がカイ2乗( = chi-square )分布に従うと書かれてあるので,Wald統計量だということがわかります。 

http://www.xlstat.com/ja/products-solutions/feature/cox-proportional-hazards-models.html

CO回帰とか[chi-aquare]とか質問の要所で間違いがあるのはいかがなものでしょうか。

No.21069 Re: standardized hazard ratio (HR per 1SD)  【青木繁伸】 2014/05/26(Mon) 11:26

例えば,独立変数1 についての結果で言えば,
chi-square value = (-0.179 / 0.611)^2 = 0.08582694 = Wald
Pr{自由度1のカイ二乗値 > 0.08582694} = 0.76955092 = 有意確率
ですよ。ついでに,21061 の質問と 21062 の回答にあるように,
z value = -0.179 / 0.611 = -0.2929624
Pr{abs(z value) > 0.2929624} = 0.76955092 = 有意確率(chi-square value を使ったのと同じ値)
ですよ。
21059 で示したように,R では,z 値の方が使われていますね。どっちであっても,同じです。

No.21070 Re: standardized hazard ratio (HR per 1SD)  【宮本健志】 2014/05/26(Mon) 13:00

乱筆お許しください。また,適切なご指導ありがとうございます。
非常にわかりやすくご説明いただきありがとうございます。
失礼な文面もあり,時間帯も休日であるのにも関わらず本当にありがとうございます。
疑問点がすべて解決でき感謝いたします。失礼いたしました。

● 「統計学関連なんでもあり」の過去ログ--- 046 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る