76 偏りのあるデータについて noriko 2002/12/02 (月) 16:03
77 Re: 偏りのあるデータについて 青木繁伸 2002/12/02 (月) 16:30
82 Re3: 偏りのあるデータについて noriko 2002/12/02 (月) 17:43
84 Re: Re3: 偏りのあるデータについて 青木繁伸 2002/12/02 (月) 18:01
85 Re^2: Re3: 偏りのあるデータについて 青木繁伸 2002/12/02 (月) 18:03
87 Re^3: Re3: 偏りのあるデータについて 青木繁伸 2002/12/02 (月) 18:18
88 Re^4: Re3: 偏りのあるデータについて 青木繁伸 2002/12/02 (月) 18:23
90 Re^5: Re3: 偏りのあるデータについて 青木繁伸 2002/12/02 (月) 18:32
94 Re^8: Re3: 偏りのあるデータについて noriko 2002/12/02 (月) 19:15
91 Re^6: Re3: 偏りのあるデータについて noriko 2002/12/02 (月) 18:44
92 Re^7: Re3: 偏りのあるデータについて 青木繁伸 2002/12/02 (月) 18:53
93 Re^8: Re3: 偏りのあるデータについて 青木繁伸 2002/12/02 (月) 19:01
95 Re^9: Re3: 偏りのあるデータについて noriko 2002/12/02 (月) 19:25
96 Re^10: Re3: 偏りのあるデータについて 青木繁伸 2002/12/02 (月) 21:02
76. 偏りのあるデータについて noriko 2002/12/02 (月) 16:03 |
はじめまして。突然ですがどうしてもわからないことがあってメールいたします。 |
77. Re: 偏りのあるデータについて 青木繁伸 2002/12/02 (月) 16:30 |
> 得点分布が極端に偏ったデータの処理について悩んでいます(得点化:0点,1点の2件法)。 |
82. Re3: 偏りのあるデータについて noriko 2002/12/02 (月) 17:43 |
> 0点か1点の二件法で,得点範囲が0 - 8というのはどういうことでしょうか。 |
84. Re: Re3: 偏りのあるデータについて 青木繁伸 2002/12/02 (月) 18:01 |
> 今回のデータは2件法で,正規分布しないことが前提にあります。この偏りのあるデータで構造方程式モデリングにより確証的因子分析にかけたところ,モデルは支持されました(統計ソフトSPSS11.0とMplus)。しかしながら,回答分布が正規分布していないこと,標準偏差が平均値を超えていることを考えますとこのデータ自体が確証的因子分析に適さないのではないかという疑問があります。モデルの妥当性を論じるために,偏りのあるデータでも分析が可能であるという根拠を求めています。 |
85. Re^2: Re3: 偏りのあるデータについて 青木繁伸 2002/12/02 (月) 18:03 |
「標準偏差が平均値を超えている」ということにこだわっているようですが,そのこだわりかたが誤って(?)います。もしその問題だけを解消するだけなら,得点を0/1とする代わりに,10/11とすればいいだけです(別に23/24でもなんでもいいです。要するに平行移動してやりさえすれば,標準偏差は平均値より小さくすることができます) |
87. Re^3: Re3: 偏りのあるデータについて 青木繁伸 2002/12/02 (月) 18:18 |
まずは関数の定義2変数データの生成 gendat2 <- function(nc, r) { z <- matrix(rnorm(2*nc), ncol=2) res <- eigen(r2 <- cor(z)) coeff <- solve(r2) %*% (sqrt(matrix(res$values, 2, 2, byrow=TRUE))*res$vectors) z <- t((t(z)-apply(z, 2, mean))/sqrt(apply(z, 2, var)*(nc-1)/nc)) %*% coeff z %*% chol(matrix(c(1, r, r, 1), ncol=2)) } カットポイントで切って,0/1データに変換 cor2 <- function(x, y, cutpoint) { x <- x > cutpoint y <- y > cutpoint cor(x, y) } シミュレーション本体 sim <- function(n, r) { result <- gendat2(n, r) x <- result[,1] y <- result[,2] cat("rho =", cor(x, y), "\n") for (i in seq(0.0, 2, 0.25)) { cat("cutpoint =", i, " r =", cor2(x, y, i), "\n") } } |
88. Re^4: Re3: 偏りのあるデータについて 青木繁伸 2002/12/02 (月) 18:23 |
母相関係数0.3の二変数(2000組のデータ)を cutpoint の上下で0/1変数に変換して相関係数を求める。 |
90. Re^5: Re3: 偏りのあるデータについて 青木繁伸 2002/12/02 (月) 18:32 |
結論 |
94. Re^8: Re3: 偏りのあるデータについて noriko 2002/12/02 (月) 19:15 |
ありがとうございました。大変参考になりました。またご助言をいただきにくることがあると思いますがよろしくお願いします。 |
91. Re^6: Re3: 偏りのあるデータについて noriko 2002/12/02 (月) 18:44 |
> 0/1データにおいて,相関係数を計算することは,理論的には何の問題もない。0と1の割合がどんなにゆがんでいても,それは相関係数の計算には何の関係もない。 |
92. Re^7: Re3: 偏りのあるデータについて 青木繁伸 2002/12/02 (月) 18:53 |
> ありがとうございます。つまり偏りの大きいデータでの解析はリスクが大きいということでしょうか? |
93. Re^8: Re3: 偏りのあるデータについて 青木繁伸 2002/12/02 (月) 19:01 |
> > ありがとうございます。つまり偏りの大きいデータでの解析はリスクが大きいということでしょうか? |
95. Re^9: Re3: 偏りのあるデータについて noriko 2002/12/02 (月) 19:25 |
すいません,よくわからないところがありましたのでお尋ねします。 |
96. Re^10: Re3: 偏りのあるデータについて 青木繁伸 2002/12/02 (月) 21:02 |
>> でもまあ,前出のシミュレーションの結果を見ても分かるように,母相関係数より大きな標本相関係数がでてくるようなこともなさそうなので,そのような相関係数行列に基づいても解釈可能でモデルも支持されたというなら,結果オーライなのかもしれません(。 |
● 「統計学関連なんでもあり」の過去ログ--- 022 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る