No.20482 サンプルサイズを加味した相関係数  【Suzuki】 2013/11/15(Fri) 21:42

いつも勉強させていただいており感謝しております。

以下のようなデータで,「科目1と科目2の相関係数(回帰式でも結構です)」を参加者の大小の加味して推定する場合,どのような方法がございますでしょうか。
初学者のため大変苦しんでいます。ヒントだけでもいただけますと幸いです。よろしくお願い申し上げます。

     科目1(平均点) 科目2(平均点)  参加者
地区A 78 89 22

地区B 45 67 229

地区C 44 66 45

地区D 66 75 108

地区E 35 57 66

No.20486 Re: サンプルサイズを加味した相関係数  【青木繁伸】 2013/11/16(Sat) 10:38

平均点しかわからないのですか?
78 が 22 個,45 が 229 個,44 が 45個,66 が 108 個,35 が 66 個 というベクトル(データ)と
89 が 22 個,67 が 229 個,66 が 45個,75 が 108 個,57 が 66 個 というベクトル(データ)
の相関ということにしかならないので,まっとうな相関係数の推定値とはほど遠いものでしょう。

No.20490 Re: サンプルサイズを加味した相関係数  【Suzuki】 2013/11/17(Sun) 21:51

早速のご教示,大変感謝しております。
書き足りない点がありご迷惑をおかけいたしました。科目A,Bについては生データがなく平均点しかわかりませんが,地区については40−50個のデータがあります。数をもう少し増やすことでまっとうな相関係数とはならないでしょうか。

いろいろ調べておりましたところ,Rでlmのコマンドに"weights"があり,(自分ではうまくいかないのですが)これをうまく使うことでサンプルサイズの大きさを加味することができるのでしょうか。またご助言いただけますと幸いです。よろしくお願い申し上げます。

No.20501 Re: サンプルサイズを加味した相関係数  【青木繁伸】 2013/11/18(Mon) 15:31

> 地区については40−50個のデータがあります。数をもう少し増やすことでまっとうな相関係数とはならないでしょうか。

相関係数の計算には,データの共分散,分散の情報が必須です。それらの情報を持たない,平均値だけのデータが何万個あっても,相関係数の推定はできないのではないでしょうか。

たとえてみれば,「100の地区である変数の平均値がそれぞれ,xx, yy, zz, ... でした。全体の平均値はいくつでしょうか?」という質問を考えて見てください。
全体の平均値の計算には,個々の平均値がいくつのデータから計算されたか(サンプルサイズ)がわからないと計算できません。

No.20513 Re: サンプルサイズを加味した相関係数  【Suzuki】 2013/11/19(Tue) 20:41

丁寧にご回答いただき本当にありがとうございました。少し無理なことは良くわかりました。これからも先生のサイトで勉強していきます。

● 「統計学関連なんでもあり」の過去ログ--- 046 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る