★ データの合成に対する質問。 ★

3186. データの合成に対する質問。 前田馬之介 2004/05/17 (月) 19:21
└3187. Re: データの合成に対する質問。 青木繁伸 2004/05/17 (月) 19:31
 └3305. Re^2: データの合成に対する質問。 前田馬之介 2004/05/26 (水) 18:49


3186. データの合成に対する質問。 前田馬之介  2004/05/17 (月) 19:21
初めまして。

非常に単純な質問かもしれないのですが…。統計の基礎を全く知らないような者なので,是非ともこの基礎的な質問への回答をお願いいたします。

例 えば次の様な問題を考えます。ここに100人の男性がいるとして,まあ,赤い服,青い服,黄色い服とそれぞれ着てるとします。赤い服を着てる男性がx%, 青い服を着てる男性がy%,黄色い服を着てる男性がz%いるとします。コレが一つのデータですね。(x+y+z=100%です)
次に同じ母体で身長150〜160cm,160〜170cm,170〜180cmと三つに区分けしたばあい,それぞれa%,b%,c%存在するとします。コレも一つのデータとして存在します。(a+b+c=100%です)
次に同じ母体で体重50〜60kg,60〜70kg,70〜80kgと三つに区分けした場合,それぞれω%,δ%,φ%存在するとします。コレも独立した一つのデータとして存在します。(ω+δ+φ=100%です)
さて,都合三つのデータってのが同じ母体で存在するワケなんですけど,質問はこうです。
オ リジナルのデータについての情報ってのは全く知らないで,単に3つの独立したデータを手に入れたとします。で,このみっつのデータを使って,例えば「赤い 服を着て身長が170〜180cm,かつ体重が50〜60kgの男性ってのは全体の何%いる」ってのを数学的に類推出来るものなんでしょうか?
要するにあらゆる多角的なファクターで分類したある統計母数に関しての沢山のデータ群が存在してるとき,数学的手法で「任意のデータ同士を融合させて,新たなデータを作り出せる」ってのは可能なんでしょうか?是非ともご教授下さい。

     [このページのトップへ]


3187. Re: データの合成に対する質問。 青木繁伸  2004/05/17 (月) 19:31
簡単な例を考えてみればいいでしょう。
男が64%,女が36%。
運転免許を持っているのが76%,持っていないのが24%。
全部で100人。

つまり,
   免許あり  免許なし  計
男    あ     い   64人
女    う     え   36人
計     76人     24人  100人
上の表で,あ,い,う,え に入る数字を確定することはできますか?
できないとすれば,どういう条件があれば確定できるでしょうか?

属性が何種類になっても,同じことです。

     [このページのトップへ]


3305. Re^2: データの合成に対する質問。 前田馬之介  2004/05/26 (水) 18:49
ああ,そうかあ…。
       免許あり  免許なし  計
    男    x     y   64人
    女    z     w   36人
    計    76人    24人  100人
となると,
x+y=64
z+w=36
x+z=76
y+w=24
って連立方程式になって,コレは……行列式が0になっちゃって解が一意で決まりませんね。どれか一つ確定してれば解がキチンと決まるのかな?

実は下らないハナシなんですけど,競馬の問題をずっと考えていて……(笑)。ある所から単勝,枠連,馬連の出現率データを手に入れてたんです。
コレは人気順に各馬券の出現率を記載してるモノなんですが,ファクターが91種類位に大別されていて,項目が芝の距離別,ダートの距離別から始まって,クラス別,頭数別,競馬場別,と細かなデータが並んでるワケです。
でコレはコレで面白いんですけど,どーも使い勝手が悪い。そこでエクセルとか使ったら,例えば
「中山競馬場,500万条件,芝2,000m,16頭立て」
等というデータをコレらのデータから合成して作れるんじゃないのかな,ってずーっと考えていたワケです。が…。
先生の例示を見てる限りそれは無理そうですね。やっぱり大本のデータがない事にはうまく行きそうにない,ってコトのようです。
どうも長々とありがとうございました。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 029 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る