★ 符号検定の符号のつけ方について ★

 334 符号検定の符号のつけ方について  しん  2002/08/27 (火) 20:18
  337 Re: 符号検定の符号のつけ方について  青木繁伸  2002/08/27 (火) 20:56
   340 Re^2: 符号検定の符号のつけ方について  しん  2002/08/28 (水) 00:05
    349 Re^3: 符号検定の符号のつけ方について  青木繁伸  2002/08/28 (水) 14:36
     352 (お礼)符号検定の符号のつけ方について  しん  2002/08/28 (水) 19:01
    341 Re^3: 符号検定の符号のつけ方について  青木繁伸  2002/08/28 (水) 01:13
     345 Re^4: 符号検定の符号のつけ方について  しん  2002/08/28 (水) 05:09
      347 Re^5: 符号検定の符号のつけ方について  青木繁伸  2002/08/28 (水) 11:13
       374 Re^6: 符号検定の符号のつけ方について  DISIR  2002/08/31 (土) 00:07
        377 Re^7: 符号検定の符号のつけ方について      2002/08/31 (土) 20:43
         396 Re^8: 符号検定の符号のつけ方について  DISIR  2002/09/03 (火) 07:35


334. 符号検定の符号のつけ方について  しん  2002/08/27 (火) 20:18
こんにちは,符号検定の符号のつけ方について,こういうやり方が出来るか
どうかどなたか教えていただきたいのですが,,

たとえば,バナー広告を10のサイトに出した時の効果を符号検定で見たいとします。
普通,出す前と出した後のアクセス数の差を符号化して検定すると思います。

しかし,より保守的に考え,出す前のアクセス数の平均+2SDを超えた時のみ,
プラスと符号をつける(後は-)といったようなことは,できるのでしょうか?

検索,手持ちの本を見る限り,符号検定の例は2つの集団の差を検定するものばかり,
しかし,たった一回アクセスが増えたのをプラス(増えた)とするには抵抗があります。
上記のような使い方(単純に集団の差ではない検定?)をしている例
もしくは本をご存知でしたら教えてください。

     [このページのトップへ]


337. Re: 符号検定の符号のつけ方について  青木繁伸  2002/08/27 (火) 20:56
例としてみたことはないですが,符号検定は単なる二項検定であり,二項検定は二項分布に基づくものであり,二項検定で取り上げる「事象」というのはどのように定義されてもかまわないわけです。
たとえばサイコロで「偶数の目が出る」を考えてもいいし,「5以上の目が出る」でも,「3の目が出る」でもいいわけです。それぞれ,母比率が1/2,2/6,1/6になるだけです。
ですから,[事前と事後で差が+Δ以上]というこを事象と考えてもいいわけです。

ま,そんな風に考えたのですが,いかがでしょう。

     [このページのトップへ]


340. Re^2: 符号検定の符号のつけ方について  しん  2002/08/28 (水) 00:05
青木さんこめんとどうもです。
>,,符号検定は単なる二項検定,,,二項検定で取り上げる「事象」というのはどのように定義されてもかまわない,,ですから,[事前と事後で差が+Δ以上]というこを事象と考えてもいいわけです。

 二項検定ということですと,事前と事後で差が事前の2SD以上をプラスとするとなると,その確率は約5%となるわけですが,帰無仮説を「事前と事後で変化がない?」として C(1/2)^rの和で検定しても良いのでしょうか,

 つまりは,めったに無いこと(約5%)を良くあること(50%)として考えた場合の検定ということになり,より保守的になるのだと思いますが,,,

 それとも,この場合,C (0.05)r(1-0.05)^(n-r)の和の確率分布より計算しないといけないのでしょうか?(もちろん,これのほうが良いのだと思いますが,)

 そもそも,符号の割り振りに偏りがあった(約5%)としても,それを言いたいがために,偏りがない(50%)と仮説をおいて検定し,それを棄却するのだから,良いのかなぁとも思うし,,,
でも,例題にないし,不安にもなるし,,

     [このページのトップへ]


349. Re^3: 符号検定の符号のつけ方について  青木繁伸  2002/08/28 (水) 14:36
>  つまりは,めったに無いこと(約5%)を良くあること(50%)として考えた場合の検定ということになり,より保守的になるのだと思いますが,,,

前と後を比べて,後の方が前より+Δ以上大きいときのみ効果ありとするわけですから,保守的になるのは目的通りではないでしょうか。

差の分布が正規分布に従うとも言えないので,+2SD以上になるのが0.025(=母比率)と考えるのもなかなかつらいところがありますから,
「後の方が前より+Δ以上大きいときのみ効果あり」として符号をつけ,+の母比率が0.5 として検定するのが一番良さそうです。

     [このページのトップへ]


352. (お礼)符号検定の符号のつけ方について  しん  2002/08/28 (水) 19:01
> 差の分布が正規分布に従うとも言えないので,+2SD以上になるのが0.025(=母比率)と考えるのもなかなかつらいところがありますから,
> 「後の方が前より+Δ以上大きいときのみ効果あり」として符号をつけ,+の母比率が0.5 として検定するのが一番良さそうです。

 ありがとうございます。そうか!,正規分布と仮定した場合0.025になるのであって,その分布がわからない以上,母比率0.5として検定することも意味があるわけですね。
 これで,胸のつかえがとれ,すっきりしました。
 また一つ成長できました。ありがとうございました。

(ちなみに,今日,本屋さんでしらみつぶしに統計の本を見ましたが,上記のような例はありませんでした。ほとんど,差の検定ばっかりで,こういう,実際の用い方みたいなことを考えると,ケースバイケースだから,統計のセンスが要求されますね,,あぁ〜)

     [このページのトップへ]


341. Re^3: 符号検定の符号のつけ方について  青木繁伸  2002/08/28 (水) 01:13
帰無仮説(母比率)について,誤解しておられるようですね。

>  それとも,この場合,C (0.05)r(1-0.05)^(n-r)の和の確率分布より計算しないといけないのでしょうか?(もちろん,これのほうが良いのだと思いますが,)

この方が良いも何も,事後の方が事前より 2SD 以上大きい場合を効果ありとするのですから,母比率は(約)2.5%ですよ(片側確率ですから5%の半分ですよ)。
この場合,二項分布は f(r) = nCr ・ 0.025^r ・ 0.975^(n-r) です。

効果ありと効果なしを合わせて200あったとして,効果ありが15のとき,効果ありが15以上となる確率(片側P値)は,
200
Σ nCr ・ 0.025^i ・ 0.975^(200-i) = 0.00017721
i=15

両側検定は,逆方向に極端な場合というのを考えにくいので F 分布を使う方法を用いれば,P=0.00035などということになるわけです。

     [このページのトップへ]


345. Re^4: 符号検定の符号のつけ方について  しん  2002/08/28 (水) 05:09
青木さんたびたびのコメントどうも感謝,感謝です。

 二項検定とすると,ご指摘の通りΣnCr0.025^i0.975^(n-i)ですが
最初の投稿でのバナー広告の効果を"符号"検定で判定するとした場合
+-の符号が実際は2SD越えたもので判定されていたとしても,
それを知りえない場合や知っていても保守的に考え,+と-は同じ比率と
仮定して検定しそれを棄却してもいいのでは??と思うのですが,,

 符号検定にこだわるからいけないのですが,どうしても疑問なので
 例えば「先着100名」という広告後10分のアクセス数で見るとすると
前30分の2SDを越えた時を+として,それが5サイトの中2つであったら
”二項”検定(1%)では有意(<5%)であっても,”符号”検定では5つの
サイトが全部プラスとならないと有意となりません。
 広告は「効果」あるといいたい場合,後者の方が現実に則し,保守的と
思うのですが,,また,普通に前後のアクセス数の差で符号検定すると
実際はそんなに数が増えていない場合まで含んでしまうし,
適切でないような,,(それが符号検定なのでしょうけど),,

     [このページのトップへ]


347. Re^5: 符号検定の符号のつけ方について  青木繁伸  2002/08/28 (水) 11:13
>  符号検定にこだわるからいけないのですが,どうしても疑問なので
>  例えば「先着100名」という広告後10分のアクセス数で見るとすると
> 前30分の2SDを越えた時を+として,それが5サイトの中2つであったら
> ”二項”検定(1%)では有意(<5%)であっても,”符号”検定では5つの
> サイトが全部プラスとならないと有意となりません。

符号検定というのは,たしかに母比率0.5の検定ではあります。
しかし,それは,二項検定に含まれるわけです。

「”二項”検定(1%)では有意(<5%)であっても」というのは,私の理解を超える日本語ですが,この検定と母比率0.5の二項検定(符号検定)の結果が異なるのは当たり前です。

     [このページのトップへ]


374. Re^6: 符号検定の符号のつけ方について  DISIR  2002/08/31 (土) 00:07
余計なことですが,符号検定というのは得られた情報をかなり捨てている方法
なので,このケースのように大きさの情報を使える場合に用いることはあまり
よいデータの解析法ではないと思います。

     [このページのトップへ]


377. Re^7: 符号検定の符号のつけ方について      2002/08/31 (土) 20:43
> 余計なことですが,符号検定というのは得られた情報をかなり捨てている方法
> なので,このケースのように大きさの情報を使える場合に用いることはあまり
> よいデータの解析法ではないと思います。

ウイルコクソンの符号順位和検定のことをほのめかしていらっしゃるのかと思います。
質問者のデータの実体がよく分からないのでなんともいえませんが
ある種の対策を行う前と後でホームページのヒット数に差があるかどうかという問題だったと
ホームパージが一つなら何の問題もないのでしょうが
いくつかのページについてデータが取られているとき
ベースとなるページ参照数がページごとにかなり異なることもあり得るわけで
1000が1001になったのと
10が11になったのと
おなじく1だけ増加したというのもどうかと思うわけです

あるいは
対応のあるt検定をほのめかしておられるのか
そうだとすると
条件はいっそう厳しくなりそう

     [このページのトップへ]


396. Re^8: 符号検定の符号のつけ方について  DISIR  2002/09/03 (火) 07:35
まず,バナー広告を10のサイトに出した場合,あるサイトを
見たあと次のサイトにも同じバナーを見て興味をもった,あるいは
最初のサイトでアクセスしたから次は見ないというように,
Webの解析というのはそういうことも考慮した解析をします。
あるいは10のサイトをどういうジャンルか分類して自分の商品の
興味を持つ人と重なるのはどういうジャンルか調べることに興味は
ないのでしょうか?単に有意差を出すことよりも,せっかく得た
データの情報を使いきって,次に役立つ解析の方が私は好きです。
Webの解析については多くのベンダーがソフトウェアを出して
いるので,初歩部分なら無料のソリューションセミナーを受けれる
と思います。Webの解析は多変量解析のセミナーの題材にも最近はなってる
みたいですし,そちらを覗くのはいかがでしょうか?

ウイルコクソンの符号順位和検定,t検定というのはデータのとり方
の段階から工夫すれば可能ではありますが,その場合も検定はフラグをたてる
(あるいは絞込み)という目的で使われた方が良いと思います。
統計=検定ではないと思います。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 020 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る