データの水準 Last modified: May 16, 2002
観察される変数は数値で表現される。観察される変数と数値を対応させる基準は データ水準 と呼ばれ,数値の持つ意味には違いがある。
- 名義尺度
- データをコンピュータで処理するために用意するとき,例えば血液型の場合には,A 型を 1,B 型を 2,AB 型を 3,O 型を 4のように数値に対応させて入力する。
しかし,これらの数値は血液型を 区別するために使われているだけで,重複さえなければ,A 型を 4,B 型を 3,AB 型を 2,O 型を 1 に割当ててもよい。
またこれらの変数の,平均値を求めても意味がない(最頻値は求められる)。
- 順序尺度
- 例えば,治療効果の判定において,悪化を -1,不変を 0,改善を 1,著効を 2 のように数値に対応させる。ある場合には,改善を 1 とすれば著効は 3 くらいかもしれない。
しかし,それを決定できる客観的な根拠がない場合には,これらの数値は大小関係にのみ意味がある。
平均値などをとることはできないが,中央値は定義できる。
また,大小関係の情報を使用するためのノンパラメトリックな統計学的分析手法がある。
データ水準が「順序尺度以上」とは,間隔尺度・比例尺度を含む(これらは共に,順序尺度の性質を備えている)。
- 間隔尺度
- “距離尺度”とも呼ぶ。後述の比例尺度と異なり,数値の差のみに意味がある。
例えば,温度が 10℃ から 15℃になったときに,50 % の温度上昇があったとはいわない。温度が絶対温度 K で表されているならば,比例尺度なので何 % 上昇などのようにいえる。温度が 10℃から 15℃になった場合も,100℃から 105℃になった場合も共に 5℃の温度上昇である。
比例尺度は間隔尺度の特性をかね備えている(数値の差にも意味がある)ので,間隔尺度変数に適用できる分析手法は比例尺度変数に対しても使用できる。
「間隔尺度以上」という場合には,間隔尺度と比例尺度の両者を指す。
- 比例尺度
- “比尺度”とも呼ぶ。間隔尺度では数値の差のみに意味があるが,比例尺度では数値の差と共に数値の比にも意味がある。比が定義できるということは,絶対零点を持つことと同じことを表す。
例えば,身長,体重などは(ゼロや)負の値をとらないので,比例尺度である。体重が50 kg から 60 kgになった場合と,100 kg が 110 kg になった場合,いずれも 10 kg の増加であるが,前者は20 % 増,後者は 10 % 増である。間隔尺度変数に対して使用できる分析手法は比例尺度変数に対しても使用できるが,逆は成立たない。
間隔尺度変数として扱う(数値の差を検討する)のか,比例尺度変数として扱う(数値の比を検討する)のかは,解析目的によって選ばれなければならない。
演習問題:
以下のそれぞれのデータの水準はなにか。a,b,c,d のいずれかを解答欄に記入し,送信ボタンをクリックしなさい。
問題1 スーパーマーケットで買った卵の重さを測定した。
問題2 職業を 10 種に分類して,A 〜 J の記号を割り振ってまとめた。
問題3 成績を A 〜 E で五段階評価した。
問題4 各人の肥満度を判定するために,(実体重−標準体重)/標準体重 で表した。
応用問題:
直前のページへ戻る E-mail to Shigenobu AOKI