質的変数 と 量的変数 の違いは?初心者向けにわかりやすく解説!

質的変数と量的変数

実際、変数には様々な種類があり、質的変数と量的変数の大きく2つに分類できます。

まずは質的変数について説明します。

質的変数は、種類を区別する変数です。

例えば、性別(1=男性、2=女性)やアンケートの満足度(5=大変満足、4=満足、3=普通、2=ひどい、1=大変ひどい)などが挙げられます。

この例では、全て数値の質的変数ですが、他にもテキスト型や日付・時刻などのデータ型も存在します。

一般に質的変数は、数値や量で測ることのできない変数になります。

また質的変数は、カテゴリ変数(カテゴリデータ)や属性変数とも呼ばれます。

次に量的変数ですが、量を表現する変数です。数値や量で測ることができる変数です。

例えば、年齢や身長、テストの点数、年収、サービス利用者の苦情件数などが挙げられます。

離散型変数と連続型変数

変数には、質的変数及び量的変数以外にも、離散型変数と連続型変数という変数で、分ける場合もあります。

離散型変数とは、10,20,50,…といったそれぞれの数字の間に値が存在しない変数です。

サイコロの目がまさに離散型変数に分類されます。次に、連続型変数ですが、その名前の通り連続の値をとることができる変数です。3.2cm、5.25cmのように、小数点の値をとり、連続的に変化します。

2つの数字の間には必ず数字が存在します。例えば、時間などがその代表例です。

尺度水準

尺度水準は、これから学ぶ名義尺度、順序尺度、間隔尺度、比例尺度の4つのことを意味します。先ほど学んだ、質的変数(カテゴリ変数)は、名義尺度と順序尺度にわけられ、量的変数には間隔尺度と比例尺度に分けることが出来ます。

それではそれぞれ4つに関して見ていきます。 

名義尺度名義尺度は単純に、他と区別し分類するための変数です。

例えば、性別や血液型、電話番号などです。

例)血液型、電話番号 順序尺度順序尺度は、順序関係や大小関係には意味がある変数です。

しかし、間隔には意味がありません。例えば、順位の場合1位と2位であれば2位の方が順位が低いといった大小関係には意味がありますが、1位は2位の2倍良いなどといった主張はできませんし、足し算や引き算ができません。

例)順位、満足度 間隔尺度間隔尺度は、大小関係に加え、差に意味がある変数です。(数値の値0が絶対的な意味を持たず、数値の差だけに意味がある変数)

例えば、気温が24度から2度上昇することで26度になったと言えますが、20度から40度に上昇した場合、2倍になったとは言えないような変数です。

例)温度、テストの点数、年齢、知能指数、時刻 比例尺度比例尺度は、大小関係、差、比率に意味がある変数です。例えば、身長が100cmと200cmの差が100cmありますし、200cmは100cmの倍であるということにも意味があります。速度も同じように言えます。

例)身長、体重、速度

おわりに

この記事では、変数の種類・データの大きさに関して学びました。
統計検定の3級取得を目指されている方は「質的変数」と「量的変数」はよく出題されるキーワードですのでしっかり違いを理解しておきましょう。

AI Academy Bootcampの「オンデマンド動画+チャットサポートプラン」は6ヶ月、機械学習エンジニアやデータサイエンティストからチャットにて受講期間中、質問し放題です。

6ヶ月間質問し放題で、受講料も35,000円(税込)とお手軽にご受講頂けます。
(1日の受講費用換算で、なんと194円でご受講頂けます。)

是非、いつでも質問し放題の環境で効率の良いAI学習を始めてみてください。

AI Academy Bootcamp

1 COMMENT

現在コメントは受け付けておりません。