偏差とは
偏差とは、個々の数値と平均値との差のことです。個々のデータが平均値から偏っている程度を表しています。
偏差は、個々の数値 – データの平均値で求められます。
scores = [90,80,40,60,90]
def mean(scores):
s = sum(scores)
N = len(scores)
mean = s // N
return mean
# 1. 平均値を求める
mean = mean(scores)
# 2. 偏差を求める
diff = []
for n in scores:
# 一人一人のスコアから平均値を引いたものをdiffリストの末尾に追加。
diff.append(n - mean)
print("偏差", diff)
出力結果
偏差 [18, 8, -32, -12, 18]
偏差値とは
偏差値に関しても学んでおきましょう。偏差値という言葉は、皆様も学生時代などに聞いたことがある言葉かと思います。そのため馴染みはあるという方が多いのではないでしょうか。しかし、聞いたことはあるものの具体的にどのような計算をしているのか、偏差値とは何かをパッと答えると戸惑われる方もいるかもしれません。偏差値とは、自身の学力や順位を把握するために用いられる指標になります。テストの点数同士を比較した場合ですと、問題の難易度によってバラツキが出てしまいます。そのため、偏差値を用いることが一般的です。偏差値は、テストを受験した人数やそのテストの難易度に左右されることなく、多くの集団の中から自身の位置を把握することが出来ます。偏差値は個人の得点から平均点を引き、その後標準偏差で割り、10で掛け合わせ、最後に50を足すことで求める事が出来ます。統計学的に説明すると平均値50、標準偏差10の分布に従うように変形した値が偏差値であると言えます。数式で表すと以下の通りです。
偏差値を求める
それでは偏差値を求めるプログラムを作成してみましょう。プログラムは標準偏差を求める際に利用したプログラムに加え、偏差値を求める関数を作り、リストscores
に格納したそれぞれの数値を元に偏差値を算出してみます。31行目から追加したコードになります。
scores = [90,80,40,60,90]
def mean(scores):
s = sum(scores)
N = len(scores)
mean = s // N
return mean
# 1. 平均値を求める
mean = mean(scores)
# 2. 偏差を求める
diff = []
for n in scores:
# 一人一人のスコアから平均値を引いたものをdiffリストの末尾に追加。
diff.append(n-mean)
print("偏差", diff)
# 3. 分散を求める
import numpy as np
# 分散(variance)
v = np.var(scores)
print("分散", v)
# 4. 分散の正の平方根を求める
std = np.std(scores)
print("標準偏差", std)
def deviation_value(score, mean, std):
return int((score - mean) / std * 10 + 50)
for score in scores:
dv = deviation_value(score, mean, std)
print("偏差値: ", dv)
出力結果
偏差 [18, 8, -32, -12, 18]
分散 376.0
標準偏差 19.390719429665317
偏差値: 59
偏差値: 54
偏差値: 33
偏差値: 43
偏差値: 59
上記のようにそれぞれの点数から偏差値を算出する事が出来ました。
まとめ
この記事では、標準偏差とは何か、標準偏差の算出方法に関して学びました。
標準偏差は統計の書籍などで必ずと言って良いほど出てきますので、しっかりと理解して使いこなせるようにしましょう。
もっと学びたいと思われた方にAI Academy Bootcampの公式LINEをご紹介します。友だち登録してくださった方に無料講義や無料動画のご案内、受講割引クーポンのプレゼントもございます。
無料で始めるチャンスです!
ではAI・データサイエンス、機械学習の実践力を高める全4コース40時間以上の動画が見放題!AIの学習に必須のPythonの学習から始まり、データサイエンス・機械学習など、目的に応じた幅広い分野をカバーしています。
無料講義や無料動画を試して頂いて、ご受講をご検討頂けましたら幸いです。