散布度とは
散布度とは、データの散らばりを表す値で、分散、標準偏差、範囲、歪度、尖度などが該当します。
平方和
個々のデータと平均値の差を二乗した値の和
分散
平方和を(n-1)で割ったもの。
標準偏差
分散の平方根。
範囲(レンジ)
最大値と最小値の差。
分散と標準偏差をPythonで求める
データのばらつきを表す基本統計量(分散、標準偏差)をPythonで求めてみましょう。
import numpy as np
twitter = np.array([180, 80, 30, 50, 210])
facebook = np.array([100, 120, 100, 120, 110])
# 分散を計算
t_var = np.var(twitter)
f_var = np.var(facebook)
# 標準偏差を計算
t_std = np.std(twitter)
f_std = np.std(facebook)
print("分散(Twitter, Facebook):(" + str(t_var) + "," + str(f_var) +")")
print("標準偏差(Twitter, Facebook):(" + str(t_std) + "," + str(f_std) +")")
# 出力結果
"""
分散(Twitter, Facebook):(5160.0,80.0)
標準偏差(Twitter, Facebook):(71.8331399843,8.94427191)
"""
Pythonやデータ分析を効率よく学ぶには?
データ分析を効率よく学ぶには、普段からPythonを利用している現役のデータサイエンティストや機械学習エンジニアに質問できる環境で学ぶことです。
質問し放題かつ、体系的に学べる動画コンテンツでデータ分析技術を学びたい方は、オンラインで好きな時間に勉強できるAI Academy Bootcampがオススメです。受講料も業界最安値の35,000円(6ヶ月間質問し放題+オリジナルの動画コンテンツ、テキストコンテンツの利用可能)なので、是非ご活用ください。