【統計】四分位偏差とは

四分位偏差とは

四分位偏差とは、四分位範囲(Q3 – Q1)を二等分した値です。データのばらつき具合を示す指標の一つです。

四分位範囲では、中央値(Q2)からQ1、Q3がどのくらい離れているか把握できませんが、四分位範囲の値を二等分することで、Q1、Q3が中央値から平均でどのくらい離れているかを把握することが出来ます。

Pythonで四分位偏差を求める

numpyのnp.percentileを用いることで、四分位偏差を求めることが出来ます。

import numpy as np

sample_data = [1, 3, 5, 6, 300]

# 四分位範囲を求める
q1 = np.percentile(sample_data, 25)   # 第1四分位数
q2 = np.percentile(sample_data, 50)   # 第2四分位数(中央値)
q3 = np.percentile(sample_data, 75)   # 第3四分位数
iqr = q3 - q1

# 結果を出力
print(f"第1四分位数: {q1}")
print(f"第2四分位数(中央値): {q2}")
print(f"第3四分位数: {q3}")
print(f"四分位範囲: {iqr}")
print(f"四分位偏差: {iqr / 2}")

出力結果

第1四分位数: 3.0
第2四分位数(中央値): 5.0
第3四分位数: 6.0
四分位範囲: 3.0
四分位偏差: 1.5

Pythonや統計を効率よく学ぶには?

Pythonや統計を効率よく学ぶには、普段からPythonや統計学を用いて業務をしている現役のデータサイエンティストに質問できる環境で学ぶことです。
質問し放題かつ、体系的に学べる動画コンテンツでデータ分析技術を学びたい方は、オンラインで好きな時間に勉強できるAI Academy Bootcampがオススメです。受講料も業界最安値の35,000円(6ヶ月間質問し放題+オリジナルの動画コンテンツ、テキストコンテンツの利用可能)なので、是非ご活用ください。