【統計】歪度とは

歪度とは

歪度(わいど)とは代表的な基本統計量の1つで、歪度を用いることで、分布の歪み方を確認する事が出来ます。また、ヒストグラムの形を知るための客観的な目安になります。

歪度を求める

Pandasのskew()を用いることで、歪度を求めることが出来ます。

import pandas as pd
import scipy.stats as stats
import warnings
# 不要な警告文を非表示
warnings.simplefilter('ignore')
import seaborn as sns

# サンプルデータ
x = [0, 1 , 2, 3 ,3 ,4, 5, 6, 7, 8, 9]

# pandas
df = pd.DataFrame(x, columns=['x'])

# カーネル密度推定と呼ばれる曲線も含む、ヒストグラムを表示
sns.distplot(df)

print("歪度:", df['x'].skew())

出力結果

歪度: 0.15531779277424432

歪度が正のため、やや左側にコブが出来ていることがわかります。

Pythonやデータ分析を効率よく学ぶには?

データ分析を効率よく学ぶには、普段からPythonを利用している現役のデータサイエンティストや機械学習エンジニアに質問できる環境で学ぶことです。
質問し放題かつ、体系的に学べる動画コンテンツでデータ分析技術を学びたい方は、オンラインで好きな時間に勉強できるAI Academy Bootcampがオススメです。受講料も業界最安値の35,000円(6ヶ月間質問し放題+オリジナルの動画コンテンツ、テキストコンテンツの利用可能)なので、是非ご活用ください。