回帰での評価方法
評価指標は、分類だけでなく回帰にも適用できます。
回帰で使われる評価指標でメジャーなものは以下の3つになります。
・平均二乗誤差 (MSE)
・二乗平均平方根誤差(RMSE)
・決定係数 (R2)
一つずつ見ていきましょう。
平均二乗誤差 (MSE)
平均二乗誤差 (MSE)とは、実際の値と予測値の絶対値の 2 乗を平均したものです。
平均二乗誤差 (MSE)では、値が小さいほど誤差の少ないモデルと言えます。
ちなみにMSEは”Mean Squared Error”の略です。from sklearn.metrics import mean_squared_error
from math import sqrt
# ※以下のコードはそのままでは動作しません。
# 実際の値と予測した値には何らかの数値のリストを渡してください。
mse = mean_squared_error(実際の値, 予測した値)
二乗平均平方根誤差(RMSE)
二乗平均平方根誤差(RMSE) とは、上記のMSEに平方根をとることで計算されるものです。
※平均平方根二乗誤差と呼んだりもします。
二乗したことの影響を、平方根で補正しています。
ちなみにRMSEは”Root Mean Squared Error”の略です。
この値が小さければ小さいほど、誤差の小さいモデルであると言えます。
from sklearn.metrics import mean_squared_error
from math import sqrt
# ※以下のコードはそのままでは動作しません。
# 実際の値と予測した値には何らかの数値のリストを渡してください。
rmse = sqrt(mean_squared_error(実際の値, 予測した値))
決定係数
決定係数(R2)とは、推定された回帰式の当てはまりの良さ(度合い)を表します。
0から1までの値を取り、1に近いほど、回帰式が実際のデータに当てはまっていることを表しており、説明変数が目的変数を説明していると言えます。
逆に0に近ければあまり良くない性能であることを示します。
from sklearn.linear_model import LinearRegression
from sklearn.metrics import r2_score
model = LinearRegression
model.fit(X, y)
result = model.score(X, y)
まとめ
このテキストでは、回帰の評価方法に関して学びました。
どれもよく利用しますのでしっかりと使えるようになりましょう。
数式と合わせて学びたい方は評価指標(回帰)をご確認ください。