【評価指標】適合率 とは

適合率とは

適合率(Precision)とは、正事例と予測したものの中で、実際に真の値が正事例である割合を示す指標です。
出力された結果がどの程度正解しているかを示します。

適合率を重視するのは、FN(False Negative)の発生が許容されるケースです。

適合率の利用シーンとしては、クーポンを渡すと効果のある顧客を予測する場合などが挙げられます。このように、予測の確実性を高めたい場合に適用されます。さらに、レコメンドや検索結果の精度を向上させる場面でも利用されます。

適合率は、以下の式で求めることができます。

※TPやFPなどが何か知りたい方はこちら

関連:【評価指標】混同行列 とは

関連:【評価指標】正解率 とは

適合率を重視するタスク

適合率を利用するにあたり、適合率を重視するタスク(陽性予測の正確性が重要な場面)を以下に示します。

  1. スパムメールフィルタ
    スパムでないメールを誤ってスパムと判定すると、重要なメールを失うリスクがあるため、適合率を重視。
  2. ローン審査
    支払い能力がない顧客にローンを提供することで、金融リスクが高まるため、適合率を重視。
  3. 広告ターゲティング
    興味のないユーザーに広告を配信すると、広告費の無駄が生じるため、適合率が重要。
  4. 医療における不要な治療の判定
    実際には健康な患者に誤って治療を施すと、不必要な負担をかけてしまうため、適合率が重要。
  5. 株式の売買シグナル
    実際には利益が出ない銘柄を「買い」と予測すると、投資の損失につながるため、適合率を重視。

まとめ

適合率(Precision)とは、モデルが陽性であると予測したデータのうち、実際に陽性であった割合を示す指標です。適合率は、陽性予測がより正確であることを重視するタスクで用いられ、偽陽性(FP)を最小限に抑えることを目的としています。

適合率は、特に誤って陽性と判定した場合のコストが大きい状況で重要です。このため、適合率を高めることで、誤判定による無駄やリスクを軽減することができます。ただし、適合率を重視しすぎると偽陰性(FN)が増える可能性があるため、他の評価指標とバランスを取る必要があります。

関連:【評価指標】再現率とは

機械学習や統計を効率よく学ぶには?

機械学習や統計を効率よく学ぶには、普段から機械学習や統計学を用いて業務をしている現役のデータサイエンティストに質問できる環境で学ぶことです。
質問し放題かつ、体系的に学べる動画コンテンツでデータ分析技術を学びたい方は、オンラインで好きな時間に勉強できるAI Academy Bootcampがオススメです。受講料も業界最安値の35,000円から受講可能です。是非ご活用ください。

2 COMMENTS

コメントを残す