【評価指標】再現率とは

再現率とは

再現率(Recall)とは、真の値が正事例であるものの中から、正事例と予測した割合を示す指標です。

再現率を重視するのは、FP(False Positive)が発生しても許容できるケースです。

具体的な利用シーンとしては、がん診断や異常検知のように、取りこぼしを減らしたい場面が挙げられます。

再現率は、感度やヒット率、真陽性率とも呼ばれ、以下の式で求めることができます。

※TPやFPなどが何か知りたい方はこちら

関連:【評価指標】混同行列 とは

関連:【評価指標】正解率 とは

関連:【評価指標】適合率 とは

再現率を重視するタスク

再現率を利用するにあたり、再現率を重視するタスク(取りこぼしを防ぐ必要がある場面)を以下に示します。

  1. がんや重大な病気の診断モデル
    病気を見逃すことが致命的な結果につながるため、再現率を重視。
  2. 異常検知(製造ラインの欠陥検出)
    製造ラインでの不良品や異常を見逃すと、顧客クレームや大規模なリコールのリスクがある。
  3. サイバーセキュリティの脅威検出
    実際の攻撃を見逃すと、重大なセキュリティ侵害が発生する可能性があるため、再現率を優先する。
  4. 自然災害の早期検知
    津波や地震などの自然災害を見逃すことがないよう、取りこぼしを防ぐことが重要。
  5. 児童虐待や暴力のリスク検知
    虐待や暴力を受けている人を見逃さないようにするため、再現率を重視。

まとめ

再現率(Recall)とは、陽性であるべきデータのうち、モデルが正しく陽性であると予測した割合を示す指標です。再現率は、取りこぼしを防ぐことが重要なタスクで用いられ、偽陰性(FN)を最小限に抑えることを目的としています。

再現率は、特に実際に陽性であるデータを見逃すと問題が発生する状況で重要です。このため、再現率を高めることにより、取りこぼしのリスクを軽減することができます。ただし、再現率を重視しすぎると偽陽性(FP)が増える可能性があるため、他の評価指標とバランスを取る必要があります。

関連:【評価指標】適合率 とは

機械学習や統計を効率よく学ぶには?

機械学習や統計を効率よく学ぶには、普段から機械学習や統計学を用いて業務をしている現役のデータサイエンティストに質問できる環境で学ぶことです。
質問し放題かつ、体系的に学べる動画コンテンツでデータ分析技術を学びたい方は、オンラインで好きな時間に勉強できるAI Academy Bootcampがオススメです。受講料も業界最安値の35,000円から受講可能です。是非ご活用ください。