再現率とは
再現率(Recall)とは、真の値が正事例であるものの中から、正事例と予測した割合を示す指標です。
再現率を重視するのは、FP(False Positive)が発生しても許容できるケースです。
具体的な利用シーンとしては、がん診断や異常検知のように、取りこぼしを減らしたい場面が挙げられます。
再現率は、感度やヒット率、真陽性率とも呼ばれ、以下の式で求めることができます。
※TPやFPなどが何か知りたい方はこちら
再現率を重視するタスク
再現率を利用するにあたり、再現率を重視するタスク(取りこぼしを防ぐ必要がある場面)を以下に示します。
- がんや重大な病気の診断モデル
病気を見逃すことが致命的な結果につながるため、再現率を重視。 - 異常検知(製造ラインの欠陥検出)
製造ラインでの不良品や異常を見逃すと、顧客クレームや大規模なリコールのリスクがある。 - サイバーセキュリティの脅威検出
実際の攻撃を見逃すと、重大なセキュリティ侵害が発生する可能性があるため、再現率を優先する。 - 自然災害の早期検知
津波や地震などの自然災害を見逃すことがないよう、取りこぼしを防ぐことが重要。 - 児童虐待や暴力のリスク検知
虐待や暴力を受けている人を見逃さないようにするため、再現率を重視。
まとめ
再現率(Recall)とは、陽性であるべきデータのうち、モデルが正しく陽性であると予測した割合を示す指標です。再現率は、取りこぼしを防ぐことが重要なタスクで用いられ、偽陰性(FN)を最小限に抑えることを目的としています。
再現率は、特に実際に陽性であるデータを見逃すと問題が発生する状況で重要です。このため、再現率を高めることにより、取りこぼしのリスクを軽減することができます。ただし、再現率を重視しすぎると偽陽性(FP)が増える可能性があるため、他の評価指標とバランスを取る必要があります。
機械学習や統計を効率よく学ぶには?
機械学習や統計を効率よく学ぶには、普段から機械学習や統計学を用いて業務をしている現役のデータサイエンティストに質問できる環境で学ぶことです。
質問し放題かつ、体系的に学べる動画コンテンツでデータ分析技術を学びたい方は、オンラインで好きな時間に勉強できるAI Academy Bootcampがオススメです。受講料も業界最安値の35,000円から受講可能です。是非ご活用ください。