PR曲線とは
PR曲線(Precision-Recall曲線)はPrecisionとRecallからなる曲線です。
Recallを横軸に、Precisionを縦軸にして、上位の値から順に折れ線で描かれます。
PR曲線は歪んだ分布を持つデータセット(陽性例より陰性例の方が圧倒的に多いデータセット)に対して、ROC曲線に比べてより高いパフォーマンスを発揮します。
TN(Negativeと予測してTrue(正解)だった時)の値が大きくなりやすい場合や、ネガティブケースが豊富な場合に、PR曲線が一般的に適しています。
偏りが大きいデータセット(ポジティブケースが稀な場合)にはPR曲線を使用する事が多いです。
Pythonや統計を効率よく学ぶには?
Pythonや統計を効率よく学ぶには、普段からPythonや統計学を用いて業務をしている現役のデータサイエンティストに質問できる環境で学ぶことです。
質問し放題かつ、体系的に学べる動画コンテンツでデータ分析技術を学びたい方は、オンラインで好きな時間に勉強できるAI Academy Bootcampがオススメです。受講料も業界最安値の35,000円(6ヶ月間質問し放題+オリジナルの動画コンテンツ、テキストコンテンツの利用可能)なので、是非ご活用ください。