【物体検出】Faster R-CNNとは

Faster R-CNNとは

Faster R-CNNとは、2015年に登場した物体検出アルゴリズムです。

Faster R-CNNの学習工程として、まずRegion Proposal Network(RPN)と呼ばれるネットワークで、物体候補の矩形を出力し、ここで「物体か背景か」の2択で学習を実施します。その後物体候補として出力された位置情報を、RoI Poolingという処理で特徴マップ上の矩形情報に変換し、矩形ごとに切り出して「その物体が何なのか」を学習します。

関連:Mask R-CNNとは

PythonでFaster R-CNNモデルを利用するには

torchvisionからfasterrcnn_resnet50_fpnを読み込むことで、学習済みのFaster R-CNNモデルを利用する事が出来ます。

import torch
import torchvision

model=torchvision.models.detection.fasterrcnn_resnet50_fpn(pretrained=True)

関連:torchvisionとは?

物体検出を効率よく身につけるには

物体検出を学ぶ上でおすすめなのは、画像認識分野専門の機械学習エンジニアからいつでも質問できる環境で学ぶことが大切です。

AI Academy Bootcampなら、6ヶ月35,000円にてチャットで質問し放題の環境で、機械学習やデータ分析が学べるサービスを提供しております。
数十名在籍しているデータサイエンティストや機械学習エンジニアに質問し放題の環境でデータ分析、統計、機械学習、SQL等が学べます。

物体検出やセグメンテーションに必要なスキルを効率よく体系的に身に付けたい方は是非ご検討ください。