2021 네이버 부스트캠프 - Ai tech

Week 8/9/10 - Object Detection - Fast R-CNN

미미수 2021. 10. 15. 15:50

Fast R-CNN은 이름에서 알 수 있듯이 R-CNN을 보완한 모델이다.

어떤 점이 달라졌는지 비교해보자.

 

주요 Contribution

1. input image를 바로 CNN에 넣어 추출한 feature에 ROI 적용 - RoI Projection

2. RoI Pooling

 


1. RoI Projection, RoI Pooling

 

 

 

Ex) input image : 400x400x3

 

- selective search 사용해 2000개의 region을 추출

- CNN을 통과한 feature map에 해당 ROI를 추출 

- 이때 ROI는 feature map의 비율에 맞게 축소

 

 

 


2. Hierarchical Training

RCNN의 경우 여러개의 이미지에 존재하는 ROI들을 전부 저장해서 사용한다.

따라서 한 배치에 서로 다른 이미지의 ROI가 포함되는 경우가 있다.

Fast RCNN은 이점을 보완하여 한 배치에 한 이미지의 ROI들만을 포함할 수 있게 했다.

 


 

3. Pipeline

 

 

 

1. 이미지를 CNN에 넣어서 feature추출, CNN 한번 사용!

ROI Projection을 통해 feature map 상에서 ROI를 계산

 

 

 

 

 

2. RoI Pooling을 통해 일정한 크기의 feature 추출

- 고정된 vector얻기 위함. SPP Net 의 Spatial Pyramid Pooling 사용

 

 

 

 

 

 

3. 각 RoI들을 Fully connected layer에 통과한 후, Softmax Classifier와 Bbox Regressor통과

 

 

 

 


4. Shortcomigs

- End to End X