Fast R-CNN은 이름에서 알 수 있듯이 R-CNN을 보완한 모델이다.
어떤 점이 달라졌는지 비교해보자.
주요 Contribution
1. input image를 바로 CNN에 넣어 추출한 feature에 ROI 적용 - RoI Projection
2. RoI Pooling
1. RoI Projection, RoI Pooling
Ex) input image : 400x400x3
- selective search 사용해 2000개의 region을 추출
- CNN을 통과한 feature map에 해당 ROI를 추출
- 이때 ROI는 feature map의 비율에 맞게 축소
2. Hierarchical Training
RCNN의 경우 여러개의 이미지에 존재하는 ROI들을 전부 저장해서 사용한다.
따라서 한 배치에 서로 다른 이미지의 ROI가 포함되는 경우가 있다.
Fast RCNN은 이점을 보완하여 한 배치에 한 이미지의 ROI들만을 포함할 수 있게 했다.
3. Pipeline
1. 이미지를 CNN에 넣어서 feature추출, CNN 한번 사용!
ROI Projection을 통해 feature map 상에서 ROI를 계산
2. RoI Pooling을 통해 일정한 크기의 feature 추출
- 고정된 vector얻기 위함. SPP Net 의 Spatial Pyramid Pooling 사용
3. 각 RoI들을 Fully connected layer에 통과한 후, Softmax Classifier와 Bbox Regressor통과
4. Shortcomigs
- End to End X
'2021 네이버 부스트캠프 - Ai tech' 카테고리의 다른 글
Week 8/9/10 - Object Detection - Neck의 개념 (0) | 2021.11.04 |
---|---|
Week 8/9/10 - Object Detection - Faster R-CNN (0) | 2021.10.16 |
Week 8/9/10 - Object Detection - SPPNet (0) | 2021.10.15 |
Week 8/9/10 - Object Detection - R-CNN (0) | 2021.10.15 |
Week 8/9/10 - Object Detection - 2 Stage Detectors (0) | 2021.10.15 |