2021 네이버 부스트캠프 - Ai tech

Week 8/9/10 - Object Detection - SPPNet

미미수 2021. 10. 15. 15:50

SPPNet은 Spatial Pyramid Pooling을 적용한 모델로,

 

RCNN의 한계점 

  1. 1. CNN의 입력 이미지 사이즈가 고정되어 있다 -> Crop/Resize등으로 정보 손실
  2. 2. ROI마다 CNN통과 -> 시간 너무 오래 걸림

Spatial Pyramid Pooling로 보완한다.

 


 

1. Spatial Pyramid Pooling

 

 

- Binning이라고도 불리는 이 과정은 고정된 size의 feature vector를 정해놓고, BIN의 크기를 조정해가면서 pooling하는 방법

- Pooling은 Max pooling을 하든, Average pooling을 진행하든 어쨋든 고정된 하나의 feature를 추출한다!

 


2. ShortComing

1. CNN, SVM classifier, bbox Regressor로 모델이 분리되어 있는건 여전하다. 따로학습 BAD!!

2. End to End XXX

 

 

다음글은 여기서 더 보완된 모델 -> Fast R-CNN