반응형

Object Detection이란, 여러 개의 사물이 포함되어 있는 이미지 안에서 각각의 물체의 종류를 판별하는 Image Classification과, 각각의 사물의 범위를 예측하는 Object Localization이 합쳐진 작업입니다.

 

Deep learning 이전의 기법들:

Sliding Window: 

여러가지 사이즈의 frame들을 움직이며 각각의 위치의 score를 계산하는 방법입니다. 계산의 횟수가 많아 속도 측면에서 비효율적입니다.

 

Selective Search:

영상의 계층적인 구조를 활용하여 탐색하고 그룹화하는 과정을 반복합니다.

 

Deep learning을 사용한 Object Detection

R-CNN:

Object Detection에 CNN을 적용한 첫 논문이며 selective search와 CNN을 결합한 방법론입니다. input image를 Selective Search를 사용하여 여러개의 영역으로 나누고, 각각의 영역들에 CNN을 적용하여 Classification을 수행하는 방법입니다.

 

1-Stage Object Detector(Fast R-CNN, Faster R-CNN):

Object Localization과 Image Classification이 동시에 진행되는 방법론. 속도가 빠르지만 정확도가 낮다.

 

2-Stage Object Detector(SSD, YOLO):

Object Localization과 Image Classification을 순차적으로 진행하는 방법론. 속도가 느리지만 정확도가 높다.

 

 

참고: https://hoya012.github.io/blog/Tutorials-of-Object-Detection-Using-Deep-Learning-what-is-object-detection/

 

 

반응형
블로그 이미지

개발자_무형

,