본문 바로가기

Paper review

[Paper review] Learning Data Augmentation Strategies for Object Detection

*Introduction

Data Augmentation은 일반적으로 학습 데이터가 부족하거나, 데이터를 증강시켜 모델 성능을 개선시킬 때 사용한다.

데이터가 부족한 경우 데이터셋의 특징들을 잘 잡아내지 못할 뿐만 아니라 Overfitting, Underfitting에 빠지기 쉽다.

다음과 같이 원본 이미지에 인위적인 변화를 주고 데이터의 양을 증폭시킬 수 있다.

Figure 1 : Data Augmentation

 

Q1. Object Detection에선 Data Augmentation이 다른가?

Image classification에서는 이미 Data Augmenation은 필수적이고, 모델의 큰 성능을 가져오는것이 입증되었다.

But, Object Detection에서의 Data Augmenation은 입증된 바가 많지 않음.

Why?

  1. Object Detection에서는 Image annotation, bounding box 값 변화를 함께 줘야하는 추가적인 연산이 필요
    Figure 2: Data Augmentation in Object detection
  2. Classification에 사용되는 데이터셋보다 detection을 위한 데이터셋의 example이 더 적음

 

 

*Method

논문에서 Image Classificiation에서 사용하던 이미지 변환 방식(operations)들을 그래도 사용한다.

하지만 Object Detection을 잘 수행하도록 변환하기 위해 3가지 경우의 Operations을 요약함

  1. Color operations : 이미지의 color 값을 변환하되, bounding box의 위치 좌표값에는 변화를 주지 않음
    • ex) Equalize, Contrast, Brightness...
  2. Geometric operations : 이미지의 위치정보를 바꾸며, bounding box annotation의 위치, 사이즈를 같이 변화시킴
    • ex) Rotate, ShearX, TranslationY...
  3. Bounding box operations : 이미지 내에세 bounding box annotation이 있는 부분의 픽셀만 변화시킴
    • ex) BBox_Only_Equalize, BBox_Only_Rotate, BBox_Only_FlipLR ...

 

위 operation들을 적용하여 train과정에 활용함. 어떤 변환을 어떤 순서로 사용할지는 Search method를 통해 최적화함.

 

Figure 3 : Search Space

 

최적의 augmentation 방법을 찾기 위해서 search space를 구성한다. 여러개의 sub-policy를 생성하고, 각 sub-policy에는 2개의 operation이 적용된다.

이 operation에는 다음과 같은 hyper parameter가 존재함. 

  1. L - Magnitude of the operation
  2. M - Probability parameter
  3. K - Number of sub-policy

위 조건에서 좋은 sub-policy를 고르는 확률은 다음 식으로 정의된다.

논문에서는 이 확률 중에서 선택하기 위해 PPO(Proximal Policy Optimiation)을 사용하여 각각의 policy를 선정한다.

 

 

*Result

 

Figure 4 : top sub-policy

5개의 top sub-policy를 찾아내어 dataset에 적용하여 실험. 이 policy들은 learned augmentation policy라고 부름.

good policy에서 가장 흔히 사용한 operation

  1. Rotate - 이미지 회전
  2. Equalize - pixel value의 histogram을 flatten
  3. BBox_only_TranslateY - bbox내의 이미지를 translation한 것

 

Figure 5 : Result1

 

Figure 6 : Result2

 

위 그림은 learned augmenation policy가 dataset의 크기가 적은 경우에 큰 효과를 보인다는 실험결과.

 

 

Figure 7 : Result3

 

mAP75 평가지표에서 효과가 좋음. learned augmentation policy를 적용하면 모델이 정교하게 바운딩 박스를 예측한다.

 

*Reference

[1] https://arxiv.org/pdf/1906.11172.pdf

[2] https://hellopotatoworld.tistory.com/5

 

[포테이토 논문 리뷰] Learning Data Augmentation Strategies for Object Detection

⋆ 。 ˚ ☁︎ ˚ 。 ⋆ 。 ˚ ☽ ˚ 。 ⋆ [Data Augmentation/Object Detection paper review] Classification에서의 Data Augmentation은 많이 다뤄봤지만 Object Detection에서는 구체적으로 어떻게 이뤄지는..

hellopotatoworld.tistory.com

[3] https://deep-learning-study.tistory.com/705

 

[논문 읽기] (2019) Learning Data Augmentation Strategies for Object Detection

 안녕하세요, 오늘 읽은 논문은 Learning Data Augmentation Strategies for Object Detection 입니다.  classification에서 사용하는 augmentation(horizontal flip, resize)을 object detection에 적용하는..

deep-learning-study.tistory.com

 

'Paper review' 카테고리의 다른 글

MobileNetV2 : Inverted Residuals and Linear Bottlenecks  (0) 2022.01.18