[Week6] CV - Image Classification Ⅰ[Day1]

*What is computer vision?

Machine Learning -> Deep Learning 패러다임 변화
- Feature extraction을 자동적으로 수행하여 사람이 미처 보지 못한 특징들을 알아낼 수 있음

*Fundamental image tasks

*What is classification

classifier
세상의 모든 데이터를 가지고 있다면 k-NN 으로 분류 문제를 해결할 수 있음

k-NN algorithm
하지만 세상의 방대한 양의 모든 데이터를 활용할 수 없기 때문에 제한된 복잡도 내에 데이터를 녹여넣어야함 따라서 Convolutional Neural Networks (CNN)을 활용함.
Weight는 image사이즈로 표현하면 다음과 같이 나타남
- 최종적인 score를 통해 분류
- layer가 한층이라 단순해서 w와 같은 평균이미지들 이외에는 표현이 불가함 - problem(1)
- Training time과 Test time의 이미지의 변화가 있을때 에러가 발생할 수 있음 - problem(2)
Locally connected neural networks
- 위 두가지 문제를 해결할 수 있음
- 국부적인 영역들만 connection을 고려한 layer
- local feature learning
- parameter sharing : 파라미터를 재활용할 수 있기 때문에 더 적은 파라미터로 효과적인 특징 추출 -> overfitting방지

1. Data augmentation

2. Leveragin pre-trained information

데이터를 적게 쓰고 좋은 성능을 발휘하기 위해 다른 데이터셋에서 학습된 정보를 어떻게 활용할 수 있을까?
Supervised learning은 매우 큰 데이터셋을 요구함.
데이터 annotating은 큰 비용을 요구하고, 퀄리티를 보장하지 못함
Transfer learning : 스몰 데이터셋에서 효과적인 학습 방법. 기존에 미리 학습시켜 놓은 사전치를 활용해서 연관된 task에 스몰 데이터로도 효과적인 성능을 보일 수 있음.

*Transfer learning

Approach 1 : Transfer Knowledge from a pre-trained task to a new task
- 기존 10개 클레스로 사전 학습된 모델이 있을때, FC레이어 앞부분은 freeze한 채 FC레이어 weight만 업데이트
Approach 2 : Fine-tuning the whole model
- Approach1과는 다르게 Convolution layers 를 freeze하지 않고 low learning rate을 줘서 느리게 학습하고, FC layers는 high learning rate으로 빠르게 학습함

*Knowledge distillation

3. Leveraging unlabeled dataset for training

*Semi-supervised learning

supervised learning은 대규모의 데이터를 labeling하는데에 한계가 있음
하지만, 온라인에 존재하는 unlabeled data는 무궁무진함
따라서 labeled, unlabeled data를 둘다 활용
Workflow
1. labeled dataset으로 model을 학습시킴
2. unlabeled dataset을 model을 통해 pseudo-labeled dataset을 구축
3. labeled dataset과 pseudo-labeled dataset을 합쳐서 다시 model training

*Self-training

[Week6] Object Detection [Day5] (0)	2021.09.10
[Week6] Semantic segmentation [Day4] (0)	2021.09.09
[Week6] CV - Image Classification Ⅱ [Day3] (0)	2021.09.08

백chef