본문 바로가기

분류 전체보기

(57)
MobileNetV2 : Inverted Residuals and Linear Bottlenecks *Techniques for Small Deep Neural Networks Remove Fully-Connected Layers Kernel Reduction (3x3 -> 1x1) Channel Reduction Evenly Spaced Downsampling Depthwise Separable Convolutions Shuffle Operations Distillation & Compression -> 수정필요 1. Target Resource ↓ Accuracy ↑ Speed ↑ 2. Key Features Depthwise Seperable Convolutions (MobileNetV1) Linear Bottlenecks Inverted Residuals *Depthwise Seperable C..
[Week12] Semantic Segmentation 1. 대표적인 딥러닝을 이용한 세그멘테이션 FCN 1.1 Abstact Segmentation에서는 대표적인 CNN을 backbone으로 활용한다. predtrained backbone 모델을 활용하면 시간도 절약하고 성능도 좋음. ex) VGG, Alexnet ... 1.2 Fully Connected Layer vs Convolution Layer Segmentation은 FC layer를 Convolution layer로 바꾼다. Flatten을 하지 않기 때문에 위치정보를 그대로 반영할 수 있음. Classification에서는 위치는 관계없이 특징만을 필요로 했지만 Segmentation에서는 픽셀의 위치정보가 중요하기 때문에 Convolution layer를 활용한다. 1x1 Convoluti..
[Week10] Object Detection (2) *Advanced Object Detection 1 1. Cascade RCNN 기존 Faster-RCNN에서는 RPN에서 0.7이상의 IoU를 갖는 anchor box를 Positive sample, 0.3이하의 IoU는 Negative sample로 정의, Head Network에서는 0.5이상을 positive, 0.5미만을 negative로 정의했음. 하지만 이 IoU 기준을 정하는 명확한 기준이 없었기 때문에 IoU threshold를 바꿔보면 성능이 어떻게 바뀔지에 집중한것이 Cascade RCNN이다 IoU를 0.7로 바꾸었을때 False positive가 줄어드는것을 볼 수 있음. Localization Performance x축 : RPN을 통과한 box가 GT와 갖는 IoU값 y축 : ..
[Week11] Object detection (3) - yolov5 실험 결과 *Yolov5 실험 결과 공유 *Model *Experiments configs (50epochs씩 총 4회 진행 : s , m , l , x ) image size : 416 x 416 (default: 640 x 640) batch size : 32 epochs : 50 weights : yolov5s.pt (pretrained weights) optimizer : SGD scheduler : linear LR datasets : stratified train/valid augmentation : Default - Blur(p=0.01) , MedianBlur(p=0.01), ToGray(p=0.01), CLAHE (p=0.01) *Results mAP yolo v5 s : 0.3938 (50epoc..
[Paper review] Learning Data Augmentation Strategies for Object Detection *Introduction Data Augmentation은 일반적으로 학습 데이터가 부족하거나, 데이터를 증강시켜 모델 성능을 개선시킬 때 사용한다. 데이터가 부족한 경우 데이터셋의 특징들을 잘 잡아내지 못할 뿐만 아니라 Overfitting, Underfitting에 빠지기 쉽다. 다음과 같이 원본 이미지에 인위적인 변화를 주고 데이터의 양을 증폭시킬 수 있다. Q1. Object Detection에선 Data Augmentation이 다른가? Image classification에서는 이미 Data Augmenation은 필수적이고, 모델의 큰 성능을 가져오는것이 입증되었다. But, Object Detection에서의 Data Augmenation은 입증된 바가 많지 않음. Why? Object D..
[Week9] Object Detection - EfficientDet [Day3] 1.Efficient in Object Detection 1.1 Model scaling model이 deep 해질수록 좋은 성능을 가져오게 됐음 but, 어느정도 깊어지면 더이상 성능개선이 어려움 얼마나 깊게 잘 쌓는지가 중요해짐 (e) compound scailing 에서 깊고, 넓게 또, high resolution으로 model을 개선시켜왔음 heuristic방법의 한계를 겪음 1.2 등장배경 따라서 더 높은 정확도와 효율성을 가지면서 convnet의 크기를 키우는 방법을 연구 너비, 깊이, 해상도 모든 차원에서의 균형을 맞추는 것이 중요하다는 것을 알게 됨. 이러한 균형은 각각의 크기를 일정한 비율로 확장하는 것으로 달성할 수 있었다고 함 1.3 Accuracy & Efficiency 낮은 FL..
[Week9] Object Detection - 1 stage detector [Day3] 1. 1 Stage Detectors *2 stage Detectors RCNN, FastRCNN, SPPNet, FasterRCNN ... Localization (후보 영역 찾기) Classification (후보 영역에 대한 분류) Limitation : 속도가 매우 느림 Real World에서 응용 가능한 Object Detectors는 없을까? *2 stage detectors vs 1 stage detectors *1 stage Detectors Localization, Classification이 동시에 진행 전체 이미지에 대해 특징 추출, 객체 검출이 이루어짐 → 간단하고 쉬운 디자인 속도가 매우 빠름 (Real-time detection) 영역을 추출하지 않고 전체 이미지를 보기 때문에 ..
[Special Mission3] Detectron2 튜토리얼 *Detectron2 이란? Detectron2는 Facebook AI Research(FAIR)에서 개발한 Pytorch 기반의 Object Detection, Segmentation 라이브러리이다. MMDetection과 마찬가지로 모듈식으로 작동한다. *Run a pre-trained detectron2 model https://colab.research.google.com/drive/16jcaJoc6bCFAQ96jDe2HwtXj7BMD_-m5#scrollTo=7unkuuiqLdqd 1) COCO 형식의 이미지 준비 2) Config와 DefaultPredictor 생성, Inference 하기 3) 결과 시각화하기 *Use Builtin Datasets 데이터셋들은 DETECTRON2_DATASE..