본문 바로가기

부스트캠프 AI Tech

(42)
[Week12] Semantic Segmentation 1. 대표적인 딥러닝을 이용한 세그멘테이션 FCN 1.1 Abstact Segmentation에서는 대표적인 CNN을 backbone으로 활용한다. predtrained backbone 모델을 활용하면 시간도 절약하고 성능도 좋음. ex) VGG, Alexnet ... 1.2 Fully Connected Layer vs Convolution Layer Segmentation은 FC layer를 Convolution layer로 바꾼다. Flatten을 하지 않기 때문에 위치정보를 그대로 반영할 수 있음. Classification에서는 위치는 관계없이 특징만을 필요로 했지만 Segmentation에서는 픽셀의 위치정보가 중요하기 때문에 Convolution layer를 활용한다. 1x1 Convoluti..
[Week10] Object Detection (2) *Advanced Object Detection 1 1. Cascade RCNN 기존 Faster-RCNN에서는 RPN에서 0.7이상의 IoU를 갖는 anchor box를 Positive sample, 0.3이하의 IoU는 Negative sample로 정의, Head Network에서는 0.5이상을 positive, 0.5미만을 negative로 정의했음. 하지만 이 IoU 기준을 정하는 명확한 기준이 없었기 때문에 IoU threshold를 바꿔보면 성능이 어떻게 바뀔지에 집중한것이 Cascade RCNN이다 IoU를 0.7로 바꾸었을때 False positive가 줄어드는것을 볼 수 있음. Localization Performance x축 : RPN을 통과한 box가 GT와 갖는 IoU값 y축 : ..
[Week9] Object Detection - EfficientDet [Day3] 1.Efficient in Object Detection 1.1 Model scaling model이 deep 해질수록 좋은 성능을 가져오게 됐음 but, 어느정도 깊어지면 더이상 성능개선이 어려움 얼마나 깊게 잘 쌓는지가 중요해짐 (e) compound scailing 에서 깊고, 넓게 또, high resolution으로 model을 개선시켜왔음 heuristic방법의 한계를 겪음 1.2 등장배경 따라서 더 높은 정확도와 효율성을 가지면서 convnet의 크기를 키우는 방법을 연구 너비, 깊이, 해상도 모든 차원에서의 균형을 맞추는 것이 중요하다는 것을 알게 됨. 이러한 균형은 각각의 크기를 일정한 비율로 확장하는 것으로 달성할 수 있었다고 함 1.3 Accuracy & Efficiency 낮은 FL..
[Week9] Object Detection - 1 stage detector [Day3] 1. 1 Stage Detectors *2 stage Detectors RCNN, FastRCNN, SPPNet, FasterRCNN ... Localization (후보 영역 찾기) Classification (후보 영역에 대한 분류) Limitation : 속도가 매우 느림 Real World에서 응용 가능한 Object Detectors는 없을까? *2 stage detectors vs 1 stage detectors *1 stage Detectors Localization, Classification이 동시에 진행 전체 이미지에 대해 특징 추출, 객체 검출이 이루어짐 → 간단하고 쉬운 디자인 속도가 매우 빠름 (Real-time detection) 영역을 추출하지 않고 전체 이미지를 보기 때문에 ..
[Special Mission3] Detectron2 튜토리얼 *Detectron2 이란? Detectron2는 Facebook AI Research(FAIR)에서 개발한 Pytorch 기반의 Object Detection, Segmentation 라이브러리이다. MMDetection과 마찬가지로 모듈식으로 작동한다. *Run a pre-trained detectron2 model https://colab.research.google.com/drive/16jcaJoc6bCFAQ96jDe2HwtXj7BMD_-m5#scrollTo=7unkuuiqLdqd 1) COCO 형식의 이미지 준비 2) Config와 DefaultPredictor 생성, Inference 하기 3) 결과 시각화하기 *Use Builtin Datasets 데이터셋들은 DETECTRON2_DATASE..
[Week9] Object Detection - Neck [Day2] 1. Neck 1.1 Overview History Neck은 무엇인가? 위는 기존 2-stage 방식 backbone의 마지막 feature map을 RPN에 통과시키게 됨 근데 왜 마지막 feature map을 활용해야 할까? => 중간의 feature map들도 활용해보자 Neck은 왜 필요한가? low-level의 feature map은 선, 점, 기울기 등의 정보와 작은 객체를 잘 표현 high-level의 feature map은 object의 semantic한 정보와 큰 객체를 잘 표현 따라서 Neck을 활용하여 두 정보를 다 활용 다양한 크기의 객체를 더 잘 탐지 하게 됨 그렇다면 Neck을 활용하지 않고 여러 level에서의 feature map을 활용하면 되지 않냐? Neck을 활용하여 ..
[Week9] Object Detection - library [Day2] 1. Object Detection을 위한 라이브러리 통합된 라이브러리의 부재 실무 / 캐글에서는 아래 두 라이브러리를 주로 활용 MMDetection Detectron2 2. MMDetection Pytorch 기반의 Object Detection 오픈소스 라이브러리 Pipeline 2 Stage 모델은 크게 Backbone / Neck / DenseHead/ RoIHead 모듈로 나눌 수 있음 각각의 모듈 단위로 커스터마이징 위 시스템은 config 파일을 이용해 통제 Backbone - 입력 이미지를 특징 맵으로 변형 Neck - backbone과 head를 연결, Feature map을 재구성 (FPN) DenseHead - 특징 맵의 dense location을 수행하는 부분 RoIHead - ..
[Week8] 특강 [Day2] *자연어 처리를 위한 언어 모델의 학습과 평가 1.언어 모델링 (Language Modeling) 주어진 문맥을 활용해 다음에 나타날 단어 예측하기 양방향 언어 모델링(Bidirectional Language Modeling) Deep contextualized word representations (NAACL 2018) Embeddings from Language Models (ELMo) Foward LM 에서 문맥의 순방향으로 학습 Backward LM 에서 문맥의 역방향으로 학습 이후 BERT가 등장 BERT: Bidirectional Encoder Representations form Transformers (NAACL 2019) BERT : Pre-training of Deep Bidirecti..