[Week2] DL Basic - MLP(Multi-Layer-Perceptron) [Day1]

*Introduction

1. Data

2. Model

3. Loss

4. Algorithm(Optimization)

모델과 데이터와 loss function이 정해져있을때 네트워크를 어떻게 줄일지에 대한 부분
SGD, Momentum, NAG, Adagrad, Adadelta, RMSprop
Optimization의 각 특성을 이해하는것이 중요
Regularizer - 학습에 관여하여 Out of data에 대한 정확도를 높이기 위함
- Dropout, Early stopping, k-fold validation, Weight decay, Batch normalization, MixUp, Ensemble, Bayesian Optimization

Simple Example :
- w라는 스칼라와 x의곱으로 b라는 바이어스를 1차 선형식 yhat을 정의하여 실제 모델에 근사하는 w,b를 찾는것이 목적
- MSE로 Loss를 정의하고 실제 y와 모델 yhat의 차이를 줄여나감
- 데이터가 적고, 모델이 linear하고, loss가 convex인 경우 위와 같이 쉽게 찾을 수 있지만 그렇지 않다면? =>backpropagation : loss function을 줄이는 것이 목표이므로 각 파라미터 미분하여 줄어드는 방향으로 학습
Beyond Linear Neural Networks
- 선형결합 n번 행렬곱을 반복하는것은 1단짜리 Neural Network와 다를게 없음
- 따라서 nonlinear transform을 활용함. => activation function : sigmoid, tanh, ReLU 등
  Activation function

Multi-Layer Perceptron(MLP)
- X,W -> affine transformation -> nonlinear transform(hidden vector) -> affine transformation
- 1단 이상의 hidden layer

*Cross-Entropy

[Week2] DL Basic - Generative Models [Day5] (0)	2021.08.13
[Week2] DL Basic - Transformer [Day4] (0)	2021.08.12
[Week2] DL Basic - RNN [Day4] (0)	2021.08.12
[Week2] DL Basic - CNN [Day3] (0)	2021.08.11
[Week2] DL Basic - Optimization [Day2] (0)	2021.08.10