Overfitting / Underfitting

overfitting 과 underfitting을 보려면 learning curve 그래프를 확인해야합니다.

[Learning curve]

성능이 비슷하면 ‘오컴의 면도날’로 간단한 모델을 선택한다.

underfitting: 모델을 다시 만드는게 좋다.
overfitting: validation이 학습될수록 올라간다.
- 데이터를 늘린다.
- 모델을 간단히 한다.
- feature selection (차원 축소)
- deeplearning: layer, node 줄인다. (dropout)

안타깝지만 어떤 모델의 (층의 개수나 뉴런 개수에 해당하는) 적절한 크기나 구조를 결정하는 마법같은 공식은 없다. 모델링은 다양한 시도를 통해 최적의 모델링을 찾아야한다.

딥로닝은 성능이 좋지만, 과적합되기가 쉽다.

[overfitting 막는 법]

layers 에서 패널티를 줘서 과적합을 막을 수 있다.

kernel_regularizer (l1 (

), l2 (x2+y2))

cross_validation

dropout
layer 뒤에 추가 가능. activation 뒤에 추가 가능. 0.2 (20%)를 랜덤으로 빼버린다는 것. 학습속도가 느리다.

matplotlib에서 (state machine) - 앞에 있는 가장 가까운거 붙어서 하는 것 -> tf.keras.layers.Dropout(0.2) (앞에 Dense 붙어서 실행)

Early stopping

Ensemble

bagging
random boostrap 방법으로 샘플을 여러 번 뽑아 각 모델을 학습시켜 결과를 집계하는 방식이다.
boosting
성능 안좋은 것에 가중치줘서 학습시키는 것
stacking
A 알고리즘, B 알고리즘, C 알고리즘을 또 학습시켜서 나온결과로 또 학습시키는 것이다. 하지만 단점은 시간, 비용 문제이다.

[Machine learning] Over/Underfitting