차원의 저주(curse of demensionality)
- 차원의 저주란 저차원 데이터 이용할 때는 발생하지 않다가 고차원 데이터를 이용할 때 발생하는 현상이다.
- 머신러닝에서는 고차원 데이터를 이용한 모델이 저차원 데이터를 이용한 모델보다 성능이 낮아지는 현상을 의미한다.
- 데이터의 차원이 증가할 수록 해당 공간의 크기가 증가하여 데이터의 밀도가 희박해진다.
- 차원의 저주를 해결하는 법
- 훈련 샘플의 밀도가 높아질 때까지 훈련데이터의 크기를 키운다.
- Feature selection이나 feature extraction을 통해 차원을 축소한다.
Comments