예측 분석

데이터를 이용해 예측 분석을 하는 방법을 알아봅니다


수강중

15. 모형 적합 - K Nearest Neighbors

K-Nearest Neighbors

  • 새로운 자료를 예측할 때 기존의 자료와 유사한 것을 기반으로 예측
  • Tuning parameter: N
  • 적절한 거리에 있는 자료들을 바탕으로 예측하는 것이 중요함
  • 빠르고 간단하며 이해하기 쉬움
  • 빈 자료를 채워 넣을 때도 사용하기도 함

실습

cross validation

controlObject <- trainControl(method = 'repeatedcv', # cross validation 반복 시행
                              repeats = 2, # 2번 시행
                              number = 5, # training 자료를  10조각 냄
                              classProbs = T)

모형 학습

Knn_Model <- train(Class ~ .,
                   data = Train_dat,
                   method = 'knn',
                   preProc = c('center', 'scale'),
                   metric = 'Kappa',
                   tuneGrid = data.frame(.k = 1:10), # tuning parameter가 하나이기 때문에 data frame으로 바로 넣을 수 있음
                   trControl = controlObject)
Knn_Model