모형 적합 - K Nearest Neighbors
K-Nearest Neighbors
- 새로운 자료를 예측할 때 기존의 자료와 유사한 것을 기반으로 예측
- Tuning parameter: N
- 적절한 거리에 있는 자료들을 바탕으로 예측하는 것이 중요함
- 빠르고 간단하며 이해하기 쉬움
- 빈 자료를 채워 넣을 때도 사용하기도 함
실습
cross validation
controlObject <- trainControl(method = 'repeatedcv', # cross validation 반복 시행
repeats = 2, # 2번 시행
number = 5, # training 자료를 10조각 냄
classProbs = T)
모형 학습
Knn_Model <- train(Class ~ .,
data = Train_dat,
method = 'knn',
preProc = c('center', 'scale'),
metric = 'Kappa',
tuneGrid = data.frame(.k = 1:10), # tuning parameter가 하나이기 때문에 data frame으로 바로 넣을 수 있음
trControl = controlObject)
Knn_Model