예측 분석

데이터를 이용해 예측 분석을 하는 방법을 알아봅니다


수강중

9. 자료 불러오기

워킹 디렉토리 설정

자료를 불러오기에 앞서 워킹 디렉토리를 설정합니다.

  • session -> set working directory -> choose directory

패키지

설치

install.packages('caret', dependencies = c('Depends', 'Suggests'))
install.packages('corrplot')

불러오기

library(caret)
library(corrplot)
library(e1071)
library(kernlab)

데이터 불러오기

실습용 데이터 다운로드

wine.data

  • 와인의 종류를 예측하는 데이터
  • 세 종류의 와인

컬럼 이름 지정

colname <- c('Class','Alcohol', 'Malic acid', 'Ash', 'Alcalinity of ash', 'Magnesium', 'Total phenols', 'Flavanoids', 'Nonflavanoid phenols', 'Proanthocyanisns', 'Color intensity', 'Hue', 'OD280', 'Proline')

데이터 읽기 및 수정

dat <- read.table('wine.data.txt', header = F, sep = ',', col.names = colname)
dat$Class <- as.factor(dat$Class) # Class가 숫자로 되어 있기 때문에 서로 다른 집단으로 설정하기 위해 factor로 설정
levels(dat$Class) <- c('w1', 'w2', 'w3') # factor의 level 변경 (1, 2, 3 -> w1, w2, w3)

데이터 확인

unique(dat$Class) # Class 변수의 유니크 값 확인
View(dat) # 엑셀 형태로 데이터 확인
str(dat) # 각각의 변수들의 형태 등 정보 확인
head(dat) # 위 데이터 6개 정도 보여줌
table(dat$Class) # 균형 확인