영화 데이터 전처리
추천 관련 패키지 불러오기
library(recommenderlab)
데이터 불러오기
m <- read.csv('MovieLense.csv', stringsAsFactors = F)
SPARSE(NA가 많은)한 데이터를 R에서 잘 다룰 수 있도록 데이터 타입 변경하기
m <- as(m, 'matrix')
m <- as(m, 'realRatingMatrix')
colMeans(m)
m
평점 추출하기
getRatings(m)
모든 사용자의 평점 알아보기
hist(getRatings(m))
summary(getRatings(m))
각 사용자의 평점을 각 사용자별로 평균을 빼준 뒤 (mean centering) 평점 알아보기
hist(getRatings(normalize(m, method = 'center')))
summary(getRatings(normalize(m, method = 'center')))
각 사용자의 평점을 각 사용자별로 표준화 한 뒤 평점 알아보기
hist(getRatings(normalize(m, method = 'Z-score')))
summary(getRatings(normalize(m, method = 'Z-score')))