영화 데이터 전처리 :: 추천 시스템: 원리와 구현 - mindscale
Skip to content

영화 데이터 전처리

추천 관련 패키지 불러오기

library(recommenderlab)

데이터 불러오기

m <- read.csv('MovieLense.csv', stringsAsFactors = F)

SPARSE(NA가 많은)한 데이터를 R에서 잘 다룰 수 있도록 데이터 타입 변경하기

m <- as(m, 'matrix')
m <- as(m, 'realRatingMatrix')
colMeans(m)
m

평점 추출하기

getRatings(m)

모든 사용자의 평점 알아보기

hist(getRatings(m))
summary(getRatings(m))

각 사용자의 평점을 각 사용자별로 평균을 빼준 뒤 (mean centering) 평점 알아보기

hist(getRatings(normalize(m, method = 'center')))
summary(getRatings(normalize(m, method = 'center')))

각 사용자의 평점을 각 사용자별로 표준화 한 뒤 평점 알아보기

hist(getRatings(normalize(m, method = 'Z-score')))
summary(getRatings(normalize(m, method = 'Z-score')))