생존분석

데이터를 이용해 사건이 언제(when) 일어나는지 예측하는 방법을 알아봅니다


수강중

6. 데이터 살펴보기

데이터 불러오기

sales <- read.csv('sales.csv',
                  stringsAsFactors = F,
                  fileEncoding = 'UTF-8')
head(sales)

데이터 탐색하기

library(dplyr)
nrow(sales)
sales$성별 %>% table 
sales$나이 %>% summary
sales$나이 %>% hist
sales$사용일 %>% hist
sales$사용일 %>% summary
sales$구매여부 %>% table
833/1895
sales$구매여부 %>% mean

유료고객과 무료고객을 나누어 살펴보기

sales.y <- sales %>% filter(구매여부 == 1)
sales.n <- sales %>% filter(구매여부 == 0)    

sales.y$사용일 %>% hist
sales.n$사용일 %>% hist

유료고객 중 성별을 나누어 살펴보기

sales.y %>% 
    filter(성별 == '남') %>%
    .$사용일 %>%
    hist

sales.y %>% 
    filter(성별 == '여') %>%
    .$사용일 %>%
    hist