R 완전 기초

R을 완전 기초부터 시작합니다


수강중

20. dplyr로 데이터 요약하기

아래와 같이 입력하여 구매건수의 평균 구한다.

매출 %>% summarise(mean(구매건수))
  mean(구매건수)
1 24552.9       

아래의 코드와 거의 동일하다.

mean(매출$구매건수)
[1] 24552.9

filter()summarise() chain으로 연결하기

다음과 같이 입력하여 1월달 구매건수의 평균 구한다.

매출 %>% 
    filter(매출월 == 1) %>%
    summarise(mean(구매건수))
  mean(구매건수)
1 24347.91      

1월달 평균 구매건수 24347.91이 결과로 나온다

결과창 추가 설명

+ : 식이 아직 끝나지 않았다 뒤에 이어서 써라

> : 명령을 기다린다

평균과 합계를 한번에 구하기

chain을 걸지 말고 summarise 안에 ,와 함께 sum을 추가한다.

다음과 같이 입력한다.

매출 %>% 
    filter(매출월 == 1) %>%
    summarise(mean(구매건수) , sum(구매건수))
  mean(구매건수) sum(구매건수)
1 24347.91       5113061      

1월달의 평균 구매건수 24347.91과 구매건수의 합 51130161 함께 결과로 나온다.

최댓값, 최솟값을 한번에 구하기

최댓값과 최솟값도 위와 같은 방법으로 구한다.

아래와 같이 입력한다.

매출 %>% 
    filter(매출월 == 1) %>%
    summarise(min(구매건수) , max(구매건수))
  min(구매건수) max(구매건수)
1 427           49867        

1월 달의 최소 구매건수 427과 최대 구매건수 49867이 함께 결과로 나온다.

summarise()안의 변수 지정

최소값과 최대값의 변수를 지정한다

  • 최소 = min(구매건수)
  • 최대 = max(구매건수)
매출 %>% 
    filter(매출월 == 1) %>%
    summarise(최소 = min(구매건수) , 최대 = max(구매건수))
  최소 최대 
1 427  49867