dplyr로 데이터 요약하기
아래와 같이 입력하여 구매건수의 평균 구한다.
매출 %>% summarise(mean(구매건수))
mean(구매건수) 1 24552.9
아래의 코드와 거의 동일하다.
mean(매출$구매건수)
[1] 24552.9
filter()
와 summarise()
chain으로 연결하기
다음과 같이 입력하여 1월달 구매건수의 평균 구한다.
매출 %>%
filter(매출월 == 1) %>%
summarise(mean(구매건수))
mean(구매건수) 1 24347.91
1월달 평균 구매건수 24347.91
이 결과로 나온다
결과창 추가 설명
+
: 식이 아직 끝나지 않았다 뒤에 이어서 써라
>
: 명령을 기다린다
평균과 합계를 한번에 구하기
chain을 걸지 말고 summarise
안에 ,
와 함께 sum
을 추가한다.
다음과 같이 입력한다.
매출 %>%
filter(매출월 == 1) %>%
summarise(mean(구매건수) , sum(구매건수))
mean(구매건수) sum(구매건수) 1 24347.91 5113061
1월달의 평균 구매건수 24347.91
과 구매건수의 합 51130161
함께 결과로 나온다.
최댓값, 최솟값을 한번에 구하기
최댓값과 최솟값도 위와 같은 방법으로 구한다.
아래와 같이 입력한다.
매출 %>%
filter(매출월 == 1) %>%
summarise(min(구매건수) , max(구매건수))
min(구매건수) max(구매건수) 1 427 49867
1월 달의 최소 구매건수 427
과 최대 구매건수 49867
이 함께 결과로 나온다.
summarise()
안의 변수 지정
최소값과 최대값의 변수를 지정한다
- 최소
= min(구매건수)
- 최대
= max(구매건수)
매출 %>%
filter(매출월 == 1) %>%
summarise(최소 = min(구매건수) , 최대 = max(구매건수))
최소 최대 1 427 49867