R 완전 기초

R을 완전 기초부터 시작합니다


수강중

21. dplyr로 데이터 그룹 짓기

group_by을 사용하여 매출월별로 구매건수의 최대 최소를 구한다.

매출 %>% 
    group_by(매출월) %>%
    summarise(최소 = min(구매건수) , 최대 = max(구매건수))
   매출월 최소 최대 
1   1     427  49867
2   2     659  49812
3   3     103  49841
4   4      79  49953
5   5       9  49881
6   6     287  49887
7   7     119  49710
8   8      93  49887
9   9     373  49976
10 10      40  49910
11 11     503  49432
12 12     266  49936

a 점포에 대한 filter추가하기.

매출 %>% 
    filter(점포 == 'a') %>%
    group_by(매출월) %>%
    summarise(최소 = min(구매건수) , 최대 = max(구매건수))
   매출월 최소 최대 
1   1     2688 34036
2   2     3312 46754
3   3     2207 49269
4   4     5292 49118
5   5     4809 48131
6   6     5036 44950
7   7     5798 44715
8   8     1762 49040
9   9     3658 43590
10 10     4793 43553
11 11     1575 43931
12 12      283 49936

group_by(매출월, 성별)을 하게 되면 월별, 성별로 그룹을 지어준다.

매출 %>% 
    group_by(매출월, 성별) %>%
    summarise(최소 = min(구매건수) , 최대 = max(구매건수))
   매출월 성별 최소 최대 
1   1     남    615 49704
2   1     여    427 49867
3   2     남    659 49710
4   2     여    672 49812
5   3     남    103 49841
6   3     여    337 49600
7   4     남     79 49436
8   4     여    846 49953
9   5     남    462 49881
10  5     여      9 49864
11  6     남    870 49887
12  6     여    287 48928
13  7     남    119 49051
14  7     여    670 49710
15  8     남    957 49887
16  8     여     93 49591
17  9     남    959 49435
18  9     여    373 49976
19 10     남    319 49910
20 10     여     40 49630
21 11     남    503 49006
22 11     여   1020 49432
23 12     남    272 49936
24 12     여    266 49831

결과가 길어 콘솔창에 출력되지 않을 때는 View 함수를 체인에 추가한다.

매출 %>% 
    group_by('매출월', '성별') %>%
    summarise('최소' = min('구매건수') , '최대' = max('구매건수')) %>%
View

체인의 결과를 남녀월매출 변수에 저장한다.

남녀월매출 = 매출 %>% 
    group_by('매출월', '성별') %>%
    summarise('최소' = min('구매건수') , '최대' = max('구매건수'))