R 완전 기초

R을 완전 기초부터 시작합니다


수강중

25. ggplot2 축 숫자 형식

매출 데이터에서 매출월점포구매건수의 합계를 구한다.

아래와 같이 입력한다. 한줄한줄 코드를 실행되야 정상적으로 처리가 된다.

점포월매출 = 매출 %>%
    group_by(매출월, 점포) %>%
    summarise(합계 = sum(구매건수))

qplot 로 그래프 그리기

데이터는 점포월매출 데이터를 사용한다.

geom = 'line'을 이용해 선 그래프를 그리고 color를 이용해 점포별로 색깔을 다르게 구별해준다.

qplot(매출월, 합계, data = 점포월매출, geom = 'line', color = 점포)

그래프 가로축 지정

기존에 저장했던 변수 월가로축을 이용해 가로축을 지정해준다.

qplot(매출월, 합계, data = 점포월매출, geom = 'line', color = 점포) + 월가로축

그래프 세로축 지정

scientific notation을 일반숫자로 표기법으로 변환.

scale_y_continuous을 이용해 세로축을 지정해준다.

scientific notation 추가 설명

5e+05 표기는 scientific notation으로 매우 큰숫자나 작은숫자를 표기할때 사용한다.
e뒤에 숫자는 0이 몇 개있는지 나타내준다.

seq( ) 함수로 세로 축 지정

seq(200000, 500000, 50000)으로 scientific notification 이 아닌 방법으로 표기 가능하다.

qplot(매출월, 합계, data = 점포월매출, geom = 'line', color = 점포) + 
    scale_y_continuous(breaks = seq(200000, 500000, 50000)) +
    월가로축 + 고딕

50000 단위로 하기 싫으면 약간 복잡한 방법을 사용해야한다

library(scales) 설명

library(scales)는 숫자 표기법에 관련된 여러가지를 모아놓은 것이다.

library(scales)

comma로 1000단위 사용

scales에 정의된 comma를 사용한다. labels = comma라는 옵션을 주면 1000 단위로 끊어서 표기해준다.

qplot(매출월, 합계, data = 점포월매출, geom = 'line', color = 점포) + 
    scale_y_continuous(labels = comma) +
    월가로축 + 고딕

format_format 함수 사용

format_format(scientific = F) 라는 옵션을 이용해 콤마 없는 숫자로 표기한다

qplot(매출월, 합계, data = 점포월매출, geom = 'line', color = 점포) + 
    scale_y_continuous(labels = format_format(scientific = F)) +
    월가로축 + 고딕