데이터 프레임
데이터 프레임에서 가로는 행(row)라고 하고 세로는 열(column)이라고 한다.
데이터 분석하는 사람들의 약속이자 관행: - 세로, 열에는 변수를 입력 - 데이터 한건 한건은 행 입력
하나의 열은 하나의 벡터이다. 즉, 매출월 벡터, 요일 벡터, 점포벡터, 성별 벡터, 구매 건수 벡터 인것 이다.
컬럼명
names()
를 통해 데이트 프레임의 컬럼명을 확인한다.
매출월, 요일, 점포, 성별, 구매건수
5가지 컬럼명을 확인 할 수 있다.
names(매출)
[1] "매출월" "요일" "점포" "성별" "구매건수"
데이터의 전체 데이터 형태 확인하기: dim( )
함수
dim()
을 통해 전체 데이터의 형태(행 ,열)를 확인한다.
[1] 2520 5
은 매출 데이터가 2520행 5열의 형태라는 뜻이다.
dim(매출)
[1] 2520 5
하나의 열벡터 출력하기
데이터 프레임$변수
$
뒤에 나오는 변수열을 벡터로 보여준다.
매출$구매건수
[1] 21451 24922 8835 13720 10826 43319 2471 10457 17081 18583 6833 33803 [13] 2265 32637 49704 33882 45928 23123 28571 22597 8386 3414 44846 13692 [25] 46510 27044 34966 41706 615 48015 34036 4238 48480 5802 43844 19384 [37] 45484 37483 43539 28638 45173 10102 34339 20495 47135 29043 31131 43904 [49] 4965 47399 26026 38362 24443 5040 25888 29762 10173 15292 4994 16475 ...
벡터로 다룰 수 있다.
[1:10]
로 구매건수의 1행부터 10행까지 10개의 원소 벡터가 출력된다.
매출$구매건수[1:10]
[1] 21451 24922 8835 13720 10826 43319 2471 10457 17081 18583
데이터 프레임 인덱싱
[행, 열]
으로 조작한다.
[행, 열]
에서 열을 c('열 이름1', '열 이름2',,)
형태로 직접 입력하여 인덱싱 할 수 있다.
매출 데이터 프래임의 행은 1행부터 10행, 열은 1열부터 3열까지 슬라이싱한다.
매출[1:10, 1:3]
매출월 요일 점포 1 1 월 a 2 1 화 b 3 1 수 c 4 1 목 d 5 1 금 e 6 1 토 f 7 1 일 g 8 1 월 h 9 1 화 i 10 1 수 j
슬라이싱 결과를 매출일부
변수에 저장한다
매출일부 = 매출[1:10, 1:3]
매출건수는 각 10건씩, 열은 점포
와 구매건수
를 뽑아 매출일부
에 저장한다.
매출일부 = 매출[1:10, c('점포', '구매건수')]