R 완전 기초

R을 완전 기초부터 시작합니다


수강중

12. 데이터 프레임

데이터 프레임에서 가로는 행(row)라고 하고 세로는 열(column)이라고 한다.

데이터 분석하는 사람들의 약속이자 관행:

  • 세로, 열에는 변수를 입력
  • 데이터 한건 한건은 행 입력

하나의 은 하나의 벡터이다. 즉, 매출월 벡터, 요일 벡터, 점포벡터, 성별 벡터, 구매 건수 벡터 인것 이다.

컬럼명

names()를 통해 데이트 프레임의 컬럼명을 확인한다.

매출월, 요일, 점포, 성별, 구매건수 5가지 컬럼명을 확인 할 수 있다.

names(매출)
[1] "매출월"   "요일"     "점포"     "성별"     "구매건수"

데이터의 전체 데이터 형태 확인하기: dim( ) 함수

dim()을 통해 전체 데이터의 형태(행 ,열)를 확인한다.

[1] 2520 5은 매출 데이터가 2520행 5열의 형태라는 뜻이다.

dim(매출)
[1] 2520    5

하나의 열벡터 출력하기

데이터 프레임$변수

$ 뒤에 나오는 변수열을 벡터로 보여준다.

매출$구매건수
   [1] 21451 24922  8835 13720 10826 43319  2471 10457 17081 18583  6833 33803
  [13]  2265 32637 49704 33882 45928 23123 28571 22597  8386  3414 44846 13692
  [25] 46510 27044 34966 41706   615 48015 34036  4238 48480  5802 43844 19384
  [37] 45484 37483 43539 28638 45173 10102 34339 20495 47135 29043 31131 43904
  [49]  4965 47399 26026 38362 24443  5040 25888 29762 10173 15292  4994 16475

벡터로 다룰 수 있다.

[1:10]로 구매건수의 1행부터 10행까지 10개의 원소 벡터가 출력된다.

매출$구매건수[1:10]
 [1] 21451 24922  8835 13720 10826 43319  2471 10457 17081 18583

데이터 프레임 인덱싱

[행, 열]으로 조작한다.

[행, 열]에서 열을 c('열 이름1', '열 이름2',,) 형태로 직접 입력하여 인덱싱 할 수 있다.

매출 데이터 프래임의 행은 1행부터 10행, 열은 1열부터 3열까지 슬라이싱한다.

매출[1:10, 1:3]
   매출월 요일 점포
1  1      월   a   
2  1      화   b   
3  1      수   c   
4  1      목   d   
5  1      금   e   
6  1      토   f   
7  1      일   g   
8  1      월   h   
9  1      화   i   
10 1      수   j   

슬라이싱 결과를 매출일부 변수에 저장한다

매출일부 = 매출[1:10, 1:3]

매출건수는 각 10건씩, 열은 점포구매건수를 뽑아 매출일부에 저장한다.

매출일부 = 매출[1:10, c('점포', '구매건수')]