논리
비교 연산자
==
: 같다
!=
: 다르다
>
: 크다
>=
: 크거나 같다
<
: 작다
<=
: 작거나 같다
특정 조건의 데이터만 뽑기 (filtering)
subset()
함수를 이용해 조건에 맞는 데이터만 선택 할 수 있다.
subset(데이터셋, 변수이름 == 숫자나 문자)
매출월이 1월인 데이터만 뽑기
=
이 아닌 ==
임 주의하기
subset(매출, 매출월 == 1)
매출월 요일 점포 성별 구매건수 1 1 월 a 남 21451 2 1 화 b 여 24922 3 1 수 c 남 8835 4 1 목 d 여 13720 ...
매출월이 1월인 데이터만 뽑혔음을 확인 할 수 있다.
요일이 월요인인 데이터만 뽑기
숫자가 아닌 문자열은 항상 ''
안에 넣어줘야 한다
subset(매출, 요일 == '월')
매출월 요일 점포 성별 구매건수 1 1 월 a 남 21451 8 1 월 h 여 10457 15 1 월 o 남 49704 22 1 월 g 여 3414 ...
요일이 월요인인 데이터만 뽑혔음을 확인 할 수 있다.
성별이 여성인 데이터만 뽑기
subset(매출, 성별 == '여')
매출월 요일 점포 성별 구매건수 2 1 화 b 여 24922 4 1 목 d 여 13720 6 1 토 f 여 43319 8 1 월 h 여 10457 ...
성별이 여성인 데이터만 뽑혔음을 확인 할 수 있다.
구매건수가 100미만인 데이터만 뽑기
subset(매출, 구매건수 < 100)
매출월 요일 점포 성별 구매건수 783 4 토 c 남 79 868 5 일 m 여 9 1610 8 일 e 여 93 1960 10 일 j 여 40 ...
구매건수가 100미만인 데이터만 뽑혔음을 확인 할 수 있다.
구매건수가 49900초과인 데이터만 뽑기
subset(매출, 구매건수 > 49900)
매출월 요일 점포 성별 구매건수 728 4 일 h 여 49953 1788 9 수 c 여 49976 1939 10 일 d 남 49910 2371 12 금 a 남 49936 ...
구매건수가 49900초과인 데이터만 뽑혔음을 확인 할 수 있다.
논리에 대한 설명
매출월 == 1, 요일 == '월', 성별 == '여', 구매건수 < 100, 구매건수 > 49900
모두 참과 거짓을 따지는 조건으로서 논리에 해당된다.
참과 거짓
TRUE
나 T
: 참
FALSE
나 F
: 거짓
같다/ 다르다
1 == 1
입력한다. 1 과 1 은 동일하기 때문에 참인 논리이고 TRUE
가 나온다.
1 == 1
1 == 2
입력한다. 1 과 2는 다르기 때문에 거짓인 논리고 FALSE
가 나온다.
1 == 2
1 != 2
입력한다. 1 과 2 은 다르기 때문에 참인 논리이고 TRUE
가 나온다.
1 != 2
1 != 1
입력한다. 1 과 1은 동일하기 때문에 거짓인 논리고 FALSE
가 나온다.
1 != 1
크다/작다
2 > 1
입력한다. 참인 논리이고 TRUE
가 나온다.
2 > 1
1 > 2
입력한다. 거짓인 논리고 FALSE
가 나온다.
1 > 2
1 < 2
입력한다. 참인 논리이고 TRUE
가 나온다.
1 < 2
2 < 1
입력한다. 거짓인 논리고 FALSE
가 나온다.
2 < 1
크거나 같다/ 작거나 같다
2 >= 1
입력한다. 참인 논리이고 TRUE
가 나온다.
2 >= 1
1 >= 2
입력한다. 거짓인 논리고 FALSE
가 나온다.
1 >= 2
1 >= 1
입력한다. 참인 논리이고 TRUE
가 나온다.
1 >= 1
2 <= 3
입력한다. 참인 논리이고 TRUE
가 나온다.
2 <= 3
논리 연산자
참과 거짓을 따지는 조건이 두가지 이상일 때, 논리 연산자를 이용한다.
&
: and , 두가지 조건을 모두 만족
|
: or , 두가지 조건중 어느 하나라도 만족
%in%
: 벡터의 값 존재 여부
!
: 부정
매출월이 1월이고 구매건수가 40000 초과하는 데이터 뽑기
&
을 사용하여 두 조건이 모두 TRUE
인 데이터만 출력이 된다.
subset(매출, 매출월 == 1 & 구매건수 > 40000)
매출월 요일 점포 성별 구매건수 6 1 토 f 여 43319 15 1 월 o 남 49704 17 1 수 b 남 45928 23 1 화 h 남 44846 ...
구매건수가 100 미만이거나 49900 초과하는 데이터 뽑기
|
을 사용하여 두 조건중 어느 하나라도 TRUE
인 데이터가 출력이 된다.
subset(매출, 구매건수 < 100 | 구매건수 > 49900)
매출월 요일 점포 성별 구매건수 728 4 일 h 여 49953 783 4 토 c 남 79 868 5 일 m 여 9 1610 8 일 e 여 93 ...
월, 화, 수요일 데이터 뽑기
%in%
을 사용하여 월, 화, 수
벡터값의 존재 여부를 확인해서 TRUE인 데이터만 출력이 된다.
subset(매출, 요일 %in% c('월', '화', '수'))
매출월 요일 점포 성별 구매건수 1 1 월 a 남 21451 2 1 화 b 여 24922 3 1 수 c 남 8835 8 1 월 h 여 10457 ...
월,화,수요일이 아닌 데이터 뽑기
!
을 사용하여 월, 화, 수
벡터값이 아닌 목,금,토,일
데이터만 출력이 된다.