이중차분법
이중차분법
우리가 인과관계를 분석을 해야 될 때가 있는데 예를 들면 광고 같은 거를 할 때 광고를 한 다음에 광고를 한 다음에 매출이 이만큼 되다가 매출이 이렇게 올랐어요.
광고 전 그러면 이거 광고 효과 좋네 라고 생각할 수도 있지만 원래 매출이 이만큼 오를 원래부터 이만큼 오를 거였을 수도 있거든요.
시간 지나면 우리가 그냥 좀 기다리면 매출이 서서히 오르는 추세였는데 광고를 안 했어도 이만큼 올랐을 거였는데 광고를 해서 이만큼 오른 거면 광고 효과가 사실은 없는 거죠.
그래서 우리가 이제 많은 경우에 그런 문제가 있습니다.
뭔가를 해가지고 좋아졌는데 좋아진 게 그걸 해서 좋아진 거냐 아니면 내버려두도 그냥 그렇게 좋아질 거예요.
이런 게 항상 이슈가 있거든요.
그래서 그런 거를 할 때 여러 가지 기법인데 통계의 인과 효과를 확인하는 기법들이 그 중에 하나가 이중차분법이라는 기법 이중차분법은 두 번 뺀다고 해서 이중차분법인데 영어로는 이제 디퍼런스인 디퍼런스 그러니까 차이들 속에서 다시 차이를 찾는 건데 왜 이런 이름이 붙었냐
그러면 그림을 보시면 된다
284쪽 그림을 보시면 여기 위에 있는 게 실험군이에요.
밑에는 이제 대조군 놀리는 간단한데 대조군이 얼마나 변했는지를 보는 거예요.
얘네는 광고를 안 했어요.
광고를 안 했어요.
예를 들어서 우리가 어떤 제품인데 제품 AB가 있는데 A 있는 광고를 하고 B는 광고를 안 했어요.
또는 충감에는 광고를 하고 충북에는 광고를 안 뿌렸어요.
근데 충북에서도 매출이 올랐네.
충북에서도 매출이 올라오고 했으면 그러면 여기서 이제 한 가지 가정을 하는 거예요.
방향 추세의 가정이라고 해서 광고를 안 했어도 그래.
A도 비슷하게 올랐을 거라.
이만큼은 올라갔을 거라.
라고 가정을 하는 거야.
그러면 광고 효과는 얼마만큼이냐면 이만큼이 광고 효과가.
원래는 여기서 출발했기 때문에 이만큼이 매출이 올라갔는데 그 매출 올라간 거를 다 광고 효과로 치는 게 아니고 대조군을 보니까 대조군도 이만큼은 올랐더라.
그러면 실험군도 그만큼은 그냥 올라갔겠지.
그럼 그거보다 더 올라야 되는 거 아니냐.
그게 이 중차분법에 노린다.
그래서 두 번 빼주는 거야.
뭘 빼냐면 실험군하고 대조군 만큼의 차이는 원래 차이 나던 부분입니까?
빼주고 그다음에 대조군에서 이렇게 올라간 이 차이는 시간이 지나면서 저절로 된 거니까 그것도 빼주고 그럼 두 개를 빼주고 나면 남는 이만큼만 광고 효과다
이런 노릇.
그래서 이 중차분법이라고 합니다.
두 번 뺀다고요.
그래서 여기 그림을 보시면 이렇게 갔을 때 이 차이는 원래 실험군하고 대조군 만큼의 차이고 원래 차이 이거는 시간이 지나면서 달라진 거예요.
시간이 흐르면서 대조군에서도 다를 거예요.
이만큼은 실험군에서도 그냥 달라졌을 거예요.
이 두 개를 빼고 남는 부분만 인정하겠다.
두 번 뺀다고 해서 이 중차분법 그러면 여기 이 중차분법 논리를 잘 보시면 기울기가 달라진 게 있죠.
기울기가 이렇게 올라갔어야 되는데 이렇게 되면 기울기가 똑같은데 이만큼 기울기가 추가로 변했잖아요.
그래서 이 중차분법은 사고작용으로 분석할 수가 있습니다.
왜냐하면 결국 이 중차분법의 논리는 기울기가 평행하게 올라가면 효과가 하도 없는 거니까 이 기울기가 더 올라가 본 부분만 효과로 치겠다는 거거든요.
우리가 아까 분석을 할 때 이 5.4가 기울기가 달라지는 부분이에요.
아까 여기 보면은 얘는 이렇게 올라가는데 얘는 이렇게 올라가잖아요.
원래 평행하게 올라갔으면 얘도 이런 식으로 올라갔어야 되는데 이게 이렇게 올라갔다면 그 5.4가 기울기가 더 급한 부분 5.4가 인과적인 효과가 된다.
우리 이제 광고 같은 걸 했다고 하면 이게 광고 전고 이게 광고 후면 여기 나오면 여기 120이 전부 그러니까 광고 효과는 아닌 거죠.
왜냐하면 삐도 가만히 있었는데 30까지는 올라갔으니까 그래서 이 기울기 차이를 광고 효과로 보는 논리를 이 중차분법이라고 그래서 작년에 노벨상 작년인가 제작년 노벨 경제학상 받으신 분들이 카드 앤 크루거인데 이 사람들이 작년 아마 크루거는 일찍 죽었을 거고 카드가 노벨상을 받았는데 이 사람들이 뭘로 노벨상 받으려냐면 그 이 중차분법으로 노벨상 이 중차분법만으로 받은 건 아닌데 이 중차분법이 노벨상 받은 논문에 나옵니다.
그래서 이분들이 연구한 게 뭐냐면 최저임금 연구를 하는데 여기 보면 미국에 펜실베니아주가 있고 유저지가 있는데 두 개가 딱 붙었거든요.
이 펜실베니아랑 유저지주 경계선인데 이 경계선 왼쪽이랑 오른쪽에 있는 패스트푸드 점들이 있어요.
근데 펜실베니아주는 최저임금을 안 올리고 유지를 했는데 유저지주가 1992년에 최저임금을 올렸거든요.
그 길을 따라서 길 하나를 두고 왼쪽은 최저임금이 고정되어 있고 오른쪽은 최저임금이 올라가는 일이 생깁니다.
일시적으로 그래서 두 개가 일시적으로 최저임금이 갭이 벌어져요.
그러면 우리가 현실에서 보기 두 분 길을 하나를 기준으로 왼쪽은 최저임금이 고정되어 있고 오른쪽은 최저임금이 올라가서 마치 우리가 최저임금을 가지고 실험을 하는 것 같은 효과가 생기고 그러면 기본적으로 경작적 이론상 최저임금을 올리면 고용이 감소해야 되거든요.
그럼 고용이 얼마나 감소해야 되는지를 봐야 되는데 이게 고용이 최저임금에만 영향을 받는 게 아니기 때문에 여러 가지 변수에 영향을 받는단 말이에요.
그러면 만약에 펜실베니아주에서도 고용이 감소하고 있었는데 여기 옆에 유저지주가 만약에 똑같이 감소하더라
그러면 최저임금 효과가 없는 거죠.
만약에 펜실베니아주가 이렇게 떨어지는데 유저지는 더 빨리 떨어진다.
그러면 최저임금 인상이 고용의 악영향이 있는 반대로 똑같이 떨어져야 되는데 꼬끄러워 이렇게 올라갔다.
그러면 오히려 이만큼은 최저임금을 올렸더니 고용이 늘어나는 이상한 효과가 있는 거죠.
물론 그럴 리가 없지만 그래서 이중차분법을 이용해서 이런 일시적인 최저임금 갭이 벌어질 때 최저임금이 고용에 미치는 효과를 연구해서 이 연구가 엄청나게 유명한 연구입니다.
카드 행정, 나중에 노벨상도 받고 이 이후로 경제학계가 한 10년, 20년 동안 최저임금에 대한 연구가 엄청나게 쏟아지는 물론 이 연구도 한계가 있어요.
왜냐하면 패스트푸드점만 대상으로 했기 때문에 이게 패스트푸드음식점은 사실 최저임금 연구하기에 좋은 대상이 아니에요.
왜냐하면 패스트푸드음식점은 규모도 있고 여러 가지 복잡한 논리가 이제는 그거는 경제학 시간이 아닙니까?
됐고 최저임금 이런 경제학적 현상도 우리가 이중차분법을 통해서 연구할 수 있고 이중차분법은 결국에는 상호작용이다.
상호작용을 알면 그걸 응용해서 굉장히 다양한 문제들을 잘 할 수 있는 이런 것도 다를 수 있습니다.
- 실험이 불가능한 상황에서 사용하는 준실험적 방법
- 실험군 A에 어떤 처치를 했으나 대조군 B가 없을 때
- A와 비슷한 집단 B를 이용하여 비교
평행 추세의 가정 parallel trend assumption - 처치 효과가 없다면 실험군 A와 실험군 B가 비슷하게 변할 것이라고 가정 - 이러한 가정이 성립하지 않는다면 이중차분법의 결과는 무의미 - 가능한 비슷한 A와 B를 비교하는 것이 중요
회귀분석을 이용한 이중차분법 상호작용을 이용해 분석
$$ y = a \cdot \text{GROUP}+b\cdot\text{POINT} + d\cdot(\text{GROUP} \times \text{POINT}) + e $$
- GROUP: 집단 A(1), 집단 B(0)
-
POINT: 처치 전(0), 처치 후(1)
-
$d=0$: 실험군 A에서 변화는 대조군 B에서 변화와 비슷 (처치 효과 없음)
- $d \ne 0$ : 실험군 A에서 대조군 B와 다른 변화를 관찰(처치 효과 있음)
Question
최저임금 데이터를 다운 받아 이중차분법으로 분석해보세요.
종속변수는 풀타임노동시간 fte
입니다.
독립변수:
nj
: 뉴저지=최저임금 인상(1), 펜실베니아=최저임금 동결(0)d
: 비교 시점 이전(0), 비교 시점 이후(1)
(01) 최저임금 인상에 따른 비교 시점 이전과 이후의 풀타임 노동시간 변화는 얼마로 분석됩니까?
(02) 최저임금 인상으로 인한 풀타임 노동시간의 변화에 대해 어떤 결론을 내릴 수 있습니까? (유의수준 5%)
- 최저임금 인상으로 풀타임 노동시간이 감소하였다
- 최저임금 인상으로 풀타임 노동시간이 증가하였다
- 결론을 유보한다
Question
광고 전후 데이터 데이터를 다운받아 광고 효과를 이중차분법으로 분석해보세요.
독립변수:
group
: 광고집단 (1), 비교집단(0)postAd
: 광고 전(0), 후(1)sales
: 매출액
(01) 광고에 따른 전후의 매출액 변화는 얼마라고 할 수 있습니까?
(02) 광고에 따른 매출액 변화에 대해 어떤 결론을 내릴 수 있습니까? (유의수준 5%)
- 광고에 의해 매출액이 상승하였다
- 광고에 의매 매출액이 하락하였다
- 결론내릴 수 없다