통계로 할 수 있는 것 :: 통계 - mindscale
통계로 할 수 있는 것
통계 분석을 통해서 할 수 있는 일들
- 대상의 특성을 수치로 표현하기
- 부분을 통해 전체를 추측하기
- 비교하기
- 예측하기
- 영향력을 미치는 변수 찾기
- 지수(index) 만들기
- 비슷한 것끼리 모으기
대상의 특성을 수치로 표현하기
- 대상의 관찰할 수 있는 특성은 무엇이든 수치로 표현할 수 있음
- 양적인 것은 물론, 질적인 특성도 수치화가 가능
- 그 수치가 객관적이지 않아도 됨 (예: 만족도)
- 수치가 대상을 파악하기에 좋은 성질을 가지고 있는가?
- 수치들을 잘 요약하여 효과적으로 정보를 전달
부분을 통해 전체를 추측하기
- 대부분의 경우 우리는 대상의 일부만을 관찰할 수 있음
- 여론조사: 전국민 중 소수를 대상으로 조사
- 면접: 한 개인의 인생에서 한 순간만을 조사
- 현실에서는 우연과 불확실성이 존재
- 성실한 사람도 면접에 늦을 수 있음
- 부분을 통해 전체를 합리적으로 추측하는 것이 중요
비교하기
- 여러 개의 대상을 비교해야 하는 경우가 많이 있음
- 임상시험
- A/B 테스트
- 대상들 사이에 어떤 차이가 있는가?
- 그 차이는 정말로 존재하는 것인가?
- 그 차이가 대상들 자체의 특성에 기인한 것인가?
예측하기
- 어떤 특성은 다른 특성보다 쉽게 알 수 있음
- 주택의 입지, 교통, 환경 등은 쉽게 파악 가능
- 가격은 거래가 성사되어야 파악할 수 있음
- 한 대상의 여러 가지 특성들은 서로 관련을 맺고 있음
- 쉽게 알 수 있는 다른 특성들로부터, 알기 어려운 어떤 특성을 예측할 수 있음
- 여기서 예측은 미래에 대한 예측만을 의미하는 것은 아님
영향력을 미치는 변수 찾기
- 대상의 한 가지 특성은 여러 가지 특성으로부터 영향을 받음
- 예: 고객의 만족도는 가격, 친절한 응대, 서비스의 질, 경쟁 서비스의 특성 등에 영향
- 어떤 특성은 다른 특성보다 직접적으로 변화시키기 쉬움
- 예: 고객의 만족도를 직접 높일 수는 없지만, 더 친절하게 응대하도록 변하는 것은 쉬움
- 목적으로 하는 특성에 영향이 큰 변수를 분별
- 해당 변수를 높이거나 낮추어 목적으로 하는 특성을 조절
지수 만들기
- 대상의 특성 중에는 직접적으로 관찰하기 어려운 것이 있음
- 예: 고객의 만족도, 사랑, 유전자 등
- 이러한 특성은 관찰 가능한 다른 특성들과 연관을 맺고 있음
- 예: 고객 만족도가 높으면 재구매, 추천 등의 행동을 많이 함
- 관찰가능한 특성들을 바탕으로 관찰하기 어려운 특성을 지표화할 수 있음
- 이들 지표를 통해 관찰하기 어려운 대상을 통계적으로 다룰 수 있음
- 대상 자체가 실재하지 않는다 해도, 이 지표를 통해 의사결정이 쉬워짐
- 예: 고객 만족도가 존재하지 않아도, 그 지표가 매출에 선행한다면, 고객 만족도 향상을 통해 매출을 높일 수 있음(도구주의)
비슷한 것끼리 모으기
- 비슷한 것을 모아서 하나의 집단으로 인식하면 편리한 경우가 있음
- 예: 비슷한 고객들에게 같은 프로모션이나 추천을 할 수 있음
- 예: 합정-홍대는 같은 상권으로 보지만, 신촌은 별개의 상권으로 인식됨
- 대상의 다양한 특성들을 바탕으로 비슷한 것끼리 모을 수 있음
처음으로