1954년 paul E. Meehl이 Clinical versus Statistical Prediction이라는 책을 씀.
현장 전문가가 근거를 가지고 내린 예측과 통계적 기법으로 예측한 것을 비교
저자의 주장은 '아주 간단한 통계적 방법일지라도 전문가보다 훨씬 정확하다.'
2000년 미네소타 대학에서 논문을 발표함
160여 편의 연구들을 모아 어느 쪽 결과를 지지하는 연구가 더 많은지 메타 분석(분석한 것들을 모아서 다시 분석을 하는 것)함
결과: 평균적으로 전문가의 판단보다 통계가 10%정도 정확하다는 결과가 나옴
전체의 연구 중 33-47%는 통계가 전문가보다 훨씬 정확하다는 결론을 내림
6-16%의 연구만이 전문가가 통계보다 정확한 예측을 한다는 결론을 내림
통계가 전문가보다 낫다
문제점
통계로 다룰 수 없는 경우
데이터가 충분히 쌓여 있지 않아 통계를 적용할 수 없는 경우
텍스트 분석: 인터넷에서 모을 수 있는 게 대부분이고 종이에 쓰여진 텍스트나 대화는 수집고 다루기 어려움
통계는 예외적인 상황에 취약함
부러진 다리: 철수는 10년동안 목요일마다 등산을 갔음. 그러면 다음주 목요일에도 철수는 등산을 갈 것임. 철수가 다리가 부러졌다면 비전문가라도 철수가 다음주에 등산을 못 갈것임을 예측 가능함. 그러나 통계는 데이터 기반이기 때문에 10년동안 철수가 다리가 부러졌던 적이 없다면 등반을 갈 것이라고 예측할 것임.
통계 + 전문가
통계를 전문가가 잘 활용한다면 정확한 예측과 좋은 판단이 가능할 것임
통계 전문가가 아닌 통계를 잘 아는 전문가
마케팅 당담자가 마케팅에 대한 지식과 통계에 대한 이해를 결합하면 훨씬 더 마케팅을 잘 할 수 있을 것임
통계를 잘 아는 전문가가 되려면 통계의 수학적인 복잡한 부분보다 이를 수식을 통해 어떤 아이디어를 담아내느냐가 더 중요함
정규분포의 개념은 간단하지만 수식은 복잡함 -> 수식을 다 이해할 필요 없고 수식을 통해 말하고자 하는 통계적 아이디어들을 잘 이해하는 것이 중요함