통계의 기본 개념

복잡한 수학을 빼고 통계의 기본 개념을 알아봅니다


수강중

1. 강의 소개

통계를 배워야 하는 이유

  • 1954년 paul E. Meehl이 Clinical versus Statistical Prediction이라는 책을 씀.
    • 현장 전문가가 근거를 가지고 내린 예측과 통계적 기법으로 예측한 것을 비교
    • 저자의 주장은 '아주 간단한 통계적 방법일지라도 전문가보다 훨씬 정확하다.'
  • 2000년 미네소타 대학에서 논문을 발표함
    • 160여 편의 연구들을 모아 어느 쪽 결과를 지지하는 연구가 더 많은지 메타 분석(분석한 것들을 모아서 다시 분석을 하는 것)함
    • 결과: 평균적으로 전문가의 판단보다 통계가 10%정도 정확하다는 결과가 나옴
    • 전체의 연구 중 33-47%는 통계가 전문가보다 훨씬 정확하다는 결론을 내림
    • 6-16%의 연구만이 전문가가 통계보다 정확한 예측을 한다는 결론을 내림
    • 통계가 전문가보다 낫다
  • 문제점
    • 통계로 다룰 수 없는 경우
    • 데이터가 충분히 쌓여 있지 않아 통계를 적용할 수 없는 경우
      • 텍스트 분석: 인터넷에서 모을 수 있는 게 대부분이고 종이에 쓰여진 텍스트나 대화는 수집고 다루기 어려움
    • 통계는 예외적인 상황에 취약함
      • 부러진 다리: 철수는 10년동안 목요일마다 등산을 갔음. 그러면 다음주 목요일에도 철수는 등산을 갈 것임. 철수가 다리가 부러졌다면 비전문가라도 철수가 다음주에 등산을 못 갈것임을 예측 가능함. 그러나 통계는 데이터 기반이기 때문에 10년동안 철수가 다리가 부러졌던 적이 없다면 등반을 갈 것이라고 예측할 것임.
  • 통계 + 전문가
    • 통계를 전문가가 잘 활용한다면 정확한 예측과 좋은 판단이 가능할 것임
  • 통계 전문가가 아닌 통계를 잘 아는 전문가
    • 마케팅 당담자가 마케팅에 대한 지식과 통계에 대한 이해를 결합하면 훨씬 더 마케팅을 잘 할 수 있을 것임
    • 통계를 잘 아는 전문가가 되려면 통계의 수학적인 복잡한 부분보다 이를 수식을 통해 어떤 아이디어를 담아내느냐가 더 중요함
    • 정규분포의 개념은 간단하지만 수식은 복잡함 -> 수식을 다 이해할 필요 없고 수식을 통해 말하고자 하는 통계적 아이디어들을 잘 이해하는 것이 중요함
    • 통계적 아이디어를 잘 이해했다면 계산은 컴퓨터가 해주기 때문에 결과를 이해할 줄 알면 됨
    • 통계적 아이디어 + 컴퓨터로 계산 + 계산 결과 이해