통계

나무위키의 통계에 대해서는 나무위키:통계 문서를 참조하십시오.

canstockphoto7351376-landingpage.jpg

언어별 명칭
한문統計
영어statistics, stats
프랑스어statistique
독일어Statistik
러시아어статистика

1 개요

대한민국 통계청, 통계자료 한번에 꿰뚫기.wmv

국어사전에서는 통계를 '한 곳에 몰아서 어림잡아 계산함'이라고 정의하고 있다.[1] 또한 국어사전에서는 통계에 대하여 현상을 보기 쉽게 일정체계에 의해 숫자로 나타낸다고 정의하고 있다. 이와 달리 통계학은 학문적으로 더 자세히 정의된다. 통계학은 수량적인 비교를 기초로 많은 사실을 다양한 방법으로 관찰, 처리를 연구하는 학문이라고 정의되고 있다.

2 YOU JUST ACTIVATED MY TRAP STATISTICS

자세한 내용은 통계학 항목 참고.

거짓말에는 세 가지 부류가 있다. 거짓말, 새빨간 거짓말, 그리고 통계.

- 벤저민 디즈레일리

통계의 특성을 악용하여 통계를 왜곡해서 사람들에게 보여주는 사례들을 주변에서 심심치 않게 볼 수 있으며, 셀 수 없이 많은 광고와 기사가 자신의 억측을 사실이라고 주장하기 위해 통계를 견강부회식으로 사용한다. 가장 흔한 것은 상관관계의 사건을 마치 인과관계인 것 처럼 서술하는 것. '운전중 커피 소모량과 고속도로 교통사고 사망률이 비례하더라'라는 주장은 마치 '커피가 교통사고의 주범이다'라고 들리지만, 실은 커피를 대량으로 마셔가며 잠을 쫒아 운전하는 사람은 졸음운전의 위험성이 있는 사람이고, 따라서 교통사고율이 높은 것이다. 이 사례가 우습게 들리는가? 당장 당신이 보게 될 광고나 각종 기사들을 곰곰히 분석해보자. 이 사례보다도 얼토당토 않은 주장들이 난무하고 있다는 것을 알 수 있을 것이다. 제대로된 위키러, 특히 전문분야에서 일하게 될 사람이라면 저런식의 주장에 낚이지도 말고, 하지도 말자.

왜곡 과는 별도로 통계는 예측 혹은 거짓말 에서 못 벗어난다. 통계를 하는 이유가 전수조사, 즉 전부 검사하기 힘들고 돈이 많이 깨지기 때문이다. 즉 일부만 검사해서 전체를 추론한다. 반대로 얘기하면 전수조사 결과는 일단은 100% 확실한 진실이다. 이 일부 조사를 누가 언제 어떻게 무슨 방법으로 하느냐에 따라 결과가 바뀐다. 결국 딱 나오는 건 숫자 뿐이다. 물론 어떤 자료던지 그걸 어떻게 해석하는 가는 사람이 하는 일이니 결국 예측 혹은 거짓말 에서 못 벗어난다. 사실 이게 통계에서 가장 잘 범하는 오류 중 하나이며, 미국 대통령 선거 예측이 완전히 뒤집어 진 일도 있었다.[2]

게다가 이 표본에는 표본이 되는 대상 뿐만 아니라 조사 기준 자체도 포함되는지라 어떤 기준을 표본으로 설정하느냐에 따라 결과 및 해석이 천차만별로 나올 수 있다.

예를 들면 이런 글을 사례로 들 수 있다.# 이 블로거는 서민들이 재벌을 비판할 자격이 없다고 주장하는데 그 근거로 제시된 것이 서민들 중 특정 계층인 자영업자만을 대상으로 한 통계를 들고 왔다. 이 글이 설득력을 얻기 위해서는 통계조사의 대상이 자영업자여야 한다는 부분이 없어져야 한다. 왜냐하면 글의 주장은 자영업자는 재벌을 비판할 자격이 없다가 아니라, 서민은 재벌을 비판할 자격이 없다는 것이기 때문이다. 심각한 문제로 넘어가면, 게임규제 항목의 수출액 관련 통계가 규제 반대론의 근본적인 이유가 되지 못하는 것도 이 때문. 게다가 애초에 사람이 조사하는 것이니 심리적인 편중도 배제할 수 없고, 조사가 자동화되거나 자연현상 조사 같은 비교적 객관적인 것마저 지역적 편중을 배제할 수 없다. 대표적인 편중의 예가 대형마트 규제 논란 관련 통계.[3] 이런 통계의 특성을 극도로 악용한 사례가 바로 타겟맵 같은 몇몇 쓰레기 사이트.

또한 통계 자체가 얼마나 신빙성 있느냐도 문제가 있다. 설령 공식 기관에 의한 통계조차도 100% 믿기 어려운데, 비공식 통계는 더하다. 강남역 묻지마 살인사건이후, 여성 안전을 주장하면서 근거로 한국의 살인 중 여성대상 범죄가 90%에 가깝다는 통계를 내세우는 사람들이 있었는데, 우선 이 통계의 출처 자체가 매우 불분명하다. 게다가 한국의 살인범죄 자체가 너무 적어서(...)[4] 통계학적으로 접근하면 표본이 부족하다. 함부로 통계를 내세워서는 안 될 일이다.

3 위키에 생성된 통계 관련 항목

3.1 현실세계

3.2 가상세계, 서브컬처

4 관련 문서

  1. [1]
  2. 정확하게는 1936년 재선때, 리터러리 다이제스트라는 잡지사에서 전화명부, 자동차 소유주 명단 등을 이용하여 표본을 간추린 뒤 여론조사를 한것으로 랜든의 압승을 예측했는데 문제는 이게 부자 위주(랜든 지지자 편중)의 표본이었다는 것이다.(대공황 당시었으니 전화기 있고 자동차있는 사람의 상당수는 돈있는 사람인 상황) 결국 서민층이 대부분인 실제선거에서 역관광당했고, 리터러리 다이제스트는 1938년에 망해서 타임지에 흡수되었다.위의 항목중 2.2에 해당
  3. 어떤 통계는 대형마트 안에서 조사되기도 했는데, 이러면 당연히 대형마트 직원의 눈치를 볼 수 밖에 없었고, 실제로 대형마트 규제에 반대한다는 결과가 나왔다. 대표적인 심리적 편중 + 지역적 편중의 예.
  4. 2011년 기준 427건