본문 바로가기
역사_사회_정치

잘못된 통계에 농락 당하지 않기.

by 그놈궁댕이 2022. 11. 14.
반응형

잘못된 통계에 빠지지 않는 법


전달하는 주체는 누구인가?

통계는 목적이 있다.
누가 어떤 목적으로 그런 자료를 만들어 배포하는지 체크해 봐야 한다.

정치인이 자기 정책이 경제에 좋다는 관점에서 조사한 자료인가?
특정 제품 제조사가 자신의 제품의 장점만 열거한 자료인가?




어떤 감정을 느끼는가?

만약 통계 자료를 보고 기분이 좋거나, 기분이 급격하게 나빠지는가?
직감은 직감일 뿐, 감정이 상한다면 다른 관점의 자료를 찾아 검증해야 한다.


표준화된 수치인가?

특히 통계 수치가 경제 성장과 학업 지능에 관한 개념이라면 더 조심해야 한다.
측정을 할 때 어떤 관점에서 어떤 사람들을 이용했는지 알아야 한다.
예를 들어 최초  GDP 개념은 인간의 전반적 행복을 설명한 수치가 아니라, 애초에 미국이 세금을 대중의 반발 없이 사용하기 위해 만들어진 개념이다.

그 개념을 다른 방식으로 측정한 연구 자료를 찾아 검증해야 한다.



데이터 수집은 어떻게 진행되었나?

특정 수치가 한 연구에서 수집된 데이터를 바탕으로 나온 것이다.
당신이 그 연구 실험의 참가자 중 한 명이라고 상상해 보자.
질문이 특정한 방향으로 몰아가는가?
진실을 왜곡하려는 의도가 있는가?
그리고 표본은 무작위 선택이 맞는가?
무작위 표본이 아니라면 특정 집단만 해당 자료가 맞다는 점을 잊지 말아야 한다.
대표성이 필요한 항목인지, 특정 집단만 점검하면 되는 자료인지 확인하자.








데이터는 어떻게 분석 되는가?

그 수치를 통해 인과 관계가 드러나는가?
그 관계는 혹시 우연히 나올 수 있지 않나?
다른 요인들이 관여하는가?
인과관계가 거꾸로 적용이 가능한가?

해당 자료와 유사한 다른 자료에 대해 교차 확인이 필요하다.
통계는 절대로 완벽할 수 없고, 한계가 명확하다는 점을 잊지 말아야 한다.






어떻게 숫자를 제시하는가?

평균 -> 평균을 높이거나 낮출 수 있는 이상치가 있는가?
정확한 수치 -> 온갖 이유로 인해 수치는 애초에 100% 정확할 수 없다.
등급 -> 등급이 나눠진 경우, 사실 오차 범위로 인해 실제론 차이가 거의 없을지도 모른다.
위험 -> 특정 비율과 확률이 제시할 때, 기준이 무엇인지 제시하지 않으면 아무 의미가 없다.
그래프 -> 이상한 수직축이 결과를 왜곡할 수 있는데, 수직축을 늘리거나 줄여서 과장하거나 축소가 가능하다.

 
반응형

댓글