이 번 미국 대선의 가장 큰 승자는 아마도 경향신문에도 소개된 Nate SilverThe Daily Show의 존 스튜어트는 United States of Arithmetic의 대통령으로 그를 호칭 (인터뷰는 요기). 이 번 선거의 승자는 갤럽과 라스무센(두 조사기관은 자신들의 오류를 인정하고 sampling frame을 바꿔야)을 제외한 여론조사 기관이기도 함. 


이 결과는 선거예측을 주변사람들의 얘기, 모멘텀, 캠프에서 느끼는 분위기 등에 의존하는게 얼마나 어리석은지를 웅변해 주기도 하였음. 딕 모리스 식의 질적 자료에 의존한 선거분석은 이제 물건너간 듯. 몇 번 말했듯, 예측은 설사 틀려도 데이타와 함께 해야. 자기 멋대로 가정하고 가중치를 주어서는 안됨. 허리케인 샌디의 영향력이 컸다고 말하지만 이는 변명에 불과. Nate Silver, Sam Wang 등은 그 이전부터 선거인단에서는 오바마가 이길 것으로 예측.  


한가지 흥미로운 점은 무응답률. 전화조사의 무응답률이 95%를 넘었음. 이 때문에 조사 결과를 믿지 않는 사람들이 많았음. 어느 정도 수준이 높은 수준인지는 정하기 나름이지만, 무응답률이 일정 수준 이상의 조사는 신뢰할 수 없다고 많은 조사방법론 교과서에 실려있음. 


아마도 많은 조사방법론 교과서를 다서 써야. 무응답이 문제가 되는 경우는 무응답 selection이 체계적으로 bias되었을 경우. Bias가 없다면 없다면 무응답은 샘플 선정의 무작위성, 샘플의 대표성에 아무런 영향을 끼치지 않고, 따라서 결과 예측에도 영향을 끼치지 않음. 조사회사 입장에서는 응답률을 높이기 위해서 많은 비용을 쓸 필요는 없다는 것. 


선거 직후 여론조사에서 당선자에게 투표했다고 응답하는 비율이 급증하는 이유는 응답자가 social desirability에 따라 거짓말을 하기 보다는 자신이 지지한 후보가 낙선한 유권자는 이에 대해 얘기하고 싶어하지 않아서 무응답하기 때문이 아닌지, 즉 무응답이 selection bias를 일으키기 때문이 아닌지 의심됨. 

Posted by sovidence
,