경향기사: 부실 여론조사에 경마식 보도...'대선민심' 왜곡 시킨다


여론조사 결과를 보면 지금 투표하면 박근혜가 이길 거지만, 격차가 줄어드는 추세이니 1주일 뒤에 어떻게 될지는 지켜보는 수 밖에. 


선거 1주일 전 여론조사 공표 금지법은 도대체 왜 있는건지. 아는 사람은 다 알고, 전체 국민에게만 조사결과를 공표하지 않아서, 오히려 유언비어 유보의 토양을 마련해주는 이 법은 바뀌어야. 


그건 그렇고, 위에 링크한 경향신문 기사에서, 응답률이 여론조사의 정확도와 밀접히 관련히 있다는 것은 아마도 잘못된 상식일 것. 응답률 20-30%이 되어야 여론조사를 신뢰할 수 있다는 주장은 옛날 얘기. 


응답률과 조사의 정확성에 대한 가설은 두가지. 하나는 낮은 응답률은 응답의 체계적인 편향과 관련이 있다는 것. 여론의 자유로운 표명이 막혔을 때는 이 가설이 설득력이 있음. 다른 하나는 응답거절이 random이기에 조사의 정확성과 응답률은 무관하다는 것. 


이 주제에 대한 연구 자체가 많지 않지만, 주로 첫번째 가설, 즉, 낮은 응답률은 조사의 신뢰성을 낮춘다는 입장을 다수 연구자가 받아들임.   


그러나 최근의 조사방법론에 대한 체계적인 연구에 따르면 낮은 응답률은 조사의 정확도와 무관하다고 함. Visser et al (1996)에 따르면 응답률 20%의 조사가 응답률 70%인 조사보다 더 정확했고, Holbrook et al. (2007)에 따르면 응답률 5%인 조사와 50%인 조사의 결과도 별 차이가 없음. 당선자를 정확히 예측한 최근의 미국 대선에서도 응답률은 확실히 10% 미만이고, 어떤 조사는 5% 미만이기도 함. 즉, 응답거절은 random한 이벤트고 응답률과 조사의 정확성은 거의 무관함. 


한국의 선거예측 여론조사 결과가 안정적이지 않은 이유는, 추측컨데, (1) 통신수단이 집전화에서 손전화로 바뀌면서 sampling frame이 확정되지 않은 것; (2) 전체 국민 여론조사와 선거 여론조사의 target population, 즉 투표의향자에 대한 방법론이 확정되지 않았기 때문일 것. 


(1)은 지난 번 지자체 선거에서 크게 문제가 되어서, 많은 조사기관이 RDD를 도입하였음. 이론적으로 RDD가 더 정확하지만 구체적으로 어느 정도 개선효과가 있는지는 실험을 통해서 밝혀져야. 


(2)와 관련하여 대부분의 여론조사가 성, 연령, 지역에 따른 할당 내지 가중치를 줌. 이 방법은 전국민 여론조사의 경우 사전 정보를 이용하여 sampling error를 줄이기 때문에 조사의 정확도를 높이는 기술임. 하지만 성, 연령, 지역에 따른 지지자가 다르고 투표율에 상당한 격차가 나는 선거 여론조사에서는 이 방법이 반드시 조사의 정확도를 높이는지는 아무도 모름. 투표의향을 묻는 여러가지 질문을 개발하고 어느 질문이 가장 정확한 선거 결과 예측을 해내는지 실험을 하지 않고서는 이 문제는 두고두고 골치거리. 

Posted by sovidence
,