최광웅의 데이터 경제: 통계청 표본, 39세이하 '과소대표' 60세이상 '과다대표'됐다


일부에서 이 글이 반향을 불러일으키나 본데, 저는 안믿음. 


통계청의 2018년 가계동향조사에 대해서 상당히 비판적인 의견을 가지고 있고, 2017년과 2018년의 직접적 비교를 해서는 안된다는 강한 주장을 이 블로그에서 여러 번 펼쳤지만, 


그 이유는 최광웅 원장의 주장과는 거리가 멈. 


최원장은 2015년 센서스와 2018년 가계동향조사의 연령별 표본 비율이 다르다고 오차가 크다고 하는데, 이는 통계청의 조사는 2015년 센서스의 표본 결과치를 그대로 따르는 것이 아니라 추계인구에 따라 조정한다는 것을 무시한 것임. 


2015년에서 2018년 사이에 60대 이상의 인구의 비중은 약 16% (16% 포인트 아님) 증가할 것으로 추정됨. 따라서 2015년에 비해 2018년에 60대 이상 인구의 비중이 더 늘어나는게 당연함. 


구체적으로 가계동향조사의 인구비율이 타겟 Population의 비율을 반영하는지는 모르겠지만, 통계청에서 이런 기초적인 실수를 저질렀다고 주장할려면 보다 면밀한 검토가 있어야 함. 


저는 그 가능성을 매우 낮게 봄. 통계청이 데이터 배포에 대해 가지는 태도는 문제가 많지만, 통계 생산에서 이 수준의 문제를 가지고 있다고는 전혀 생각하지 않음. 한국 통계의 품질은 다른 국가와 비교해서 결코 낮은 편이 아님. 





그리고 뉴스톱 글에서 상대표준오차 2%를 왜 여기서 내세우는지 모르겠음. 아마도 상대표준오차가 뭔지 모르고 하는 얘기라고 생각됨. 마치 샘플링 에러와 같은 개념이라고 생각하는 듯.  


통계청에서 상대표준오차를 통계 추정치 발표의 금과옥조로 삼는 것에 동의하지 않지만 나름 이해할 구석이 있는데, 뉴스톱에서 얘기하는 상대표준오차 2%는 전혀 납득이 안됨. 2% 상대표준오차는 이 뉴스의 주장과 아무런 상관이 없는 수치임.  

Posted by sovidence
,