얼마 전 심상정 의원이 국세청에서 받은 소득 천분위 자료를 블로그에 공개해 화제가 된 적이 있음. 한국에서 국세청의 aggregate 자료가 간혹 공개되는데 aggregate 된 원자료가 공개되든, aggregate 된 것을 재가공한 자료만 공개되든 대부분 국회의원을 통해서 공개됨. 


한국에서 국세청 세금 자료는 궁극의 비밀의 영역. 


그럼 다른 나라는 얼마나 공개하나? 


우선 미국부터. 


1960년대부터 미국은 국세청 자료 중 일부를 랜덤 추출해서 개인 식별자를 제거하고, 세금 단위를 rounding 한 후 상세한 세금 자료를 연구용으로 공개함. 자료는 통계 분석을 하기에 아무런 무리가 없게 큼. 2012년 기준으로 약 17만명의 상세한 세금 정보가 이 원자료에 포함되어 있음. 우리나라로 치면 17만명의 연말정산 원자료임.  


아무에게나 주는 것은 아니고 신청하고 비밀보장을 서약한 후 자료를 제공. 이 자료를 어떻게 통계 프로그램에서 분석 가능한 자료로 바꿀지는 NBER 웹사이트에 프로그램이 올라와 있음. NBER에 속한 학자들은 이 곳 unix system에 접속해서 세금 자료를 분석할 수 있음. 


국회의원을 통해서 재가공된 천분위 자료를 받고 말고 할게 없음. 


이 자료는 개인식별자가 없고, 아무런 인구학적 정보가 없기에 분석에 한계가 있음. 하지만 미국 국세청과 미국 통계청(Census Bureau)이 협력해서 SIPP 서베이 자료나 CPS 서베이 자료에 국세청 정보를 링크시켜둔 자료가 있음. 


역시 아무에게나 주는 것은 아님. 이 자료들의 접근은 보안이 훨씬 철저해서 연구자가 계획서를 내고, 오랫동안 심사해서 허가를 받아야만, 보안 장치가 있는 장소(ie, RDC)에서 쓸 수 있음. 


한국 통계청에서 그렇게 자랑하는 MDIS는 바로 이런 정보를 볼 수 있게 해주는 시설이 되어야 하는데, 한국은 이런 자료는 아예 공개를 안하고, 기껏해야 다른 나라에서는 인터넷에서 다운 받을 수 있는 수준의 연속샘플 식별자 같은 것을 볼 수 있는 장소로 사용. 


요즘 미국 통계청과 국세청은 SIPP이나 CPS의 샘플 사이즈가 작다고, 미니 센서스인 ACS에 세금 데이타를 붙이고 있음. 올 연말이나 내년 초 정도면 링크 작업이 끝날거라는 소문이 있음. 


위 세금 자료는 개인식별자를 모두 없앤 것이지만, 누가 연봉 얼마받는지 알 수 있는 자료도 있음. 바로 세금으로 월급받는 공무원들임. 요기에 가면 연방정부 공무원 개개인들의 연봉이 모두 올라와 있음. 관심있는 연방정부 공무원의 이름을 치면 연봉을 얼마받았는지 알 수 있음. 


많은 주정부들도 주정부 공무원들의 연봉을 공개함. 






유럽 국가들의 세금 정보 공개는 한국은 물론 미국보다 더 자세함. 


노르웨이는 전국민의 세금 보고를 인터넷에 공개함. 스웨덴도 전화 한통화면 개인의 세금 정산 보고서를 알 수 있음. 


스웨덴의 경우 전국민의 노동시장과 복지 행정자료 정보를 통합한 "노동시장 장기통합 데이터 (LISA)" 시스템을 갖추고 있음. 원자료 온라인 접근 시스템 (Microdata Online Acess: MONA)를 도입해서 연구자들이 인터넷으로 접속해서 등록행정데이타 정보를 분석할 수 있음. 


이 시스템에서는 이번 가계동향조사 논란처럼 데이타를 패널로 분석할 수 있느니 없느니는 논란조차 될 수가 없음. 모든 국민의 횡단면, 종단면 분석이 가능하니까. 16세 이상 전국민의 고용, 소득, 직업, 경제활동, 질병, 사회부조, 연금, 출생, 거주지, 거주지, 학력, 고용이 되었을 경우 일하는 기업의 정보까지 모두 통합되어 패널 분석이 가능함. 덴마크도 비슷한 시스템을 갖추고 있음.  


이처럼 복지국가는 전국민의 삶을 국가에서 추적하고 분석하고 어느 시점에 어떤 도움이 필요한지 연구할 수 있는 국가임. 


스웨덴, 덴마크만 이러는거 아님. 많은 북유럽국가들이 통계청에 행정자료 전체에 대한 접근 권한을 주고 이 자료를 연구에 이용할 수 있게 함.






영국은 ADRN (administrative data liaison service)라는 시스템을 갖추고 2013년부터 연구자들에게 행정자료 접근 서비스를 제공함. 미국 RDC나 한국 MDIS에서처럼 승인을 받아서 secured sites에 가서 이용하는 시스템인데, 한국과 달리 데이타 수준이 매우 높고, 미국과 달리 신청하면 웬만하면 다 승인해줌. 여러 문제점도 노정했지만, 행정자료를 이용한 연구에 획기적 전환점이 되었음. 





그런데 한국은 통계청에 타부서 행정자료에 대한 접근 권한은 통계법으로 거의 부여했는데, 이 데이타를 통계청 내부에서만 볼 수 있게끔 되어 있음. 믿거나 말거나 상당한 수준의 행정자료가 지금 통계청에 쌓이고 있음. 


통계청 자체 자료도 외부 공개를 꺼리니, 다른 부서에서 받은 행정자료는 말할 필요도 없음. 통계청에만 정보가 쌓이고, 이렇게 쌓인 정보가 공공을 위한 연구로는 활용이 안되는 그런 상태임. 정책 분석을 위한 자료로 활용할거 아니면 통계청에 전국민 데이타를 집중시켜서 뭐에 씀?  

Posted by 바이커 sovidence