맥락은 고려하지 않고 외국 사례 들어서 한국은 왜 안그러냐는 식으로 말하는게 전형적인 한국 까내리기 방식이라 꺼려지긴 하지만, 오늘 Minnesota Pop Center에서 배포한 자료를 보고서 한 마디 안할 수가 없다. 

 

IPUMS MLP Linked Data

 

전세계 센서스를 모아서 분석 가능한 통계 원자료로 가공해서 배포하는 MPC IPUMS 팀에서 새로 배포한 자료다. 그런데 이 자료의 수준이 새로운 레베루다. 

 

센서스는 전국민을 대상으로 하는 전수조사와, 그 중 일부만(약 20%) 대상으로 하는 상세 조사가 있다. 전수조사는 아주 간단한 설문지를, 상세조사는 그보다는 많은 문항을 묻는다. 미국도 한국도 마찬가지다. 

 

미국에서 전수 조사 자료는 개인을 특정할 수 있기 때문에 제한적 접근만 가능한데, 시간이 오래된 센서스는 정보공개법에 따라 전수 조사 자료를 공개한다. 전수 조사이기 때문에 매 10년마다 이루어진 센서스에 각 개인이 여러 번 조사되고, 부모와 같이 살다가 독립한 개인도 당연히 조사된다.  

 

이번에 IPUMS에서 한 것은 접근제한이 풀린 전수 조사 센서스의 개인을 센서스 간에 링크시킨 것이다. 예를 들어, 1900년에 부모와 살다가 1920년에 커서 독립한 사람이 1940년에 어떻게 살고 있는지, 각 1900, 1920, 1940년 센서스 자료를 링크시켜서 알 수 있게 해놨다. 

 

세대 간 사회이동, 세대 내 커리어 이동. 혼인패턴, 출산패턴, 무궁무진한 연구가 가능하다. 예를 들어 1900년대 초에 이루어진 보편 교육의 확대가 세대 간 사회이동과 세대 내 커리어 이동, 지역 이동에 끼친 인과 관계 연구도 가능하다 (이미 Rauscher 교수가 해서 상도 타먹은 연구). 

 

실로 어마어마한 작업이다. 

 

 

 

 

이에 반해 한국은 센서스의 교육 변수, 직업 변수 조차 제대로 공개를 안한다. 직업 변수라고 공개하는게 대분류. 인구총조사에서 소득도 묻지 않고, 그나마 사회경제적 변수인 직업은 상세 직업은 공개 안하고, 1-digit 대분류만 공개하는데, 그것도 연도별로 기준이 다르다. 한마디로 교육에 따른 사회경제적 지위 변화의 추이라는 기초적 변화조차 제대로 파악하기 힘들다. 출생지역과 현재 거주 지역에 대한 정보도 제대로 없다. 

 

이렇게 공개를 안하는 이유를 물어보면 국가 기밀 보호란다. 기가 막혀서. 아마 전세계에서 센서스를 제대로 공개하지 않는 이유로 국가 기밀을 드는 나라는 국민이 아사로 죽어나가는 세습독재체제인 북한과, 한국 둘 뿐일 것이다. (일본도 그러려나?)

 

데이터 공개는 연구를 무료로 외주주는 것과 유사한 효과가 있다. 한국같이 전문 인력이 부족한 국가는 연구 무료 외주가 더욱 더 필요하다. 

 

 

 

 

일부에서는 한국 같이 고학력자가 많은 나라에서 전문 인력이 왜 부족하냐고 질문할 것이다. 

 

국가 운용과 연구를 위한 전문 인력은 인구 대비 상대적 비율이 중요한게 아니라, 절대 숫자가 중요하다. 예를 들어, 어느 나라나 필요한 지도자와 각료의 수는 비슷하다. 인구가 적으나 많으나 유사한 숫자의 엘리트가 필요하다. 

 

연구도 마찬가지다. 한국은 (적어도 사회과학에서는) 모든 전문가에게 제너럴리스트가 될 것을 요구한다. 연구로 카버해야 할 영역은 많은데 각 영역의 필요성에 비해 세부 전문가가 부족하기 때문이다.

 

세부 전문가를 대접하기 싫어서가 아니라 큰 그림 그리는데도 인력이 부족하니 세부 전문가 대접할 겨를이 없다. 당장 필요한 큰 그림에 딱맞는 얘기를 못하니 세부 영역 전문가 대접은 더 소홀해지기 마련이고, 연구자도 수요에 맞춰 전문가의 길보다는 제너럴리스트의 길을 가게 된다.

 

한국은 전문 인력이 부족하고, 전문 인력이 부족한데로 외국에서 교육받은 전문가를 제너럴리스트로 바꿔서 사회를 운영하는 시스템이 훌륭하게 구축되어 있다. 비꼬는거 아니다. 이런 시스템을 구축하는게 필요했다. 그러다보니 전문 인력을 또 필요로 하지 않는다. 상황이 바뀐 지금 전문가를 대접하지 않는다고 욕하는 것은 맥락을 고려하지 않은 것이다. 연구보다는 교육에 집중되었던 한국 대학의 과거 기능도 딱히 잘못된 것으로 보지 않는다. 오히려 자원의 효율적 배분이었지. 지금은 연구가 필요한 쪽으로 상황이 변했을 뿐. 

 

이런 K-전문가-시스템에서 사회가 대략 잘 굴러가는데 가끔은 과부하가 걸린다. 이 번 코로나 사태도 그 중 한 예일 것이다. 추측컨데 전세계에서 코로나 관련 자료가 가장 체계적으로 구축된 나라가 한국일 것이다. 하지만 그 데이터를 이용한 분석은 한국에서 별로 안나온다. 그럴 수 있는 여유가 있는 전문가가 없으니까. 

 

한국의 발전으로 전문가에 대한 수요는 바뀌었지만, 전문가는 여전히 부족한 상황에서, 이 문제에 대처하는 가장 손쉬운 대책은 자료를 공개하고 국내외 전문가들이 알아서 분석하게끔 하는 것이다. 그러면 국내 학자들도 자기 전문 분야를 구축할 수 밖에 없게 된다. 그 중에서도 제너럴리스트가 되는 사람이 생기는데, 이 분들의 지식의 깊이도 심화된다. 

 

데이터 공개하라고 하면, 학자들이 자기 논문쓸려는 이기적 동기 때문이라고 하는 분들이 가끔 있다. 학자가 논문 쓰면 그게 쌓여서 국가 정책 마련에 도움이 되는거다. 

Posted by 바이커 sovidence

댓글을 달아 주세요

  1. 2020.10.21 16:12  댓글주소  수정/삭제  댓글쓰기

    비밀댓글입니다

  2. 꼬마 2020.10.22 06:20  댓글주소  수정/삭제  댓글쓰기

    많은 경우 정부 부처에서 담당하는 주요 사업들은 3년이나 5년 단위로 계획을 수립합니다. 이 계획은 법령은 아니지만 담당 관료에게는 법만큼이나 중요합니다. 이 계획이 잘못되었어도 타임스케쥴대로 시행하지 못하면 실행담당 관료가 불이익 또는 처벌을 받습니다. 계획에 피드백을 반영해서 수정한다는 절차 자체가 이 프로세스에는 없습니다. 피드백과 수정은 다음 계획 수립에서만 허용됩니다.

    일단 계획이 나오면 실행해야 하는데 사회의 동의나 심의가 필요하다고 판단되면 무조건 계획에 동의할 사람들을 위원회에 배치합니다. 민노총이 참여해도 무조건 동의시켜 내더군요. 그만한 정치적 거래가 있겠지요.

    계획 실행 과정에서 여론 조성이 필요하면 정해진 결론에 맞춘 연구보고서들과 현장 데이터들이 생산되고 이 자료들은 보도자료로 편집되어 언론사들에 배포됩니다. 이해관계자들이 반발하면 언론보도와 지도감독 관청의 행정조사, 검경의 비리 수사 등으로 최대한 반발세력을 분쇄하면서 사전에 계획된 양보안을 받아들이도록 압박합니다. 이럴 때를 대비해서 관료들은 대량의 범죄를 양산할 수 있는 규정이나 헛점을 만들고 범죄에 인센티브를 부여하기도 합니다. 많은 경우 정책 수행과정에서 문제가 발생하면 희생양이 될 집단은 정해져 있습니다. 그리고 본인들의 어리석음과 관료들이 의도적으로 심은 범법 조장 인센티브에 따라서 사법 혹은 행정적인 범법을 많이 저지릅니다.

    만일 이 상황에서 데이터를 공개하면 그리고 독립적인 학자들이 그 데이터로 논문을 쏟아내면 어떤 일이 발생할까요?

    수정할 수 없는 장기계획 자체가 문제가 있다는 점이 폭로되면 관료들은 계획수립 실패에 대해 처벌받아야 합니다. 계획에 문제가 있어서 처벌받는 경우는 대단히 이례적인 일 같아 보이더군요.

    실행과정에서 여론을 조성하기 위해 뿌린 보고서와 데이터 해석이 문제가 있다고 나오면 어떻게 될까요? 실행하던 관료들은 좌천되는 것만 해도 다행일 지경이 됩니다. 실행스케쥴만 지연되어도 좌천되는데 하물며 아예 좌초될 위기를 초래했다면 인생이 끝날 수 있습니다.

    데이터 공개는 관료들이 자발적으로 할 수 있는 일이 아닙니다. 재벌이 자발적으로 재산과 경영권을 포기할 수 없는 것과 같은 이치입니다.

    시세를 타고 비공개된 데이터를 관료들이 독점적으로 사용하면서 어떤 끔찍한 정책실패가 있었는지를 밝히고 여론화 해서 국민적 공분을 일으키는 것이 제일 빠른 해결책이라고 생각합니다. 물론 여론이 들고 일어나도 관료들과 정치인들은 온갖 회피전략을 구사하기는 하는데 변화는 얼마간 생깁니다.

    • 두꺼비 2020.10.22 12:48  댓글주소  수정/삭제

      말씀하신게 최근 의대 정원 논란을 떠올리게 하는군요...왠지 씁쓸합니다.

    • 2020.10.23 00:57  댓글주소  수정/삭제

      정말 이게 사실인가요?

    • 꼬마 2020.10.23 01:59  댓글주소  수정/삭제

      제가 경험한 범위나 기사로 본 바로는 대체로 이렇게 흘러가더군요. 대부분 기본계획들은 법령에서 정한 주기마다 수립해야 하고 실행이 안되거나 지연된 것은 감사원에서 감사 후 징계를 요구합니다. 기사 찾아보셔도 좀 나올거에요.

      정무직 고위 관료(대통령을 포함한 정치인)들이 개입하고 책임지면 계획 수정이야 가능하겠지만 장차관이 아닌 관료들이 계획을 임의로 수정하지 못합니다. 수정하려면 관료 중 누군가는 책임져야겠죠.

      여론조작이나 책임질 집단을 선정하고 압박하는 것은 매번 반드시 있는 것은 아니겠지만 관료들은 필요하면 그 정도는 얼마든지 합니다.

      공중전으로 데이터가 공개되어야 한다는 강력한 여론을 조성하거나, 관료들의 계획 수립단계에서 연구협조를 하는 것이 데이터 공개를 이끌어낼 현실적인 대안이기는 한데 둘 다 쉬운 일은 아니고 계속 시도해야 할 일이라고 생각합니다.

    • 바이커 2020.10.23 13:06  댓글주소  수정/삭제

      통계청에서 관리하는 데이터 부분 공개의 이유는 기존 관행과 공개에 따른 막연한 불안감이 가장 클 것입니다.

      공무원의 계획 수립과 피드백 과정에서 징계의 우려 때문에 공개하지 않는 정책 관련 근거 자료와는 다릅니다.

  3. 꼬마 2020.10.23 02:18  댓글주소  수정/삭제  댓글쓰기

    논문은 개인 영달 혹은 이익을 추구하는 행위이기에 데이터를 줄 수 없다는 표현도 관료들의 표준적 마타도어 민원처리 프로토콜입니다.

    관료들은 구매조달이나 서비스 하청과정에서 거래 상대가 충분히 약하고 특히 서비스 제공자일 경우 비영리를 원칙으로 주장합니다.

    구매조달은 일반 한국 국민들도 차마 물건 값은 공짜라고까지는 생각하지 못해서, 관료들도 가격이나 후려치지 차마 비영리까지는 주장을 못하더군요.

    하지만 한국사람들이 '무료'가 당연하다고 생각하는 인력 서비스는 관료들이 하청업자들에게 비영리를 강요하는 경우가 많습니다. 비영리에 대한 어떤 비전이나 신념이 있어서가 아니라 적정 이윤율을 추가로 후려치기 위해서 주장합니다. 하청업자가 항의하면 세금을 쓰는 일은 비영리가 원칙이라는 개소리를 전가의 보도처럼 휘두릅니다. 다만 상대가 강력하면(예: 건설업) 비영리 같은 말은 절대 하지 않습니다. 오히려 상대가 강하고 거대할수록 정성껏 '적정 이윤율'을 보장해주는 편입니다. 민자 도로나 민자 지하철 등이 그렇죠.

    학자들은 하청업자는 아니라 조금 결이 다르기는 한데, 영리성을 근거로 협상하는 것은 동일하다고 보시면 됩니다. 즉 너희는 만만하고 나에게는 해로운 일이니 영리성을 근거로 거부한다는 뜻입니다.

    만일 데이터 값을 지불하겠다고 제안하면 어떻게 될까요? 정말 영리가 문제일 뿐이라면 적정한 데이터 대금을 받는다면 그리고 안보 등의 문제가 없다면 제공해줄 것입니다.

    하지만 제가 예상 하는 답변은 다음과 같습니다. 현 담당자는 "검토해보겠다" 하고는 시간을 끕니다. 압박이 심하면 전혀 쓸모없는 혹은 관료들의 업무에 대해 뭔가 이의제기를 할 수 있는 가능성이 거의 없는 데이터를 제공하는 경우는 있을 수 있습니다. 그리고 1년 쯤 뒤 새로 온 담당자가 "전임자와 이야기하라. 나는 그런 말 한적 없고 인수인계도 받은 적 없다"라고 답을 줄 겁니다.

    • 그래서 2020.10.23 06:06  댓글주소  수정/삭제

      이번 독감백신이 그렇게 사고가 많은 건지도 모르겠군요. 콜드체인이 이렇게 와장창 깨지는 사태는 예전에는 없었던 걸로 아는데...

  4. 웹하드 순위 2020.10.23 06:44  댓글주소  수정/삭제  댓글쓰기

    잘보고 갑니다. 좋은하루 보내세요 *^^*