천조국 데이터 공개와 구축의 위엄
맥락은 고려하지 않고 외국 사례 들어서 한국은 왜 안그러냐는 식으로 말하는게 전형적인 한국 까내리기 방식이라 꺼려지긴 하지만, 오늘 Minnesota Pop Center에서 배포한 자료를 보고서 한 마디 안할 수가 없다.
전세계 센서스를 모아서 분석 가능한 통계 원자료로 가공해서 배포하는 MPC IPUMS 팀에서 새로 배포한 자료다. 그런데 이 자료의 수준이 새로운 레베루다.
센서스는 전국민을 대상으로 하는 전수조사와, 그 중 일부만(약 20%) 대상으로 하는 상세 조사가 있다. 전수조사는 아주 간단한 설문지를, 상세조사는 그보다는 많은 문항을 묻는다. 미국도 한국도 마찬가지다.
미국에서 전수 조사 자료는 개인을 특정할 수 있기 때문에 제한적 접근만 가능한데, 시간이 오래된 센서스는 정보공개법에 따라 전수 조사 자료를 공개한다. 전수 조사이기 때문에 매 10년마다 이루어진 센서스에 각 개인이 여러 번 조사되고, 부모와 같이 살다가 독립한 개인도 당연히 조사된다.
이번에 IPUMS에서 한 것은 접근제한이 풀린 전수 조사 센서스의 개인을 센서스 간에 링크시킨 것이다. 예를 들어, 1900년에 부모와 살다가 1920년에 커서 독립한 사람이 1940년에 어떻게 살고 있는지, 각 1900, 1920, 1940년 센서스 자료를 링크시켜서 알 수 있게 해놨다.
세대 간 사회이동, 세대 내 커리어 이동. 혼인패턴, 출산패턴, 무궁무진한 연구가 가능하다. 예를 들어 1900년대 초에 이루어진 보편 교육의 확대가 세대 간 사회이동과 세대 내 커리어 이동, 지역 이동에 끼친 인과 관계 연구도 가능하다 (이미 Rauscher 교수가 해서 상도 타먹은 연구).
실로 어마어마한 작업이다.
이에 반해 한국은 센서스의 교육 변수, 직업 변수 조차 제대로 공개를 안한다. 직업 변수라고 공개하는게 대분류. 인구총조사에서 소득도 묻지 않고, 그나마 사회경제적 변수인 직업은 상세 직업은 공개 안하고, 1-digit 대분류만 공개하는데, 그것도 연도별로 기준이 다르다. 한마디로 교육에 따른 사회경제적 지위 변화의 추이라는 기초적 변화조차 제대로 파악하기 힘들다. 출생지역과 현재 거주 지역에 대한 정보도 제대로 없다.
이렇게 공개를 안하는 이유를 물어보면 국가 기밀 보호란다. 기가 막혀서. 아마 전세계에서 센서스를 제대로 공개하지 않는 이유로 국가 기밀을 드는 나라는 국민이 아사로 죽어나가는 세습독재체제인 북한과, 한국 둘 뿐일 것이다. (일본도 그러려나?)
데이터 공개는 연구를 무료로 외주주는 것과 유사한 효과가 있다. 한국같이 전문 인력이 부족한 국가는 연구 무료 외주가 더욱 더 필요하다.
일부에서는 한국 같이 고학력자가 많은 나라에서 전문 인력이 왜 부족하냐고 질문할 것이다.
국가 운용과 연구를 위한 전문 인력은 인구 대비 상대적 비율이 중요한게 아니라, 절대 숫자가 중요하다. 예를 들어, 어느 나라나 필요한 지도자와 각료의 수는 비슷하다. 인구가 적으나 많으나 유사한 숫자의 엘리트가 필요하다.
연구도 마찬가지다. 한국은 (적어도 사회과학에서는) 모든 전문가에게 제너럴리스트가 될 것을 요구한다. 연구로 카버해야 할 영역은 많은데 각 영역의 필요성에 비해 세부 전문가가 부족하기 때문이다.
세부 전문가를 대접하기 싫어서가 아니라 큰 그림 그리는데도 인력이 부족하니 세부 전문가 대접할 겨를이 없다. 당장 필요한 큰 그림에 딱맞는 얘기를 못하니 세부 영역 전문가 대접은 더 소홀해지기 마련이고, 연구자도 수요에 맞춰 전문가의 길보다는 제너럴리스트의 길을 가게 된다.
한국은 전문 인력이 부족하고, 전문 인력이 부족한데로 외국에서 교육받은 전문가를 제너럴리스트로 바꿔서 사회를 운영하는 시스템이 훌륭하게 구축되어 있다. 비꼬는거 아니다. 이런 시스템을 구축하는게 필요했다. 그러다보니 전문 인력을 또 필요로 하지 않는다. 상황이 바뀐 지금 전문가를 대접하지 않는다고 욕하는 것은 맥락을 고려하지 않은 것이다. 연구보다는 교육에 집중되었던 한국 대학의 과거 기능도 딱히 잘못된 것으로 보지 않는다. 오히려 자원의 효율적 배분이었지. 지금은 연구가 필요한 쪽으로 상황이 변했을 뿐.
이런 K-전문가-시스템에서 사회가 대략 잘 굴러가는데 가끔은 과부하가 걸린다. 이 번 코로나 사태도 그 중 한 예일 것이다. 추측컨데 전세계에서 코로나 관련 자료가 가장 체계적으로 구축된 나라가 한국일 것이다. 하지만 그 데이터를 이용한 분석은 한국에서 별로 안나온다. 그럴 수 있는 여유가 있는 전문가가 없으니까.
한국의 발전으로 전문가에 대한 수요는 바뀌었지만, 전문가는 여전히 부족한 상황에서, 이 문제에 대처하는 가장 손쉬운 대책은 자료를 공개하고 국내외 전문가들이 알아서 분석하게끔 하는 것이다. 그러면 국내 학자들도 자기 전문 분야를 구축할 수 밖에 없게 된다. 그 중에서도 제너럴리스트가 되는 사람이 생기는데, 이 분들의 지식의 깊이도 심화된다.
데이터 공개하라고 하면, 학자들이 자기 논문쓸려는 이기적 동기 때문이라고 하는 분들이 가끔 있다. 학자가 논문 쓰면 그게 쌓여서 국가 정책 마련에 도움이 되는거다.