한국은행 보고서, 한경 보도, 한겨레 보도

 

학생의 학습 잠재력이 동일할 경우, 부모의 경제력에 따라서 상위권 대학 진학률에 3배 차이가 난다는 연구 결과와 보도다. 한겨레 기사 제목은 "상위 대학 진학률 격차 좌우하는 75%는 ‘부모 경제력’"이고, 한경의 기사 제목은 "부모 경제력이 대학 진학 75% 좌우…입시제도 바꿔야"다. 보고서는 정책적으로 지역 비례 선발제를 제안한다. 

 

교육 성취에 눈꼽만큼이라도 관심이 있던 사람이라면 이 기사들을 보고 뭔가 이상하다고 바로 생각했을 것이다. 왜냐하면 교육 성취를 설명하는 부모 경제력은 분명히 있지만, 생각보다 크지 않다는게 그간 수 많은 연구에서 제시되었기 때문이다. 일반적으로 자녀의 교육 성취를 설명하는 제 1요인은 부모의 교육이다. 부모의 소득과 자산, 거주지역 등을 요인을 다 같이 고려해도  부모의 교육이 자녀 교육과 밀접한 관계가 있다. 그런데 한국은행 보고서는 상위 대학 진학의 75%가 부모 경제력이 좌우한다고 과감하게 주장한다. 

 

도대체 어떤 자료와 방법론에 근거했는지 살펴보지 않을 수가 없다. 그랬더니 사용자료가 <한국교육종단연구>다. 이 자료를 이용해서 소득을 5개 분위로 나누고, 중1 수학성취도 점수를 학생의 잠재력 변수로 사용해서, 학생의 잠재력이 소득 상위 20%와 나머지 80%의 상위권 대학 진학 확률 격차를 얼마나 설명하는지 분석한거다. 중간에 약간의 간단한 기술적 방법을 사용하기는 했지만, 단 한 개의 변수를 통제하고 이 변수의 설명력을 제외한 나머지 잔차 전체를 부모 경제력의 결정력으로 추정한거다. 의아했다. 

 

이 보고서에서 저자들은 자신들이 사용한 방법론을 그 유명한 Chetty가 저자로 포함된 Bell et al (2019)의 논문과 같다고 방어한다. 하지만 Bell et al.은 여러 데이터를 짜집기하는 한계로 인해 통제할 수 있는 변수가 한정되어 있다. 이와 달리 <한국교육종단연구> 는  수학성적을 포함한 인지적 성취, 자아개념 공동체 의식, 자기 관리, 진로계획 같은 비인지적 성취, 학습태도, 학교 특성, 학교 생활, 방과 후 활동, 진로 계획, 부모의 교육수준, 가족구조, 직업, 소득, 과외비 지출 등등 어마무시한 양의 정보를 제공한다.

 

도대체 왜 이 모든 변수를 무시하고 단 1개의 변수만을 통제한 후 잔차 모두를 부모의 경제력 차이라고 주장하는건가? 이는 마치 성별 소득 격차를 보면서, 중학교 때 성적을 통제한 후 설명되지 않고 남는 차이 모두를 능력이 같아도 임금을 적게주는 여성차별로 간주하는 것과 비슷한 주장이다. 

 

그런데 Bell et al의 방법론과 이 보고서의 방법론이 완전히 같은 것도 아니다. 비슷해 보이지만 중요한 차이가 있다. 우선 아래 그래프를 보시라. 학생 잠재력 3분위까지는 부모 소득 효과가 매우 미약하고, 4분위부터 나타나기 시작하는데, 거의 모든 격차는 최상위 5분위에 집중되어 있다. 이 그래프를 보면 학생 잠재력 5분위(상위 20%) 내에서도 잠재력 정도에 따라 상위권 대학 진출에 큰 차이가 있을 가능성이 매우 크다는 것을 알 수 있다. 예를 들어, 잠재력 상위 5% vs 상위 16-20%에 해당하는 학생 사이에 큰 격차가 있을 수 있다. 전체 학생 중 상위권 대학 진학자가 6%가 안되니 상식적으로 나올 수 있는 합리적 의심이다.  

 

여기서 질문은 부모 소득 하위 80% 학생의 잠재력 5분위 내에서의 분포와 부모 소득 상위 20% 학생의 잠재력 5분위 내에서의 분포가 같을 것인가다. 보고서의 가정은 같다는 것이다. 하지만 소득 상위 20% 부모를 둔 학생 중 잠재력 상위 20%의 내부 잠재력 분포는 소득 하위 80% 부모를 둔 학생 중 잠재력 상위 20% 속하는 그룹의 내부 잠재력 분포와 다를 수 있다. 같은 잠재력 상위 20%라도 그룹 별 평균과 분포가 다를 수 있다. 예를 들어, 잠재력 최상위 5%에서의 소득 상층의 비중이 상대적으로 더 높고, 잠재력 6-20%에서의 소득 상층 비중이 상대적으로 덜 높을 수 있다. 이 경우 부모 경제력에 따른 잠재력 20% 학생들의 상위권 진학 확률 격차는 잠재력이 같은데도 불구하고 부모 배경에 따라 진학 확률이 달라지는게 아니라 잠재력 자체가 달랐던 거다. 이러한 의심을 무시하기에는 소득과 학생 잠재력을 5개 분위로 나눈 것은 지나치게 러프하다. 

 

 

한국은행 보고서가 참고한 Bell et al의 논문은 학생 잠재력을 5개 분위가 아니라 20개 분위 (ventile)로 나눈다. <한국교육종단연구> 의 최초 표본수는 7천명이 넘고, 6차 조사의 응답자도 6천명이 넘는다. 5개 분위로 거칠게 추정할 이유가 없는데도 저자들은 굳이 그렇게 했다. 

 

이 보고서를 인용한 또 다른 보도는, "한은 “서울대 진학률, 거주지가 92% 좌우… 지역별 비례선발 도입을”"이라고 제목을 뽑았다. 학생의 잠재력이 아니라 거주지가 92%를 설명한다는 분석은 학생들의 잠재력을 실제로 조사한 것이 아니다. 소득과 지능의 상관계수, 부모 지능과 자녀 지능의 상관계수(한국도 아닌 외국 연구 결과)를 이용해서 학생들의 잠재력을 순전히 통계적으로 추정한 후 지역별 서울대 진학 확률의 설명력을 계산한 것이다. 매우 거친 추정이고, 당연히 서울대 진학 확률의 아주 작은 부분 (= 8%) 밖에 설명하지 못한다. 설명 변수가 부정확하니 당연한 결과다. 그런데 이런 결과를 가지고 학생 능력이 아니라 거주지가 서울대 진학의 92%를 설명한다고 주장해도 되나? 설명변수 대충 만들고 그 변수가 종속변수의 집단 간 차이를 거의 설명하지 못하면, 그걸 모두 "집단"의 효과로 보는 분석이다.   

 

Residual approach라고 통제 가능한 모든 변수를 다 통제해도 남는 격차를 집단의 순효과로 보는 통계적 방법이 있다. 납득이 되는 방법이지만, 그럼에도 불구하고 진정한 인과관계 효과는 아니라는게 지금까지 경제학에서 그토록 목소리 높여 주장하던거 아니었나?  조금만 결과가 이상해도 그렇게 따져묻던 사람들은 모두 어디로 간건지.   

 

정책의 취지가 좋다고, 이런 식으로 분석해도 되는건가? 이렇게 분석했는데도 이 결과에 대한 비판을 제가 접하는 SNS상에서 거의 보지 못했다. 이 결과는 왜 이렇게 아무런 의심없이 받아들이는건지.

Posted by sovidence
,