한국 성별 소득 격차의 1/3~1/4은 여성 혐오에 기인
Kim & Oh. (2021) Taste-based Gender Discrimination in South Korea. SSR. (12월16일 까지 무료 다운로드 가능, 그 이후에는 요기서 유료나 기관 계정으로 접근 가능).
지난 2019년 초에 발표했던 "경력단절 이전 여성은 차별받지 않는가?"의 후속 논문. 이 번 주제는 대졸 직후 경력단절이 발생하기 이전의 성별 소득 격차가 여성 비선호(=혐오)에 기인하는지 아니면 통계적 차별인지 검증하는 것. 이번에도 대졸자직업이동경로조사(GOMS)를 활용했다.
한국에서 성별 소득 격차에 대한 논리는 대략 5가지다.
(1) 여성은 남성과 추구하는 바(preference)가 다르다.
(2) 여성이 결혼을 해서 경력단절이 있기 때문에 성별 소득격차가 발생하지 20대는 성별 소득 격차가 없다.
(3) 남성은 공학을 전공하고 여성은 인문학을 전공하기 때문이다.
2019년 논문은 이 세 논리가 성립하지 않는다는걸 보여줬다. 같은 학교, 같은 학과, 같은 학점에 경력단절 이전이라도 여성의 임금이 남성보다 18% 가량 낮다. 심지어 직업을 통제해도 성별 격차는 여전하다.
2019년 논문의 결과를 받아들여도 (1)은 여전히 남는거 아니냐고 할텐데, preference의 지표로 많이 사용되는게 학력과 전공이다 (경제학 원론 하나 본 분들은 Handbook of Labor Economics의 Altonji & Blank 챕터 참고하실 것). preference가 가장 중요한 이유면 학력과 전공이 성별 임금 격차의 상당 부분을 설명해야 한다. 위에서 설명했듯, 안그렇다. 오히려 학력 전공을 통제한 후에 성별 소득 격차는 더 커진다. 따라서 2019년 논문이 (1)도 완전하지는 않지만 대략 설명력이 높지 않다고 보여준다.
그러면 여성 차별이 남는다. 그런데 차별도 종류가 다르다. 하나는 일부에서는 차별하는게 당연하다고 주장하는 차별이고, 다른 하나는 누구나 극구 아니라고 부인하는 차별이다.
(4) 통계적 차별: 여성은 남자보다 생산성이 낮기 때문에 차별한다. 생산성이 높기만 하면 해당 여성은 차별하지 않을텐데, 개별 여성의 생산성을 알지 못하기 때문에 어쩔 수 없이 성별을 생산성의 지표로 사용해서 여성에 대해 전반적으로 차별할 뿐이다.
(5) 선호기반 차별: 그냥 여자라서 차별한다.
통계적 차별도 차별인데 어찌된 일인지 많은 사람들이 이건 해도 괜찮은 차별이라고 생각한다. 한국만 그런건 아니다. 통계적 차별 논리를 배운 다음에는 더욱 차별적으로 되는 현상이 다른 국가에서도 발견된다 (올해 ASR Tilcsik 논문). 예전에는 차별은 막연히 나쁘다고 생각하던 사람들이 통계적 차별 논리를 배우면, 나서서 차별이 정당하다고 당당하게 주장한다. 진짜 아는게 병이다.
문제가 더 복잡해지는건 한국에서 여성에 대한 통계적 차별은 여성의 생산성 "지표(signal)"가 명확하지 않기 때문이 아니라, 결혼과 출산 후 경력단절로 이어질 것으로 기대하기 때문에 발생한다. <현재의 지표>가 아니라 <미래의 기대>에 의한 차별이다. 이 때문에 학력, 전공 등 현재의 지표를 아무리 통제하더라도 통계적 차별을 하지 않을 근거가 되지 못한다. 미국의 인종차별 연구와 가장 다른 지점이다. 정보(=생산성 지표)의 부족 때문에 의한 차별이면, 개별 여성의 학력과 전공이 차별을 줄일 수 있는 근거가 되지만, 미래 행동에 대한 기대에서 발생하는 차별은 개별 여성의 현재 정보로는 아무 것도 판단할 수 없다. 통계적 차별을 옹호할 수 있는 근거가 강력하다. 과거 자료에서 여성의 이직률이나 노동시장 탈락률이 높기만 하면 된다. 여성의 소득이 낮은 이유라고 모두가 믿고 있는 경력단절이 바로 통계적 차별의 근거다. 통계적 차별을 겪은 여성은 노동시장에서 탈락하는 확률이 높아지고 이는 다시 통계적 차별의 근거가 된다. 이 때문에 통계적 차별은 순환적 차별(circulation discrimination)이다. 인종차별과는 다른 이러한 특수성 때문에 한국의 여성차별은 여성을 혐오하기 때문에 생기는 선호기반 차별인지, 경력단절 기대로 인한 통계적 차별인지 구분하기 어렵다. 선호기반 차별은 고용주의 "선호"를 알아야 하는데, 이 심리상태를 알 방법도 없다.
그래서 생각해낸 아이디어가 지역 격차를 이용하는 것이다. 이 아이디어는 지난 2019년 논문 발간 후 달린 수많은 댓글중 여성은 지방을 가기 싫어한다는 주장에서 얻었다 (감사! 논문의 핵심 내용은 사실 2019년에 이미 발표. 수많은 robustness checks을 거쳐서 이제서야 논문이 나온 것). 개별 고용주의 성별 선호는 알 수 없지만, 지역별 성별 태도의 차이는 측정할 수 있다. 바로 지역별 신생아 성비를 지역별 노동시장에서의 성별 선호의 대리변수로 이용하는 것이다.
선호기반 차별 검증에서 지역 간 격차를 이용하는 것이 저의 고유한 아이디어는 아니다. 경제학 톱저널의 하나인 Journal of Political Economy에 실린 Charles & Guryan의 논문이 미국에서 지역별 인종차별 인식을 이용해서 선호기반 인종 차별을 측정했다. Charles & Guryan 논문의 가정은 지역별 인종차별 인식을 고용주도 공유한다는 것인데, 여성 차별 논문에서도 이 가정을 그대로 적용했다.
논문에서는 지역별 신생아 성비 중에서도 1990년대의 신생아 성비를 이용했다. 성비는 "자연성비"가 있다. 대략 105-6 정도다. 자연성비에서 벗어나는건 인위적 선택의 결과다. 남아 선호가 있어도 자연성비를 유지할 수 있지만, 남아 선호 없이 자연성비에서 벗어날 수는 없다. 자연성비는 "자연"이기 때문에 지역의 경제적 특성과도 무관하다. 지역의 임금 수준과 성비는 무관해야 정상이다. 자연성비를 벗어난 성비는 남아선호의 지표이다. 혹자는 성비가 지역의 경제상황 등을 반영한다고 할텐데, 맞는 말이다. 그런데 지역의 경제상황이 성비에 반영되는건, "경제상황 --> 남아선호 인식 발생 --> 성비 증가"의 경로를 겪는다. 남아선호라는 문화적 현상 없이 경제상황이 성비 증가로 그래도 이어지는게 아니다. 한국은 1990년대 전반에 걸쳐서 전체 성비가 110이 넘는다. 그 전이라고 남아선호가 없는건 아니었다. 하지만, 90년대 이전에는 아들이 생길 때까지 낳았다. 90년대는 초음파 검사와 낙태로 인해 성비가 급등했다. 셋째 이상 성비는 무려 170에 달했다. 드러나지 않던 남아선호의 지역별 차이가 1990년대에 드러났다.
또한 1990년대 신생아 성비는 2010년대의 인구 행동, 노동시장 행위 결정과 무관하다. 현재의 성비와 현재의 성차별 인식을 변수로 사용하면 endogeneity 문제를 피할 수 없다. 현재의 인구행동이나 성차별 인식은 성별 소득과 역인과관계일수도 있다. 하지만 1990년대 성비는 2010년대 대졸 직후 노동자의 인구 행동과 무관하다. 1990년대의 지역별 성비는 현재도 지속되는 지역별 성차별 문화의 대리변수로만 작동한다. 그렇기 때문에 지역별 성비를 지역별 성차별 인식의 대리변수로 사용할 수 있다.
우야튼, GOMS 자료와 지역별 성비를 합쳐서 아래와 같은 모델을 측정하였다.
ln y = a + b1 (Female) + b2 (Regional Sex Ratio) + b3 (Female * Sex Ratio) + c X + e
여기서 관심사는 기본적인 여성 불이익인 b1에 더하여, <여성변수와 지역별 변수의 상호작용항>인 b3가 음의 값을 가지는가다. 성비는 자연성비인 105로 센터링했다. 그러니 b1은 자연성비일 때의 여성의 소득 불이익 정도를 나타내고, b2는 지역별 성비가 자연성비에서 1 증가할 때 남성의 소득이 얼마나 증가하는지를 나타내고, b3는 지역별 성비가 자연성비에서 1 증가할 때 해당 지역의 남성대비 여성의 소득이 얼마나 바뀌는지를 나타낸다. 따라서 이 논문의 핵심은 b3가 음의 값이 나오는가 여부다.
분석 결과, 4년제 대졸자를 대상으로 구체적인 대학, 세부 전공, 학점, 출신 고교, 연령 등등 모든 변수를 통제한 후에 b3의 값은 인적자본 통제 이전에는 -.0101이었고, 통제 이후에는 -.0073였다. 이 결과는 99.9% 신뢰 수준에서 유의했다. 표준오차는 당연히 clustered standard error를 사용했다.
남아 선호가 심한 지역일수록 여성의 남성대비 소득 불이익이 컸다.
좀더 알 수 있게 설명하면, 한국에서 성비의 지역별 차이는 대략 10포인트다. 이 크기면 성비가 가장 높은 지역의 여성은 가장 낮은 지역의 여성보다 소득이 7~10% 정도 더 낮다는 의미다. 참고로 한국에서 90년대에 신생아 성비가 가장 높았던 지역은 대구-경북이고, 가장 낮았던 지역은 전북이다. 여성이 서울에서 일하는 것과 성비가 가장 높은 지역에서 일하는 것을 비교하면, 다른 모든 조건이 같을 때 성비가 큰 지역에서 불이익이 7% 더 커진다. 이 불이익은 b1로 측정된 기본적 불이익(대략 10%)에 추가로 부여된 불이익이다. 어떤 모델을 사용하는지에 따라 1/4~1/3 정도의 성별 소득 격차가 성비로 측정된 taste-based discrimination으로 설명된다.
그런데 이 논문에서 측정한 선호기반 여성차별은 실제보다 낮은 보수적 추정일 가능성이 높다. 이 논문의 선호기반 여성차별은 성비가 자연성비에서 벗어날 때만 측정 가능하다. 만약 자연성비에서도 여성혐오를 모든 지역이 일정 정도 공유한다면, 이 차별은 본 연구에서는 측정되지 않는다. 달리 말해 b1으로 측정된 자연성비에서의 여성 불이익의 일부가 선호기반 여성차별에 기인한다면, 본 연구의 방법론으로 측정한 선호기반 차별은 과소추정이 된다. 당연히 그럴 가능성이 크다.
그래서 결론은 한국의 성별 소득 격차의 상당 부분이 통계적 차별이 아니라 여성 혐오에 기인한 선호기반 차별이다. 그러니 통계적 차별 논리로 선호기반차별을 정당화하는 주장은 이제 그만 두기를.
한 가지 추가로 강조할 점은 b2의 값이다. b2는 남성의 지역별 평균 소득이 성비에 따라서 어떻게 달라지는지를 나타낸다. 성비가 남아선호와 여성혐오를 나타내는게 아니라, 우연히 제조업 중심 지역에서 더 높아서, 지역별 산업구성의 차이를 나타낸다면, b2는 통계적으로 유의하게 긍정적일 것이다. 하지만 b2는 0이다. 단순히 통계적 유의도가 없는게 아니라, 절대값이 0이다. 학력과 전공을 통제한 후 지역별 성비와 지역별 남성의 평균 소득은 전혀 상관이 없다. 오직 성비는 여성의 소득과만 음의 상관을 지닌다.
이게 논문의 핵심 내용이고, 논문의 상당 부분이 여러 다른 상황과 변수를 사용해도 결과가 같은지 검증하는데 할애되었다. 구체적인 내용은 논문을 보시길.
Ps. 아래가 대략 추가적 검증 내용들이다.
- 성비가 아니라 현재의 지역별 성평등 인식을 변수로 사용해도 결과는 마찬가지다. 다만 이 때는 지역별 성평등 인식이 낮은 지역에서 남성의 소득이 올라가는걸로 나온다. 그러니 현재의 성평등 인식은 선호기반 차별을 측정하기에 좋은 변수가 아니다.
- 1990년대 성비가 아니라 2000년대 셋째 이상 성비를 사용하거나, 1990년대 셋째 이상 성비를 사용해도 결과는 마찬가지다.
- 노동시장의 할당(=산업, 직업, 회사규모, 정규직 등)을 통제하면 여성의 기본불이익인 b1는 35% 정도 설명되는데, b3는 노동시장 할당을 모두 고려해도 15% 정도 밖에 줄지 않는다. 즉, 여성혐오에 의한 차별은 노동시장 할당으로도 설명되지 않는 "순수한" 여성 소득 차별이다.
- 지역별 여성의 인구행동인 혼인율, 출산율, 육아휴직율, 평균 가사노동시간을 모두 통제해도 결과 안바뀐다.
- 지역별 육아휴직율은 통계적 차별과 선호기반 차별 모두의 대리변수가 될 수 있다. 통계적 차별이면 고용주들이 이 통계에 근거해서 여성 고용을 꺼려서 (female*육아휴직)의 계수값이 음의 값이 될 것이고, 선호기반 차별의 경우에는 지역별 육아휴직율이 여성우호의 지표이기에 (female*육아휴직)의 계수값이 양의 값이 될 것이다. 결과는 양의 값이다. 지역 격차는 통계적 차별로는 설명이 안되고 선호기반 차별로만 설명된다.
- 혹시 지역별 성비가 지역별 30대 여성의 노동시장 참여율과 관련이 있는지도 점검해보았다. 성비가 높은 지역에서 여성 노동시장 참여율이 낮다면, 성비는 선호기반차별이 아닌 통계적 차별의 근거가 될 수 있다. 30대 초반 여성의 지역별 노동시장 참여율은 지역별로 대졸 직후 20대 여성을 통계적으로 차별하는 근거가 될 수 있기 때문이다. 하지만 둘은 상관관계가 전혀 없다. 지역별 30대 여성 뿐만 아니라 30-40대의 노동시장 참여율을 성비 대신 대리변수로 사용하여 (female*LFR)을 측정했지만 전혀 유의하지 않았다.
- 논문에서 공공부문 노동자와 교사는 사기업의 차별 대상이 아니기 때문에 제외했는데, 이 표본 제한이 결과에 영향을 끼치는지 점검(포함해서 분석 + Heckman selection model)해봤지만 결과는 동일하였다.
- 특정 outlier 지역 때문에 결과가 왜곡되는지 알아보기 위해서 각 지역을 돌아가면서 빼고 측정했지만 결과는 동일하다.
- 논문에서 clustered standard error를 사용했지만, 더 보수적으로 표준오차를 계산하기 위해서 회귀분석의 모든 통제 변수 부여 후에도 남는 지역별 성별 격차만을 종속변수로 표본수를 광역시도 16개로 크게 줄여 표준오차가 과대 계상되게 측정했지만 결과는 마찬가지다. 여전히 통계적으로 유의하다.
- 어떤 지역에서 일하는지는 자신의 선택이라서 지역 선택 편향이 결과를 왜곡할 가능성은 없는지 IPTW라는 기법으로 성비가 높은 지역과 낮은 지역의 선택 확률을 통제했지만 결과 안바뀌었다.
Pps.
평소 탕탕절 같은 용어 사용에 그렇게 호의적이지 않았는데, 이 번 따블 탕탕절은 주말에 위스키 더블샷으로 기념할 예정이다.