중앙일보 칼럼. 논문 링크

 

최저임금이 1% 오를 때 고용이 0.5%씩 줄어든다는 매우 충격적인 논문과 칼럼. 

 

그래서 논문을 후다닥 살펴봤는데 좀 이해가 안됨 (이 번 포스팅은 전문지식이 없는 분들이 읽기에는 조금 어려울 듯. 블로그 글로 어울리지 않는 테크니컬한 내용이지만 중앙일보에 실린 매우 강한 주장이라 걍 씀). 

 

이 논문에서 연구 방법론 기술에 오류가 없다면, 종속변수는 지역별 고용률의 변화 dE = ln(E_t) - ln(E_t-1)임. first difference임. 종속변수 자체가 고용률의 변화임. 그런데 모델은 지역 고정효과모형(FEM)을 사용. FEM은 통계 효과의 측면에서 demeaned regression임. 지역 효과 fixed effects를 모두 통제함으로써 각 지역별 mean 효과를 모두 0으로 맞춰주는 그런 분석임. 이렇게하면 회귀 분석 값은 지역 "내" 변화에 따른 독립변수와 종속변수의 관계를 볼 수 있음. 

 

김낙년 교수의 분석은 일반적으로 사용하는 FEM 모델에 first difference 변수를 사용함으로써 FDM을 FEM에 삽입한 꼴. 제가 과문한 탓인지 사회학에서는 이런 식으로 분석하는 패널 모형을 본 적이 없음. 경제학에서는 사용되는 모형인지? 

 

이 논문처럼 FDM을 FEM에 삽입하여 분석하면 종속변수가 지역별 고용률의 변화가 아니라, 지역별 고용률 변동의 변화가 됨. 예를 들어 3개년도의 고용률이 70% (t1)--> 73% (t2) --> 74% (t3)로 바뀌면 일반적인 FEM에서는 3%포인트 증가, 1%포인트 증가로 2개 관찰값이 종속변수가 되지만, 김낙년 교수의 방법론에서는 3%포인트 증가에서 1%포인트 증가로 감소한 -2%포인트 1개 관찰값이 종속변수가 됨. t1과 t3 사이에 전체 고용률이 4%포인트 증가했는데, 종속변수는 -2%포인트 감소하는 것이 되어 버림. 고용률을 예로 들었는데, 고용률이 아니라 ln(employment)로 해도 함의는 같음. 

 

이에 반해 독립변수(= 최저임금에 영향을 받는 인구의 비율)는 first difference가 아닌 FEM에서 일반적으로 사용하는 lagged variable을 사용하였음. 따라서 독립변수는 t2 시점에서의 t3의 최저임금 인상에 영향을 받는 집단 비율의 demeaned value임. 

 

개념적으로 두 개 시점만으로 단순화해서 표현하면 rho{[dE(t3-t2) - dE(t2-t1)], dF(t2-t1) | X}를 계산한 것이 김낙년 교수의 베타값. 

 

이 경우 김낙년 교수의 분석은 최저임금에 영향을 받는 인구의 변화에 따른 고용률 등락폭 변화의 평균임. 고용률 변화의 평균이 아님. 이 수치가 의미가 있는 것임? 

 

이러한 분석은 연간 성장률을 계산할 때 연평균 성장률 변화의 평균으로 연평균 성장률을 계산하는 것과 같은 문제가 아닌지? 

 

 

 

 

또한 가중치가 제대로 적용된 것인지 의문. 논문에 제대로 안적은 것인지, 아니면 제가 못찾은 것인지 모르겠음. 이 논문에서 분석 단위는 통계청에서 제공하는 시군임. 그런데 통계청에서 광역대도시 내 구별 단위의 자료는 제공하지 않음. 따라서 광역시 전체가 하나의 유닛이 됨. 반면 작은 군도 하나의 유닛임. 어쩔 수 없는 자료의 한계인데 이를 보완하기 위해서는 인구수에 따른 가중치를 부여해야 함. 그러지 않으면 인구수가 작은 시군의 효과가 과장되게 대표되고, 전체 노동 인구의 절반을 차지하는 8개 광역시도의 효과가 과소 대표됨. 가중치를 제대로 적용했는지? 

 

 

 

 

그래서 지금 지적한 문제가 논문의 실제 오류라면 최저임금이 오르면 고용이 줄어든다는 김낙년 교수의 결론이 바뀌는가? 그건 알 수가 없음. 편향의 방향은 부정정일수도 긍정적일수도 있음. 따라서 이 논문으로 알 수 있는 것은 아무 것도 없는 것 아닌지?  

 

 

 

 

이게 제가 논문을 살펴보고 가지는 의문인데, 제가 뭘 놓치고 있는 건가요? 이 블로그를 보시는 경제학자분들께 조언을 구합니다. 

Posted by 바이커 sovidence