처음 글은 전문적 지식이 없는 분들에게 조금 어려웠을 것. 이 포스팅에서는 왜 김낙년 교수의 방법론에 문제가 있다고 생각하는지 조금 쉽게 설명하고자 하지만... 전문 지식이 없는 분들은 여전히 이해하기 어려울 것. 다만 FDM, FEM에 대한 기초적인 이해가 있는 분들은 제가 왜 최저임금 효과 측정에서 FD에 FEM을 추가하면 안된다고 보는지 이해하실 수 있을 것.
김낙년 교수의 방법론은 작년과 올해의 고용자수 격차(이를 first difference, FD라고 함)를 종속변수로, 올해 최저임금 인상으로 영향을 받는 인구의 비중을 독립변수로 사용함.
각지역별 데이터가 2008-2018년까지 여러 해인데, 지역별 효과를 더미변수로 모두 통제하는 고정효과모델(FEM)을 추가. FEM의 효과는 demeaning인데, 이는 모든 지역의 종속, 독립변수의 평균값이 0으로 맞춰지도록 바꾸는 효과. 그래서 지역별 격차가 모델에 끼치는 영향은 사라짐. 남는 것은 지역 "내"에서의 독립변수의 변화에 따른 종속변수의 영향.
일반적으로 지역고정효과를 통제하는 것이 인과관계추정에 더 근접했다고 여겨짐. 김낙년 교수는 아마도 그래서 지역고정효과를 추가했을 것. 2016년에 노동연구논집에 실린 이 전 연구의 사례도 있고. (논문을 알려주신 아난시님과 논문의 문제점을 지적해주신 열쇠님께 감사!)
하지만 김낙년 교수식의 분석은 최저임금의 효과를 둘러싼 논의의 실체에서 벗어나게 됨.
최저임금 논쟁은 최저임금을 올리면 고용이 줄어드느냐임. 최저임금을 올렸을 때 고용증가가 0이면 최저임금은 고용을 줄이는 것이 아님. 그런데 김낙년 교수의 종속변수는 고용률의 연도별 격차가 아니라 고용증가률의 격차임. 이 경우 로그전환한 고용이 첫해에 10.3에서 20% 정도 올라 10.5가 되었다가 그 다음해에 10.5로 유지가 되면, 0 - .2 = -.2로 마치 고용이 줄어드는 것과 같은 효과가 발생함.
예를 들어 보면 좀 더 쉬울 것.
김낙년 교수의 방법론은 지역 내 효과만 보기 때문에 한 지역의 사례를 들어서 설명하는 것으로 충분. 아래 표에서 최저임금에 영향을 받는 사람(F)이 10%였을 때는 고용이 10.9에서 변하지 않다가, 최저임금에 영향을 받는 사람이 15%가 되었을 때는 고용이 줄기는 커녕 매년 20%씩 증가함. 최저임금을 더 크게 올려서 최저임금에 영향을 받는 사람이 20%가 되었을 때는 고용이 첫해에 10% 줄었지만, 그 다음 부터는 고용이 줄지 않고 유지됨. 한 가지 상기할 점은 F가 변하지 않는 것은 최저임금을 올리지 않았다는 의미가 아님. 최저임금 인상에 영향을 받는 인구의 비율이기 때문에 F가 변하지 않아도 최저임금은 오른 것. 최저임금을 매년 10%, 15%, 20%씩 올렸다는 것과 유사한 의미임.
따라서 아래 표와 같은 상황은 최저임금을 10년 동안 지속적으로 해가 갈수록 더 크게 올린 것. 이 지역에서 고용이 시작 해에는 10.9였다가 마지막 해에는 11.4로 .5 만큼 증가. 이는 고용이 50% 넘게 증가했다는 의미임 (실제로는 65%지만 이해를 돕기 위해 지수전환하지 않음). 10년에 걸친 최저임금의 무지막지한 인상은 고용의 엄청난 증가를 초래했다고 결론 내려야 함.
아무리 후퇴해서 해석해도 최저임금이 고용에 부정적 영향을 끼쳤다고 말할 수는 없음. 단 한 해 year 7에 year 6 대비 고용이 줄었을 뿐.
위 상황에서 고용(=lnE)과 최저임금(=F)의 상관관계는 강한 정의 상관임. 상관관계값이 .87
그런데 이 상황에서 김낙년 교수처럼 종속변수를 고용(=lnE)이 아니라 고용의 변화 (=d(lnE))로 바꾸고, d(lnE)와 F의 관계를 보면 부정적 상관을 보이게 됨. 상관관계 값이 -.13. 최저임금이 고용에 부정적 영향을 끼친다는 황당한 결론을 내리게 됨.
최저임금과 고용에 대한 논쟁은 최저임금이 고용을 줄이느냐 아니냐인데, 김낙년 교수 모델은 최저임금이 고용증가율을 낮추는가 아닌가로 바꾼 것. 이렇게 치환시키면 위에서 예를 든 것처럼 최저임금이 고용을 늘려도 증가율만 낮아지면 최저임금의 영향이 부정적인 것으로 나타남.
그래서 종속변수 FD일 때 지역고정효과를 삽입하면 안된다고 저는 주장하는 것.
그럼 김낙년 교수가 원래 참고로 삼았던 Card 모델은 무엇인가. Card 모델은 같은 지역의 연도별 변화를 보는 것이 아니라, 지역 간 차이를 보는 것. 각 지역별로 전년도 대비 고용 변화(=d(LnE))와 F의 관계를 보는 것.
김낙년 교수의 모델은 틀렸다고 생각하지만, 김낙년 교수의 주장인 최저임금이 고용을 줄인다는 것이 이 방법론적 문제로 틀렸다고 말할 수는 없음. 모델에서 지역고정효과를 제거하고 원래 Card의 아이디어인 지역 간 격차로 효과를 다시 측정하면 결과가 어떻게 나올지 알 수 없음. 만약 김낙년 교수가 지역고정효과를 유지하고 싶다면 종속변수를 차분값(=d(lnE))이 아니라, 고용(=lnE)으로 해야한다고 생각.
이상이 제가 FEM에서 종속변수로 차분값을, 독립변수로 차분하지 않은 값을 쓰면 안된다고 생각하는 이유임.
Ps. 추가적 문제점으로 clustered standard error를 사용하면 유의도가 달라질 것이라는 333님의 지적.