R-squared

인구 통계 2021. 7. 1. 23:41

이 블로그에서 R-squared라는 제목의 포스팅까지 하네요. 

 

제가 기초통계 수업에서 얘기하는 것 중의 하나가 R-squared(R^2)너무 신경쓰지 말라는 것이다. R2에 대한 태도를 보면 이 분이 통계를 언제배웠는지, 얼마나 지식을 업데이트 안했는지, 대충 감이 잡힌다. 

 

현존하는 경제통계의 최고 대가가 누구인지는 논란이 있겠지만, Jeffrey M. Wooldridge의 경제통계 교과서가 거의 표준 비슷하게 널리 사용된다는데는 큰 이견이 없을 것이다. (이 분 최근에 twitter 시작하셨다.)

 

이 분이 쓴 Introductory Econometrics: A Modern Approach에 이런 구절이 나온다. 

 

"In the social sciences, low R-squareds in regression are not uncommon... Students who are first learning econometrics tend to put too much weight on the size of the R-squared in evaluating regression equations. For now, be aware that using R-squared as the main gauge of success for an econometric analysis can lead to trouble."

 

통계 처음 배우는 학생들이 R2 너무 강조하는 경우가 있는데, 통계 분석에서 R2를 잣대로 삼다가는 트러블에 빠질 것이다라는 Wooldridge 선생의 경고.

 

이 분 교과서의 "단순 회계 분석"에 나오는 구절이고, 이 분의 서문에 따르면 이 책을 학부생이나, 석사생을 대상으로 썼다. 저도 아직 이 책을 가끔 뒤적이며 배우는 사람이라 이 책이 반드시 학부생을 대상으로 했다고 하면 섭섭하다. 

 

하지만, R2를 너무 강조하지 않고 R2로 모델을 판단하지 않는게, "modern approach"다. 더욱이 로짓 모델에서 Stata의 낮은 R2를 문제삼으면 지적하기도 민망하다. 

 

 

 

Ps. 언젠가 들은 얘기로 학자가 방법론에서 완전히 손을 놓으면 대충 학자로써의 생명은 끝난다는 것이다. 방법론에 대한 새로운 논문들이 쏟아져 나와서 다 따라가기는 불가능하지만, 사회학 방법론 저널의 제목 정도는 체크해 볼려고 한다. 

Posted by sovidence
,