1985년에 ASR이라는 사회학 탑저널에 Jasso라는 양반이 논문을 발표했다. 부부간 성관계에서 결혼기간과 코호트 효과를 통제했더니만, 부인의 연령은 성관계 횟수를 증가시킨다는 것이다. 나이든 아내의 섹스 어필이 젊은 아내보다 사실은 훨씬 매력적이라는 쇼킹한 결과였다. 이 전의 거의 모든 연구가 부인의 연령이 증가하면 성관계 횟수가 줄어든다고 보고했는데, 이 결과를 뒤집는 것이었다.

이 결과를 도저히 믿을 수 없었던 Kahn과 Udry란 학자가 Jasso가 사용한 데이타를 면밀히 검토한 결과, Jasso의 그 결과는 데이타 클리닝을 제대로 하지 않았기 때문이라는 반박논문을 1986년에 발표한다. Jasso가 사용한 데이타에 4주간 성관계 횟수가 88회라고 기록된 케이스가 4개 있는데, 이건 사실 99라는 자료누락 코드의 오타라는 거다.  Jasso는 99는 분석에서 제외했지만, 88은 제외하지 않았다. 이 4 케이스를 제외하면 결과는 완전히 뒤바뀐다. 아내가 나이가 듦에따라 성관계 횟수는 감소하는 걸로.

Jasso의 논문은 빈도분포와 기본 플랏을 그려보지 않은 기초적인 자료 점검 오류에 기인한다. 절대 다수가 한 달에 10회 미만인데, 한 달 88회라는 아웃라이어가 딸랑 4개 있다면, 당연히 분석에서 제외해야 한다. 이런 아웃라이어는 평균을 계산할 때는 안잡혀도 산포도를 그리면 바로 나온다.

여기까지는 Jasso가 한 번 창피를 당하고 마는 스토리다.

그런데 Kahn & Udry의 정확한 지적에 대해서 Jasso는 실수를 인정하는 대신에, Reply 논문을 통해서, 한 달 88회 부부 간 성관계는 99의 오타가 아니라는 식으로 적극 방어하였다. Outlier retention이 어쩌고 저쩌고하면서 복잡한 통계식까지 동원하면서 빠득빠득 우겼다.

그 덕분에 상당히 유능한 인구학자이자 통계적 능력이 뛰어났던 Jasso는 전체 사회학자의 비웃음의 대상이 되었고, 그의 논문은 기초적인 빈도표와 산포도를 그리지 않으면 어떤 실수를 하게 되는지, 실수를 하였을 때 인정하지 않는게 얼마나 도덕적으로 나쁜 것인지를 대표하는, 수업 교재로 쓰이는 교과서적 케이스가 되었다.



이 번 논란에서 국가연구기관으로써 KISDI의 공적 기여도를 따지라면, 우리에게 타산지석으로 삼을 수 있는 수업 교자재 하나 제공했다는 걸 거다. 학계에서도 실수는 누구나 한다. 하지만 누구나 실수가 발견된 후에 빠득빠득 자신이 옳다고 우기지는 않는다.

오류사례의 한국화! 장하다.
Posted by sovidence
,