본문 바로가기
300_Novel/303_노벨경제학상

[2000 노벨경제학상] 제임스 헤크먼 & 대니얼 맥패든 : '선택'의 비밀을 푸는 통계학의 거장들

by 어셈블러 2025. 11. 18.
728x90
반응형

 

 

 

📜 우리는 매일 '선택'하고, 경제학자는 '편향'과 마주한다

 

우리의 삶은 매 순간 선택의 연속입니다. 아침에 버스를 탈까, 지하철을 탈까? 대학에 진학할까, 바로 취업할까? 이직을 할까, 현재 직장에 남을까?

우리가 무심코 내리는 이 선택들은 경제학자들에게는 거대한 수수께끼이자 난관이었습니다. 왜냐하면 사람들이 '선택'을 한다는 사실 자체가, 데이터를 심각하게 왜곡하기 때문입니다.

여기 두 가지 거대한 질문이 있습니다.

  1. 어떤 여성이 직장에 다니기로 '선택'했을 때, 우리는 그녀의 임금 데이터는 볼 수 있습니다. 하지만 직장에 다니지 않기로 '선택'한 여성의 데이터는 어떨까요? 만약 직장에 다니는 여성들의 데이터만 모아서 '여성의 평균 임금'을 계산한다면, 그것이 과연 진실일까요?
  2. 정부가 새로운 지하철 노선을 개통하려 할 때, 과연 얼마나 많은 사람이 이 지하철을 이용할까요? 사람들은 무엇을 기준으로 버스와 자가용, 그리고 지하철 중에서 하나를 '선택'할까요? 이 선택의 확률을 계산할 방법은 없을까요?

2000년 노벨 경제학상은, 바로 이 '보이지 않는 데이터'와 '개인의 선택 확률'이라는, 경제학의 가장 골치 아픈 두 가지 문제를 해결할 수 있는 강력한 통계적 '도구'를 개발한 두 명의 거장, 제임스 헤크먼 [James Heckman]과 대니얼 맥패든 [Daniel McFadden]에게 돌아갔습니다.

그들은 경제학이 단순한 이론을 넘어, 현실의 복잡한 데이터를 뚫고 '진짜 원인'을 찾아낼 수 있도록 길을 닦은 마이크로계량경제학 [Microeconometrics]의 아버지가 되었습니다.


 

🏆 공식 수상 이유 : 선택의 경제학을 완성하다

 

스웨덴 왕립 과학 아카미데는 두 사람의 공로를 명확하게 나누어 발표했습니다.

제임스 헤크먼 : 개인과 가구의 행동에 대한 미시 데이터를 분석하기 위해, 통계학에서 널리 사용되는 '샘플 선택 편향' 문제를 다루는 이론과 방법을 개발한 공로 [For his development of theory and methods for analyzing selective samples]

대니얼 맥패든 : 개인이 여러 대안 중 하나를 선택하는 상황을 다루는 '불연속 선택'을 분석하기 위한 이론과 방법을 개발한 공로 [For his development of theory and methods for analyzing discrete choice]

두 사람의 공통 키워드는 '이론과 방법[Methods]'입니다. 그들은 새로운 철학을 제시한 것이 아니라, 경제학자들이 실제로 데이터를 분석할 때 사용할 수 있는 정교한 '연장'을 만들어낸 것입니다.

  • 헤크먼 = 샘플 선택 편향 [Sample Selection Bias] 문제 해결
  • 맥패든 = 불연속 선택 [Discrete Choice] 문제 해결

 

✍️ 제임스 헤크먼 : '보이지 않는 데이터'의 편향을 바로잡다

 

제임스 헤크먼이 해결하려 한 문제는 경제학, 사회학, 의학 등 데이터를 다루는 모든 분야의 고질병인 샘플 선택 편향입니다.

 

1970년대의 수수께끼 : 일하는 여성들의 임금

 

1970년대, 경제학자들은 데이터를 분석하다 이상한 점을 발견했습니다. 직장에 다니는 기혼 여성들의 평균 임금이 예상보다 훨씬 높게 나타났기 때문입니다.

  • 잘못된 결론 : "아하! 여성들이 일을 하면 임금을 아주 많이 버는구나!"

헤크먼은 이 결론이 '통계적 착시'일 수 있다고 의심했습니다. 그는 "데이터가 스스로 '선택'되었다"는 점에 주목했습니다.

  1. 세상에는 두 부류의 여성이 있다. (A) 일을 할 경우 높은 임금을 받을 수 있는 여성, (B) 일을 할 경우 낮은 임금을 받을 여성.
  2. 이때, (B) 그룹의 여성들은 굳이 낮은 임금을 받으려고 직장에 나가지 않고, 가사 노동 등 다른 일을 하기로 '선택'할 가능성이 높다.
  3. [결과] 따라서, 우리가 '직장인 여성'이라는 표본 안에서 관찰할 수 있는 데이터는, (A) 그룹의 여성들, 즉 '일을 하기로 선택한, 상대적으로 임금이 높은' 여성들의 데이터가 압도적으로 많다.

즉, 우리가 분석한 데이터는 전체 여성의 임금이 아니라 '일을 하기로 선택한' 여성들의 임금 데이터였던 것입니다. 이처럼 관찰된 표본이 전체 모집단을 대표하지 못하는 문제를 샘플 선택 편향이라고 부릅니다.

 

헤크먼의 마법 : 2단계 추정법

 

이 문제를 해결하기 위해 헤크먼은 천재적인 통계적 해법을 제시합니다. 바로 헤크먼의 2단계 추정법 [Heckman Correction]입니다.

1단계 (선택 방정식) : 먼저 '임금'을 보지 않고, 그 사람이 '일을 하기로 선택'했는지, 안 했는지만을 분석한다. (어떤 요인이 그 선택에 영향을 미쳤는가?)

2단계 (결과 방정식) : 1단계에서 얻어낸 '선택할 확률' 값을 보정 변수로 사용하여, '일을 하기로 선택한' 사람들의 임금 방정식을 다시 추정한다.

이 2단계를 거치면, '일을 하지 않기로 선택한' 사람들의 보이지 않는 데이터가 통계적으로 보정되면서, 편향이 제거된 '진짜' 임금 효과를 추정할 수 있습니다.

이 헤크먼의 방법론은 노동 경제학을 넘어, '특정 프로그램[예: 직업 훈련]에 참여하기로 선택한 사람들의 성과'를 분석하는 등 모든 정책 평가의 표준 도구가 되었습니다. 그는 '데이터는 보이는 대로 믿어서는 안 된다'는 근본적인 경고와 함께 그 해결책까지 제시한 것입니다.


 

📚 대니얼 맥패든 : '지하철 vs 버스'의 선택을 방정식으로 풀다

 

제임스 헤크먼이 '보이지 않는 데이터'를 다루었다면, 대니얼 맥패든은 '사람들의 선택 그 자체'를 방정식으로 만들었습니다.

 

경제학의 오랜 난제 : 불연속 선택

 

전통적인 경제학은 '얼마나 많이' [How much]의 문제에 강했습니다. "가격이 1% 내리면, 사람들은 소고기를 몇 그램 더 살까?"와 같은 '연속적인' 선택은 분석하기 쉬웠습니다.

하지만 '어느 것을' [Which one]의 문제는 난제였습니다.

  • A, B, C 자동차 중 어느 것을 살까?
  • 1, 2, 3번 후보 중 어느 것을 찍을까?
  • 출근할 때 버스, 지하철, 자가용 중 어느 것을 탈까?

이처럼 몇 개의 대안 중 하나만 골라야 하는 문제를 불연속 선택 [Discrete Choice]이라고 합니다. 맥패든 이전에는 이 문제를 수학적으로 다룰 방법이 마땅치 않았습니다.

 

BART 프로젝트와 '조건부 로짓' 모델

 

맥패든의 위대한 돌파구는 1970년대 샌프란시스코의 'BART' [Bay Area Rapid Transit]라는 지하철 시스템 건설 프로젝트에서 나왔습니다. "과연 새 지하철을 만들면, 얼마나 많은 사람들이 이용할까?"를 예측해야 했습니다.

맥패든은 '사람들은 왜 버스가 아닌 지하철을 선택하는가?'라는 질문을 던졌습니다. 그리고 그 선택이 각 대안[버스, 지하철, 자가용]이 가진 속성 [Attributes]에 달려있다고 보았습니다.

  • 버스 : 요금 1달러, 이동 시간 30분, 배차 간격 10분
  • 지하철 : 요금 2달러, 이동 시간 15분, 배차 간격 5분

그는 사람들의 실제 선택 데이터를 수집하여, 각 속성[요금, 시간, 편의성]이 선택에 얼마나 큰 영향을 미치는지를 통계적으로 계산해내는 모델을 만들었습니다. 이것이 바로 조건부 로짓 모델 [Conditional Logit Model]입니다.

이 모델은 "만약 지하철 요금을 0.5달러 올리고 배차 간격을 1분 줄인다면, 버스를 타던 사람 중 몇 %가 지하철로 옮겨올 것인가?"라는 질문에 '확률'로 답을 할 수 있게 해주었습니다.

맥패든의 이 방법론은 이제 모든 산업에서 쓰이고 있습니다. 교통 당국이 새로운 고속도로를 계획할 때, 기업이 신제품의 기능[A기능 vs B기능]을 결정할 때, 마케팅팀이 광고 채널[TV vs 유튜브]을 선택할 때, 그 모든 '선택'의 이면에는 맥패든이 만든 방정식이 숨어 있습니다.


 

⚡️ 세상을 측정하는 도구, 마이크로계량경제학

 

헤크먼과 맥패든은 20세기 후반 경제학의 흐름을 '거대 이론'에서 '실증 데이터 분석'으로 바꾼 주역들입니다. 그들 덕분에 경제학은 '마이크로데이터' 즉, 개개인의 행동 데이터를 정밀하게 분석할 수 있는 마이크로계량경제학이라는 강력한 무기를 갖게 되었습니다.

헤크먼은 우리가 이미 가지고 있는 데이터의 '편향'을 제거하여 과거의 '진짜 원인'을 밝혀낼 수 있게 했습니다.

맥패든은 우리가 가진 선택지의 '속성'을 분석하여 미래의 '선택 확률'을 예측할 수 있게 했습니다.


 

🧐 TMI & 비하인드 스토리

 

  • 맥패든의 농장 : 대니얼 맥패든은 노벨상 수상 소식을 들었을 때 캘리포니아 나파 밸리에 있는 자신의 농장에서 포도를 돌보고 있었습니다. 그는 "상금으로 뭘 할 것이냐"는 질문에 "새 트랙터를 사야겠다"고 대답한 것으로 유명합니다. 그는 실제로 농부이자 와인 메이커로도 활동했습니다.
  • BART 데이터를 직접 모으다 : 맥패든은 BART 프로젝트 당시, 대학원생 제자들과 함께 직접 지하철역과 버스 정류장에서 사람들에게 설문지를 돌리며 데이터를 수집했습니다. 이는 이론과 현실의 완벽한 결합을 보여줍니다.
  • 헤크먼의 사회적 영향력 : 제임스 헤크먼은 자신의 '정책 평가' 방법론을 바탕으로, 현재 영유아기 조기 교육 [Early Childhood Education]의 중요성을 설파하는 가장 영향력 있는 사회 운동가 중 한 명이 되었습니다. 그는 "1달러를 영유아기에 투자하면, 나중에 사회 문제 해결 비용으로 7~10달러를 아낄 수 있다"는 헤크먼 방정식 [Heckman Equation]을 통해 조기 교육의 막대한 사회적 투자 수익률을 증명해냈습니다.
728x90
반응형