2 stage least squares.
1 개요
가우스-마르코브 가정 중 '잔차가 독립변수/설명변수와 상관관계가 없을 것'이라는 가정이 무너질 때 사용할 수 있는 추정방법.
말 그대로 두 단계에 걸쳐 추정하는데, 첫번째 단계에서는 도구변수를 사용하여 문제가 되는 변수를 추정하고, 두번째 단계에서는 그 문제되는 변수를 첫번째 단계에서 추정한 값으로 대체해버린 다음 원래 식을 추정하는 것이다.
2 가정
가우스-마르코브 가정의 대다수가 그대로 적용된다. 즉:
모형이 정확하게 제시되어 있다(correctly specified.)모든 변수의 오차 분산이 동일하다.[1]
오차항은 정규분포를 가진다.
이상치(outlier)는 제거되어 있다.
각 관측이 서로 독립적이다(independent of each other).
3 사용예
예를 들어, 돈을 벌기 위해 노동과 인적자본을 투입해야 한다고 하자.
그러면 [math]money = a_0 + a_1(labor) + a_2(human capital) + e[/math]의 식을 세워볼 수 있다.
그런데 노동력을 유지하기 위해서는 돈을 들여서 밥을 먹이고 잠잘 곳을 제공해야 한다.
즉 [math]labor = b_0 + b_1(money) + e[/math]의 식이 성립한다는 것이다.
이럴 경우 원래 식을 이용해 money를 추정하면, 실질적으로 아래의 식을 추정하는게 되어 버린다.
[math]money = a_0 + a_1(labor) + a_2(human capital) + e [/math]
[math] \quad \quad \quad= a_0 + a_1(b_0 + b_1(money) + e) + a_2(human capital) + e[/math]
[math] \quad \quad \quad= a_0 + a_1(b_0 + b_1(a_0 + a_1(labor) + a_2(human capital) + e) + e) + a_2(human capital) + e[/math]
무한반복
이럴 경우, 2SLS를 이용하여 문제점을 해결할 수 있다.
물론 2SLS가 요구하는 다른 가정들이 충족되어 있을 때의 이야기다
4 설명
예를 들어 원래 식이 다음과 같다 하자.
[math]y = a_1 + a_2x_1 + a_3x_2 + e[/math]
그리고 [math]e[/math]와 [math]x_1[/math]사이에 상관관계가 존재한다.
그러면 가우스-마르코브 가정이 만족되지 않아, OLS는 더 이상 BLUE[2]가 아니다.
이를 이제 2SLS로 추정하면 다음과 같다.
1. [math]\hat{x_1} = b_1 + b_2z_1 + b_3x_2 + e[/math]를 먼저 추정한다.
(여기서 [math]z_1[/math]은 도구변수를 의미한다.)
2. 위에서 추정한 값을, 원래 식에 집어넣어 추정한다. 즉 다음 식을 추정한다.