내생성에 대해 알아보겠습니다. 우리는 앞서 설명변수와 오차항이 상관관계가 없다는 가정 하에 논리를 전개했습니다. 하지만 이 가정이 깨진다면 어떻게 될까요?
사실 앞에서 한번 깨뜨린 적이 있습니다. OVB 문제 즉 누락편의로 인해서 오차항과 설명변수에 상관관계가 존재하고 편의가 생기는 것을 본 적 있죠.
이제 측정오차때문에 내생성이 생기는 경우를 살펴보겠습니다.
우리는 데이터를 모집할때 측정오차를 경험하게 됩니다. 예를 들어 월급 조사를 할때 320만원 받는 사람이 자기 300받는다고 대답할수도 있고 399만원 받는사람이 400받아요~라고 답할 수 있죠. 즉 정보를 정확하게 얻을수가 없는데요.
이러한 측정 오차 존재시 어떻게 되는지 살펴보죠
우리는 진짜 X*대신 X를 알게 되므로 회귀식에 X*대신 X를 대입하게 됩니다. 위 그림처럼 오차항이 살짝 바뀌게 되는데 오차항과 설명변수인 X가 서로 상관관계를 가지는 것을 알 수 있죠. 즉 측정오차로 인해 내생성이 존재 시 불편성과 일치성을 모두 잃게 됩니다. (얼마만큼의 일치성을 잃는지도 보일 수 있어서 보여봤습니다.)
대표적인 측정오차로는 항상소득가설이 있씁니다. 우리는 실제소득을 관찰하지 항상소득을 관찰하기 힘들기 때문에 일시소득이라는 항이 추가적으로 더해지게 되는것이고 이 일시소득이 앞에서 언급했던 측정오차에 해당하는 것이죠
또한 종속변수에 오차가 있는 경우에 대해서도 알아봤는데 불편성에는 문제는 없고 다만 오차항의 분산이 커진다는 단점이 있네요
내생성 원인은 여러가지가 더 있지만 다른 포스팅에서 다루겟습니다.
이 내생성 문제를 해결하는 방법에는 여러가지가 있습니다. ILS, 도구변수,2SLS,IV-GMM 등등 여기서는 도구변수에 대해 자세히 알아보고 나머지는 다음에 다루겠습니다.
도구변수는 조건이 2가지가 필요한데요. 1. 우선 설명변수와 도구변수와 관계가 있어야 할 것 2. 도구변수와 오차항은 관계가 없어야 할 것
이 두 가지 조건을 만족시키는 변수를 통해서 b의 일치추정량을 구하고자 하는 것입니다.
기존의 OLS에서는 b를 추정 할 때 미분을 통해 2가지 조건을 도출해 냈었죠. 하지만 내생성 존재시 2번째 조건이 성립할 수 없습니다. 즉 도구변수를 통해서 E(ex)=0대신 E(ez)=0을 이용하는 적률추정을 하는 것입니다.
OLS처럼 둘을 잘 연립하시면 도구변수의 추정량이 나오게 됩니다. 또한 이는 일치추정량임을 보일 수 있죠
근데 사실 적률추정을 저도 깊게 알고 있지 않고 계량공부하시는 분들이 통계학과만큼 알고 있을거 같지도 않아서 그런가 김창진 교수님 책에서는 다른 방식으로 설명해두셨더라고요
대충 이렇게 해서 도구변수 추정량이 저런식으로 생긴거다라는 내용입니다.
도구변수가 일치추정량은 만족하지만 기댓값을 씌울 시 분모 분자에 오차항이 모두 포함되어 있기 때문에 (분모는 X가 오차항에 연관되어있어서) closed form인 해를 구할 수 없습니다. 즉 불편추정량이라고 할 수 없죠
그러므로 대표본에서 분포수렴한다는 점을 이용해서 식을 저렇게 변환한 후 분산을 구해야 하는 것입니다.
위 분산을 구해본 결과 도구변수와 설명변수의 상관관계가 높을수록 분산이 낮아지고 효율적인 결과를 얻을 수 있겠네요.
ARCH-GARCH 모형 (0) | 2025.02.01 |
---|---|
연립방정식 모형과 식별 (2SLS, 내생성 검정) (1) | 2025.02.01 |
고전적 가정의 붕괴- 자기상관 (0) | 2025.01.29 |
고전적 가정의 붕괴-이분산 (0) | 2025.01.28 |
다중공선성, OVB(누락편의) (0) | 2025.01.28 |