상세 컨텐츠

본문 제목

고전적 가정의 붕괴- 자기상관

계량경제학

by 반짝이던별이야기 2025. 1. 29. 23:48

본문

자기상관이란 무엇일까요? 우리가 앞서 오차항끼리는 서로 상관이 없다고 했지만 상관이 있는것을 의미합니다.

자기상관 존재시 불편성과 일치성에는 문제가 없지만 분산에는 문제가 생기는데요. 기존의 OLS에서는 자기상관이 없다는 가정하에서 뒤에 붙어있는 항들을 다 날려버렸기 때문이죠. 즉 OLS에서 추정한 분산은 잘못된 분산이므로 t검정과 F 검정을 사용할 수 없답니다.

또한 자기상관 문제는 시계열에서 많은 논의를 만드는데요. 향후 시계열에서 자세하게 써보기로 하겠지만 내생성 문제를 만든답니다.

 

 

자기상관의 문제들에 대해 알아봤는데 자기상관이 있는지 확인하는 방법들에는 어떤 것들이 있을까요?

우선 더빈 왓슨 검정이라고 부르는 DW 검정이 있습니다.

더빈왓슨 검정은 잔차를 이용하여 자기상관의 계수를 추정하는 것입니다. dw 통계량이 0에 가깝다면 양의 자기상관 4에 가깝다면 음의 자기상관을 가진다는 것이죠

 

하지만 이 검정에는 문제점이 있는데요

앞서 우리는 오차항이 AR(1) 과정을 가진다고 가정하고 p를 추정했습니다. 즉 AR(1)이라는 가정이 필요하다는 것이죠

또한 추가적으로 시차변수가 존재할 시 추정이 불가능하다는 단점이 있고 위 그림처럼 판정이 불가능한 영역이 존재할수도 있다는 것입니다.

 

2번의 시차변수 문제 해결하기 위해서는 더빈의 H 검정이라는 것이 나오는데요

 

더빈의 h 검정은 위와 같은 통계량을 이용합니다. p를 추정하고 저 통계량이 정규분포로 분포수렴한다는 것을 이용하여 검정하는 것입니다. 하지만 이것또한 시차분포가 1개일때만 가능하고 대표본일때만 가능하다는 문제점이 있죠.

 

BG 검정이라고 부르는 자기상관 검정이 등장하게 되죠

위와 같이 자기상관계수들이 모두 0이다라는 검정을 할 수 있습니다.

하지만 이러한 검정은 강한 외생성을 가정하는데요. 강한 외생성이란 잔차가 모든 기의 설명변수와 연관이 없다는 가정입니다.

이처럼 t기끼리는 상관이 없지만 서로 다른 기에는 연관관계가 있다는 것을 contemporary 외생적 동시대적 외생성이라고 하는데요. 이러한 경우에는 잔차식을 조금 변형해주어야 합니다.

 

p1이라는 것은 다른 변수들이 일정할 때 e(t-1)이 e(t)에 미치는 영향입니다. 하지만 xt가 e(t-1)과 연관이 있다면 p1이 잘못 추정될 가능성이 높습니다. xt가 e(t-1)에 주는 영향을 p1이 먹어버리기 때문에 순수한 e(t-1)의 영향을 파악할 수 없다는 거죠.

 

즉 설명변수들을 추가해주고 (n-p)R^2 통계량을 사용해서 검정하게 됩니다.

 

보통 책들에서는 아래 경우만 다루더라고요. 사실 강한 외생성이라는 가정자체가 비현실적이기도 해서 그런가봐요.

사실 저는 처음 이 내용을 봤을때 왜 설명변수들을 추가하는지 이해가 안가서 혹시 그런 분들이 있을까봐 써봤습니다.

 

 

그렇다면 자기상관 문제를 해결하는 방법이 뭐가 있을까요?

이분산이랑 비슷한데요. 이분산에서도 GLS 방식과 화이트 표준오차를 사용했습니다.

자기상관도 동일합니다.

 

 

GLS 방식입니다.

우리가 p를 아는 경우에는 자기상관이 없게 식을 변형하여 회귀계수들을 추정할 수 있습니다.

 

하지만 일반적으로 p를 아는 것을 불가능하죠

즉 p를 추정한 후 p를 결정하고 p를 아는 경우의 과정을 거치면 되겠죠

p를 추정하는 방법이 대표적으로 3가지 정도 있습니다.

1. 우선 가장 당연하게도 잔차를 이용해서 p를 추정하는 경우가 있죠.

2. dw 통계량을 통해서 p를 추정할 수 있고

3. Cochrane-Orcutt 이라는 방식으로 p를 추정할 수 있습니다.

c-o 방식이란 잔차를 추정 후 잔차를 통해 p를 추정합니다.

하지만 이에 그치지 않고 추정한 p를 통해 자기상관이 없게끔 식을 변형한 후 여기서 다시 회귀계수들을 추정합니다.

다시 원식으로 돌아가서 이 회귀계수들을 이용해서 잔차를 다시 추정하고 잔차를 이용해서 p를 추정합니다.

이 과정을 계속 반복하다보면 p가 특정 값으로 수렴하게 되는데 그것이 p의 추정량이라는 내용입니다.

 

어쨋든 이렇게 GLS를 이용해서 회귀계수를 추정 후 식을 변형하여 자기상관을 제거하는 방법이 있죠

 

 

두번째는 HAC표준오차라고 불리는 자기상관이 존재할 시의 표준오차를 이용하는 것입니다. 하지만 실제로 저러한 표준오차를 이용할 순 없고 우리가 추정해야하는 공분산의 개수가 너무 많아지기에 특정 거리 이상은 다 0으로 잘라버리고 추정하는 것입니다. 

 

이 표준오차는 화이트 표준오차를 이용하면 이분산과 자기상관이 동시에 존재하는 경우에도 사용할 수 있다는 장점이 있죠

 

관련글 더보기