상세 컨텐츠

본문 제목

단위근과 DF분포 (Dickey-Fuller)

계량경제학

by 반짝이던별이야기 2025. 2. 4. 20:55

본문

비정상 시계열은 회귀계수가 1인 시계열을 말합니다. 사실 1보다 클수도 있는데 아무 의미없는 분석입니다. 과거의 충격이 시간이 지날수록 커지고 시간이 지나면 충격이 무한대가 된다는 건 말이 안되는거니까요

 

어쨋든 회귀계수가 1이냐?라고 검정하기 위해서는 회귀계수의 분포를 알아야겠죠.

회귀계수의 분포를 위와 같이 구할 수 있는데요. 중심극한정리를 이용해 증명한거죠

저번 포스팅에서 PACF에서 회귀계수가 0인걸 검정할때 저런 분포를 쓰는 이유가 이유가 있는거죠

향후 분포를 구하기 위해서 어떤 방식을 쓰는지 몬테카를로 실험을 간단히 알아보겠습니다.

오차항의 성질을 만족하는 데이터들을 뽑고 그 데이터셋을 엄청 많이 뽑아서 회귀를 돌리면 회귀계수또한 엄청많이 뽑아낼 수 있습니다. 여기에 루트 n을 곱하여 히스토그램으로 정리하면 분포를 볼 수 있죠. 실제로 정규분포로 수렴하는 형태를 보일겁니다.

 

왜 몬테카를로 실험에 대한 개요를 설명했냐면 df분포라는것을 구하기 위함이죠

비정상 시계열에서는 우리가 구한 분포를 사용할 수 없습니다.

 

분포의 분산이 0이다? 이거는 어딘가 문제가 있어보이죠.

그렇기에 우리는 몬테카를로 실험을 통해 df분포를 뽑아내야 합니다.

 

하지만 정상시계열과 다르게 주의해야 할 점이 있는데요.

절편이 있냐 절편이 없냐 또 트렌드가 있냐 없냐에 따라서 분포가 달라질 수 있다는 겁니다. 

비정상시계열이기에 나타나는 특성이죠

정상시계열 시 절편이 있든 없든 n이 어차피 무한대로 가면 효율성에 문제가 없어지므로 분포가 동일했습니다. 비정상시계열에서는 절편의 유무가 향후 영향력을 계속 행사하므로 그렇지 않죠

 

즉 이렇게 케이스 3개로 구분이 가능한데요 (case 3은 일부러 안쓴겁니다. 1,2,4만 알아두시면 됩니다)

 

case 2에서 절편을 drift라고 부르는데요. case 4에서의 t는 trend라고 부릅니다. 시간에 따라 영향을 받는다는 것이죠

 

여기서 저는 궁금증이 하나 있었는데요

드리프트와 트렌드는 어떤 차이가 있을까?

case 2의 경우에는 비정상 시계열이어야만 트렌드가 만들어집니다.

하지만 case 4의 경우에는 비정상 시계열이 아니더라도 트렌드의 존재로 인해 그래프를 관찰했을때 비정상시계열처럼 보일 수 있는 것이죠. 

관련글 더보기