다중공선성을 체크해보기 위해서
종속변수로 고용률 독립변수로 gdp 디플레이터 gdp 실업자수 생산가능인구 추세를 이용하였다.
2000년부터 2023년까지의 자료를 이용해 상관관계를 체크해본 결과 당연하게도 gdp 디플레이터와 gdp가 높은상관관계 생산가능인구와도 높은 관계를 보이고 있다. 다른 결과들도 직관적이다.
다중공선성이 존재하므로 표준오차가 커지고 t값이 작아질 확률이 생긴다. 즉 모형의 설명력이 약해질 수 있다는 것이다.
이에 vif를 체크해보자
vif가 10만 넘어도 힘든데 너무 높다... 다중공선성이 있다고 생각해도 될 듯 하다.
사실 다중공선성을 해결하는 가장 좋은 방법은 표본수를 늘리는 것이다. 이는 n을 늘림으로써 앞서 언급한 문제들을 완화할 수 있기 때문이다. 그렇다고 공선성이 높은 변수를 하나 제거한다면 누락변수의 문제가 생길 수도 있다. 연구라는것이 이래서 어려운거같다.
소비함수 자기상관 확인 (1) | 2024.11.29 |
---|---|
이분산 확인 (1) | 2024.11.29 |
한국 소비함수 추정 (0) | 2024.11.28 |
수요함수 추정해보기 (2) | 2024.11.28 |
데이터 시각화해보기 (0) | 2024.11.27 |