자료를 구하기 힘들어 박승록 교수님의 자료를 사용하였다.
임금수준을 종속변수로 두고 임금이 교육수준, 경험, 성별, 결혼여부, 근무지역, 노조가입여부에 따라 겨정된다고 보았다.
우선 이 변수들의 다중공선성 정도를 체크해보자
크게 다중공선성에 문제는 없어보인다.
그렇다면 이제 이분만 문제를 체크해봐야 한다.
임금의 분포가 다음과 같으므로 정규분포와는 거리가 있어보인다. 편의를 위해 gladder를 통해 어떻게 하면 정규분포를 만들 수 있는지 확인해보자
보아하니 로그변환을 한 그래프가 가장 정규분포에 가까워 보인다.
따라서 generage lwage=ln(wage) 설정 후 이분산을 진행하자
regress lwage educ exper sex marstat region union
predict fitlwage, xb
predict error, r
회귀분석을 돌린 후 추세선을 구하고 거기서 오차항을 추출해내었다.
이분산 검정을 하기 위해 오차항의 제곱을 구한 후 line을 통해 나타내보면
이분산이 존재하는 것 같다.
각각 bp 테스트와 white 테스트를 통해 검정해보자
로그변수를 통해 돌렸을 시 bp 테스트에서는 이분산이라고 5퍼센트 하에서 이분산이라고 말하고 있다.
그렇다면 로그변수가 아니라 wage를 그냥 회귀분석 돌렸을때를 확인해보자
더 작은 퍼센트 하에서도 이분산이라고 말해주고 있다.
나중에 계량이론시간에서 말하겠지만 로그변환이 이분산을 줄여주는데 큰 도움을 준다. 이를 증명해주는 하나의 사례이다.
실제로 로그 안씌운 오차항 제곱을 보면 이렇다.
슬슬 멋있는걸 하는 느낌이 들어서 재밌다 ㅋㅋㅋㅋ
구조변화 추정 (0) | 2024.11.30 |
---|---|
소비함수 자기상관 확인 (1) | 2024.11.29 |
다중공선성 체크 (0) | 2024.11.29 |
한국 소비함수 추정 (0) | 2024.11.28 |
수요함수 추정해보기 (2) | 2024.11.28 |