상세 컨텐츠

본문 제목

다중 회귀분석, 더미변수

계량경제학

by 반짝이던별이야기 2025. 1. 28. 17:24

본문

 

다중회귀분석에 대해 알아보겠습니다. 크게 다른건 없고 단순회귀분석은 변수가 1개였지만 여기서는 변수가 여러개라는 거죠. 그래서 OLS 추정량또한 달라지게 되는데요. 행렬을 이용해서 간단하게 보일 수는 있지만 제가 행렬대수에 익숙하지 않아서.. 어차피 실제로 분석할때는 컴퓨터가 해준답니다.

회귀계수 의미또한 간단하게 이해할 수 있습니다.

 

보조회귀식이라는 것을 이용해서 더 심화적으로 회귀계수를 분석해 볼 수 있는데요. 어렵긴하지만 후에 논리전개 시 꼭 필요한 내용들이라 이해하셨으면 합니다.

우선 y라는 종속변수에 영향을 미치는 독립변수 x1,x2는 서로 연관이 있는것이 일반적이죠. 예를 들어 임금에 영향을 미치는 교육정도와 직업 이런 두 변수가 연관되어있겠죠?

즉 x1을 x2에 대해서 회귀해 볼 수 있습니다. 

회귀식을 추정한다면 잔차를 구할 수가 있는데요. 이를 해석해보자면 x2에 의해서 설명되는 것을 제거한 x1이 되는 것이죠

 

즉 순수한 x1의 변동은 잔차에 의해 설명되므로 위와 같은 결과를 얻을 수 있죠.

또한 r1^은 b1^의 성질을 그대로 가지고 있으므로 분산도 동일할 것입니다.

 

분산을 다음과 같이 구할 수 있네요.

하지만 일반적으로 위와 같이 쓰지 않고 조금 변형해서 사용하는데요

분산이 결정계수에 의해 영향을 받네요. 즉 x2가 x1을 잘 설명할수록 둘이 연관이 클수록 분산이 커진다는 것이죠

 

 

더미변수에 대해 간단히 알아보겠습니다.

더미변수란 0과 1만을 가지는 변수입니다. 특정한 조건을 만족하면 1이고 만족하지 못하는 경우에는 0이 되는 것이죠.

이를 이용해 절편 기울기의 차이들을 설명할 수 있다는 장점이 있죠. 예를 들어 남자 여자, 흑인 백인, 고졸 이상 그 이외, 이런 것을 분류할때 사용합니다.

위 식에서 D1,D2, D1D2라는 항을 추가했는데 D1D2항이 항상 있어야 하는것은 아닙니다. 회귀분석 후 b3이 유의하지 않다면 그냥 빼버리는게 낫다는 것이죠. 굳이 유의하지 않은 변수를 추가해서 효율성을 떨어뜨릴 필요가 없기 때문이죠.

 

어 유의하지 않은 변수를 추가하면 효율성이 떨어지나요? 다음 장에서 살펴보겠습니다.

'계량경제학' 카테고리의 다른 글

고전적 가정의 붕괴- 자기상관  (0) 2025.01.29
고전적 가정의 붕괴-이분산  (0) 2025.01.28
다중공선성, OVB(누락편의)  (0) 2025.01.28
단순회귀분석  (0) 2025.01.28
회귀분석 노테이션 이해  (0) 2025.01.28

관련글 더보기