게임이론

반복게임

반짝이던별이야기 2025. 2. 16. 14:59

반복게임은 앞서 한 일회게임들과는 다르게 자신의 행동이 미래에 영향을 끼칠 수 있습니다.

즉 전략이 단순하게 1기에 뭐 하고 2기에 뭐 하고 이런게 아니라 1기에 뭐 한다. 2기에 1기 결과가 ~~이면 2기엔 어떻게 한다. 이런식으로 세워지게 됩니다. 일회게임보다 어렵죠

 

반복게임에서는 즉 미래의 보수까지 생각하는 전략을 세워야하는데요. 미래를 다 더하면 복잡하니까 보통 평균할인보수를 사용합니다. 평균적으로 내가 얼마를 받을지를 계산하나 총 얼마를 받을지를 계산하나 어차피 똑같기 때문이죠.

 

평균할인보수를 위와 같이 유도할 수 있습니다.

 

그렇다면 반복게임에서의 내쉬균형과 SPNE를 이해해보죠

위와 같은 일회게임이 반복되는 반복게임이 있습니다. 일회게임에서의 유일한 내쉬균형은 B,Y 뿐이죠.

 

B,Y가 아닌 다른 균형에서는 모두 이탈할 유인이 있기 때문에 NE와 SPNE가 B,Y로만 이루어지게 되죠.

즉, 내쉬균형이 하나인 유한반복게임에서 NE와 SPNE는 내쉬균형의 반복입니다.

 

내쉬균형이 2개라면?

여전히 내쉬균형의 반복이 NE가 될 수 있을겁니다.

하지만 추가적인 NE가 존재하는데요

1기에 U.U를 선택하기로 합의하고 

2기에 U.U 선택 시 M.M

                  선택이 안된다면 D.D라는 전략 또한 NE이자 SPNE입니다.

부분게임인 2기에 M.M이 선택된다는 것도 내쉬균형일뿐더러 1기의 게임에서도 이탈유인이 없기 때문이죠.

 

 

무한반복게임을 이제 알아보죠

내쉬균형이 1개일 경우 여전히 NE를 반복하는 것은 NE이나 SPNE입니다. 

하지만 추가적인 NE가 있는데요

유한반복게임에서는 이 전략이 사용되지 않습니다. 마지막기에 이탈할 유인이 있기 때문이죠.

하지만 무한반복게임에서는 마지막이라는 개념이 없기 때문에 협조가 가능한데요. 할인인자의 범위에 따라서 협조가 가능해지게 되는 것이죠.

 

그러나 위 전략이 NE이지만 SPNE는 아닙니다. 부분게임에서는 이탈할 유인이 있거든요.

만약 2가 협조를 이탈하여 1이 여전히 보복전략을 이행한다면 V는 4/(1+r)이 될 것입니다.

그러나 1이 보복전략을 이행하지 않고 그대로 c를 고집한다면 V는 3이 되는 것이죠. 할인인자가 1/3보다 크면 NE이지만 배반을 당했을 시에 부분게임에서는 경기자 1이 이탈할 유인이 있으므로 NE가 아니게 됩니다. 즉 NE이지만 SPNE는 아니란 것이죠.

 

반복게임에서는 전래정리라는 개념이 등장합니다. 사회적으로 실현가능한 보수와 각 개인의 최악보수 사이에서는 균형이 가능하다는 정리입니다. (물론 할인인자에 따라 달라지겠지만요) 예시만 하나 써봤으니 읽어보시면 됩니다.