완전베이즈균형(PBE), 신호발송게임

게임이론

by 반짝이던별이야기 2025. 2. 23. 12:48

우리는 앞서 NE와 SPNE를 구분할때의 차이가 뭐였을까요?

내 전략을 관찰하고 상대방이 전략수정을 할 수 있다면 동태적인 게임이므로 SPNE라는 개념을 사용할 수 있었습니다.

이렇듯 미비정보하에서도 BNE라는 개념을 넘어 동태적인 게임에서는 PBE라는 개념을 사용해야 합니다.

위와 같은 동태적인 게임을 생각해보죠.

1이 A를 고른다면 게임이 끝나고 L이나 R을 고른다면 2도 선택권이 주어집니다.

전략형으로 살펴본다면 2개의 BNE를 구할 수 있습니다.

하지만 2.2 균형은 바람직하지 않습니다. 2에게 선택권이 주어진다면 무조건 2는 R을 고르는 것이 유리한 전략이죠.

하지만 SPNE의 관점에서는 부분게임을 만족하므로 2.2라는 균형을 제거할 수 없습니다.

이에 PBE라는 개념이 필요하게 됩니다.

PBE는 순차합리성과 베이즈일관성을 만족하는 개념을 말합니다.

순차합리성이랑 기대보수를 극대화하는 선택을 하는 것을 의미하고 베이즈일관성은 각 참가자들의 전략을 예측하여 얻은 확률을 통해 신념을 결정한다는 것입니다.

이를 적용하기 위해 게임을 살짝 숫자를 바꿔보았습니다. 이제 2에게 R이 무조건 유리한 것은 아니죠.

그렇다면 앞서 배운 PBE의 개념을 통해 결정해보겠습니다.

경기자 2는 자신에게 선택권이 주어졌을때 1이 L을 선택했을 확률이 P라는 신념을 가지고 있습니다.

순차합리성을 만족하기 위해 자신의 선택에 따른 기대보수를 구할 수 있죠.

또한 베이즈일관성을 만족하는지도 체크해볼 수 있습니다.

경기자 2의 신념에 따라 만족하는 균형을 2개 구할 수 있었습니다. L을 고를거같으면 L고르고 R 고를거 같으면 R 고르기

그렇다면 이제 경기자 1의 전략과 합쳐보죠

1. 경기자 1은 A를 고른다.

경기자 2는 만약 선택기회가 존재할 경우 경기자 1이 L을 골랐을 것이라는 신념 하에서 L을 선택한다.

2. 경기자 1은 R을 고른다.

경기자 2는 선택기회가 존재할 경우에 경기자 1이 R을 골랐을 것이라고 생각하고 R을 선택한다.

(균형이란 것은 서로의 믿음을 바탕으로 하는 최적화의 상황인 것입니다. 자세하게 말하자면 경기자 1은 경기자 2의 신념이 0.5보다 크다면 L을 선택하고 0.5보다 작다면 R을 선택하는 것을 예측하고 있죠. 경기자 1이 2의 신념이 0.5 이하라고 생각한다면 R을 고를 것을 알기 때문에 A가 아니라 R을 선택하는 것이죠.

즉 서로간의 전략을 알고 있지 않아도 각 경기자는 상대방의 전략을 예측하고 그 믿음하에서 시행하는 전략들이 존재합니다. 두 경기자의 믿음이 맞아떨어졌을 때 균형이 생기는 것입니다. 좀 어렵죠)

앞서 언급한 내용들은 경기자 1이 자신의 유형을 선택하는 경우입니다.

하지만 경기자 1의 유형이 정해진다면?

이렇게 자연이라는 개념을 토앻 게임트리를 구할 수 있죠.

기업 2의 유형을 자연이 결정해 줍니다.

기업 1은 기업 2의 유형을 알지 못하는 상태로 확률만을 통해 진입할지 포기할지를 결정하게 되는 것입니다.

그렇다면 순차합리성과 베이즈일관성을 만족하는 균형을 찾아보죠

기업 2의 전략을 한가지입니다. 자신이 타입 1이면 수용하는 것이고 타입 2라면 경쟁하는 것이죠.

기업 1의 전략은 신념에 따라 달라집니다. 즉 균형이 위와 같이 나오겠네요.

신호발송게임이란 걸 살펴보죠

먼저 게임의 구조는 위와 같습니다.

자연이 1의 유형을 결정해준 후 1이 자신의 전략을 선택합니다. 그 뒤에 1의 선택을 보고 2가 선택하는 것이죠.

즉 여기서 1은 자신의 유형을 드러내고 싶어할 수 도 있는데요. 자신의 전략을 통해 자신의 유형을 드러내는 신호를 발송해야 하므로 신호게임이라고 합니다.

1과 2의 전략은 위와 같이 각각 4개씩 존재합니다. 그렇다면 16개의 경우의 수가 나오겠네요.

또한 1의 전략에서 L.L은 정보를 전달할 수 없습니다. L,R은 정보를 전달할 수 있는 신호이죠.

이제 수치를 대입해서 신호게임의 PBE를 찾아보겠습니다.

먼저 1이 L,R 전략을 사용한다고 생각해보죠.

2는 경기자 1이 L 선택시 A유형일 것이라고 생각하고 U를 고르고 R 선택시에는 D를 고르게 됩니다.

하지만 이는 PBE가 아니죠.

1은 2의 이러한 전략을 예측하여 A유형의 상황일 경우 R을 고르게 된다면 더 많은 보수를 얻을 수 있죠.

결국 L,R은 순차합리성을 만족하는 균형이 아닌 것이죠.

R,L 또한 마찬가지입니다.

이제 공용전략 R,R을 살펴보겠습니다.

1이 R,R 전략을 사용한다면 2에게 정보는 그냥 A일 확률 0.5 B일 확률 0.5 일 뿐입니다. 순차합리성을 만족하기 위해 B는 D 전략을 선택하게 되죠.

그렇다면 이것은 PBE일까요?

만약 1이 R을 고를 시 2가 D를 고른다면 전략하에서 1이 L을 골라버린다면? 2의 반응은 2의 신념에 따라 달라지게 됩니다.

그렇다면 2의 전략을 더 자세하게 구해볼 수 있죠.

이러한 2의 전략 하에서 1의 이탈유인을 찾아본다면 P가 0.4 이하여야 이탈유인이 존재하지 않는다는 것을 알 수 있습니다. 즉 이러한 경우에만 PBE라 성립하는 것이죠

(참고로 2 입장에서 1이 R,R 전략을 쓰는걸 알고 있는 상황은 아닙니다. 균형이란 것은 서로의 믿음을 바탕으로 하는 최적화의 상황인 것입니다. 자세하게 말하자면 경기자 2가 1은 공용전략 R,R을 쓴다고 믿는다고 가정해봅시다. 그럼 나도 R 나오면 D 고르고 만약 l이 나온다면 ~~하겠어. 라고 생각하죠. 경기자 1 또한 경기자 2의 전략을 예측합니다. 내가 R,R을 쓴다고 믿으면 이렇게 하겠구나~~

두 경기자의 믿음이 맞아떨어졌을 때 균형이 생기는 것입니다. 좀 어렵죠)

마지막으로 L,L 전략 시 균형입니다.

어떠한 경우에는 PBE는 나타나지 않죠.

'게임이론' 카테고리의 다른 글

도덕적 해이와 유인임금 (0)	2025.02.26
역선택과 신호, 선별 (게임이론) (0)	2025.02.24
메커니즘 디자인(게임이론) (0)	2025.02.20
경매이론과 수익동등정리 (0)	2025.02.19
베이즈내쉬균형 (1)	2025.02.18