ICM 기본 원리: Malmuth-Harville이 Chip을 달러로 바꾸는 방법

파이널 테이블에서의 Chip은 돈이 아닙니다. 수익 체감의 복권 티켓이죠. 여기 스택을 달러 가치로 변환하는 정확한 알고리즘이 있습니다. 처음부터 유도하고 실제 숫자로 풀어냈습니다.

모든 토너먼트 플레이어는 "Chip은 액면가만큼의 가치가 없다"는 슬로건을 들어봤을 것입니다. 파이널 테이블에서 성경 구절처럼 반복되곤 하죠. 보통 누군가 나쁜 Call을 하고 Variance 탓을 하기 직전에요. 하지만 이 슬로건은 민간 전설이 아니라 정리입니다. Stack 벡터와 Payout 구조를 입력받아 각 자리에 대한 달러 가치를 반환하는 정확하고 계산 가능한 알고리즘이 있습니다. 그 알고리즘이 바로 Independent Chip Model이며, 가장 널리 사용되는 버전은 Malmuth-Harville입니다.

ICM을 블랙박스, 즉 "계산기가 Fold하라고 했어"라고만 이해한다면 쉬운 상황에서는 맞고 어려운 상황에서는 틀릴 것입니다. 이를 알고리즘으로 이해한다면 테이블에서 재구성하고, 언제 오작동하는지 예상하며, 파이널 테이블의 Chip leader가 왜 자신의 Stack이 시사하는 것보다 가난하고 Short stack이 더 부유한지 정확히 알 수 있습니다. 이 글에서는 모델을 깔끔하게 유도하고, 구체적인 숫자로 4인 상황 예시를 보여주며, Malmuth-Harville과 덜 알려진 사촌 Malmuth-Weitzman을 비교하고, Static ICM이 끝나고 Future Game Simulation이 시작되는 지점을 보여줍니다.

핵심 문제: Chip은 돈에 비례하지 않는다

Cash game에서는 Chip이 달러입니다. Stack EV와 Money EV는 동일한 개념이며, 그래서 Cash game 전략은 핸드당 획득한 Chip을 최대화하는 것으로 귀결됩니다. 토너먼트는 그 연결고리를 끊습니다. Chip을 현금화할 수 없고, 오직 최종 순위를 Payout으로 전환할 수 있을 뿐입니다. 그리고 Payout 구조는 오목합니다. 즉, 1등은 전체 Chip의 비례적인 가치보다 훨씬 적게 받습니다.

구체적으로, 일반적인 구조에서 1등은 최종적으로 전체 Chip의 100%를 가지고도 Prize Pool의 50%만 받을 수 있습니다. 이 50%의 "사라진" equity는 증발한 것이 아니라, 다른 플레이어들을 상대로 그들의 생존 가능성에 비례하여 모든 사람에게 배분되었습니다. ICM의 전체 역할은 오직 현재 Chip count만을 기반으로 남은 플레이어들 사이에서 고정된 Prize Pool을 어떻게 분배할지 알아내는 것입니다.

이름에 있는 "Independent"라는 단어는 핵심적인 단순화 가정을 나타냅니다. ICM은 최종 순위 확률이 오직 Chip count에만 의존한다고 가정하며, Position, Skill, Blind level, 그리고 향후 플레이를 무시합니다. 이 가정은 세부적으로는 틀렸지만 전체적으로는 유용합니다. 이에 대해서는 FGS에 도달했을 때 더 자세히 설명하겠습니다.

Malmuth-Harville 모델

Malmuth-Harville은 하나의 깔끔한 공리에 기반합니다:

특정 플레이어가 1등으로 마칠 확률은 전체 플레이 중인 Chip에 대한 그들의 점유율과 같습니다.

플레이어 i가 Stack $s_i$를 가지고 있고 전체 플레이 중인 Chip이 $T$라면:

\[P(i \text{ finishes 1st}) = \dfrac{s_i}{T}\]

이것이 전체 엔진입니다. 나머지는 모두 장부 정리입니다.

우아한 부분은 낮은 순위를 처리하는 방식입니다. 누가 1등하는지 정해지면 해당 플레이어와 그들의 Chip은 고려 대상에서 제외되고, 남은 Chip으로 남은 필드에 대해 동일한 질문을 합니다. 플레이어 j가 2등으로 마칠 확률은 다른 누군가가 1등으로 마칠 확률에, 생존자들 중에서 j가 서브 토너먼트에서 "승리"할 확률을 곱한 것입니다.

공식적으로, j가 2등으로 마칠 확률은 가능한 모든 1등 피니셔 k (여기서 k ≠ j)에 대한 합입니다:

\[P(j \text{ is 2nd}) = \sum_{k \neq j} P(k \text{ is 1st}) \cdot \dfrac{s_j}{T - s_k}\]

이를 주의 깊게 읽어보십시오. k가 1등으로 마쳤다는 조건하에, k의 Chip은 Pool을 떠나고, 새로운 총량은 $T - s_k$가 됩니다. 그리고 이 감소된 필드 내에서 플레이어 j는 $s_j / (T - s_k)$ 확률로 "1등" (즉, 전체 2등)으로 마칩니다. 1등 자리가 채워질 수 있는 모든 방식에 대해 합하면 j의 정확한 2등 확률을 얻게 됩니다.

3등은 한 단계 더 깊이 재귀합니다. 모든 (1등, 2등) 피니셔의 순서쌍에 대해 합하고, 두 Stack을 제거한 다음, 남은 Chip 중 j의 점유율을 계산합니다. 일반적으로, 최종 순서를 열거하고, 각 순서에 Malmuth-Harville 확률을 가중치로 부여하여 누적합니다. n명의 플레이어가 남았을 때 n!개의 순서가 존재합니다. 9인 파이널 테이블에서는 이는 사소한 일입니다 (362,880개의 순서, 수 밀리초의 계산). 이것이 실제 파이널 테이블에서 ICM이 근사치가 아니라 정확한 이유입니다.

당신의 달러 Equity

일단 전체 최종 순위 분포 — 각 플레이어에 대해 1등, 2등, 3등 등으로 마칠 확률 — 를 얻으면, 이를 돈으로 전환하는 것은 내적(dot product)입니다. $\text{pay}[r]$을 순위 r로 마쳤을 때의 Payout이라고 합시다. 그러면:

\[\text{EV}(i) = \sum_r P(i \text{ finishes in position } r) \cdot \text{pay}[r]\]

이 한 줄이 모델의 주요 결과입니다: 당신의 토너먼트 달러 equity는 모든 최종 순위에 대해, 그 순위에 도달할 확률과 해당 순위가 지급하는 금액을 곱한 값의 합입니다. ICM은 이러한 확률을 계산하는 원칙적인 방법일 뿐입니다.

구체적인 4인 상황 예시

이론은 숫자를 통해 더 잘 이해됩니다. 4명의 플레이어가 남았습니다. Stack 및 Prize Pool $10,000는 50 / 30 / 15 / 5로 지급됩니다:

| 플레이어 | Stack | Chip 점유율 | 해당 순위 Payout | |---|---|---|---| | A | 5,000 | 50% | 1등 = $5,000 | | B | 3,000 | 30% | 2등 = $3,000 | | C | 1,500 | 15% | 3등 = $1,500 | | D | 500 | 5% | 4등 = $500 | | 총계 | 10,000 | 100% | Pool = $10,000 |

이 설정에 의도적인 함정이 있음을 주목하십시오. Payout (50/30/15/5)은 Chip 점유율 (50/30/15/5)을 정확히 반영합니다. Chip이 돈에 선형적이라면, 모든 플레이어의 $EV는 그들의 Chip 점유율 달러와 같을 것입니다: A = $5,000, B = $3,000, C = $1,500, D = $500. ICM은 이 중 어느 것도 사실이 아님을 보여줄 것입니다.

1단계 — P(1등)은 단지 Chip 점유율입니다

공리에서 바로 나옵니다. 정확히 1로 합산됩니다:

P(A 1등) = 5000/10000 = 0.5000
P(B 1등) = 3000/10000 = 0.3000
P(C 1등) = 1500/10000 = 0.1500
P(D 1등) = 500/10000 = 0.0500

(0.5000 + 0.3000 + 0.1500 + 0.0500 = 1.0000.) ✓

2단계 — P(2등)의 한 가지 계산된 분기

P(D가 2등으로 마칠 확률)을 수동으로 계산해 봅시다. 누가 1등으로 마칠 수 있는지 합산하여:

A 1등 (확률 0.5), 그리고 D가 남은 것을 차지: $T - 5000 = 5000$ 중 D의 점유율은 $500/5000 = 0.1$입니다. 기여분: 0.5 × 0.1 = 0.05000
B 1등 (확률 0.3), 그리고 $10000 - 3000 = 7000$ 중 D의 점유율은 $500/7000 \approx 0.0714$입니다. 기여분: 0.3 × 0.0714 = 0.02143
C 1등 (확률 0.15), 그리고 $10000 - 1500 = 8500$ 중 D의 점유율은 $500/8500 \approx 0.0588$입니다. 기여분: 0.15 × 0.0588 = 0.00882

합계: 0.05000 + 0.02143 + 0.00882 = 0.08025. 따라서 Chip의 5%를 가진 D는 약 8%의 확률로 2등으로 마칩니다. 각 플레이어에게 동일한 재귀를 적용하면 (여기서는 24가지 순서의 전체 열거를 통해 계산됨) 아래와 같은 완전한 최종 순위 분포를 얻습니다. 1등 열은 공리에 따라 정확하며; 2등/3등/4등 열은 정확한 Malmuth-Harville 재귀이며 반올림되었습니다:

| 플레이어 | P(1등) | P(2등) | P(3등) | P(4등) | |---|---|---|---|---| | A | 0.5000 | 0.3288 | 0.1456 | 0.0255 | | B | 0.3000 | 0.3687 | 0.2613 | 0.0699 | | C | 0.1500 | 0.2222 | 0.4197 | 0.2081 | | D | 0.0500 | 0.0803 | 0.1733 | 0.6965 |

각 행의 합은 1.0이고, 각 열의 합도 1.0입니다. 둘 다 모델이 통과해야 할 유효성 검사입니다. Short stack D가 압도적으로 먼저 Bust될 확률이 높지만 (69.65%) 더 이상 보장되지는 않는다는 점에 주목하십시오. 생존은 끝까지 확률적입니다.

3단계 — 달러로 변환

각 플레이어의 최종 순위 분포에 Payout 벡터 [5000, 3000, 1500, 500]를 내적합니다:

| 플레이어 | Chip 점유율 | "Chip-equity" $ (선형) | ICM $EV | Chip 대비 차이 | |---|---|---|---|---| | A | 50% | $5,000 | $3,717.74 | −$1,282.26 | | B | 30% | $3,000 | $3,033.17 | +$33.17 | | C | 15% | $1,500 | $2,150.19 | +$650.19 | | D | 5% | $500 | $1,098.89 | +$598.89 | | 총계 | 100% | $10,000 | $10,000.00 | 0 |

달러 총액은 전체 $10,000 Prize Pool로 다시 합산됩니다. equity는 보존되며, 생성되거나 파괴되지 않습니다. 이것이 전체 모델의 핵심이며, 명확한 숫자로 나타납니다:

Chip leader A는 $5,000가 아니라 $3,718의 가치를 가집니다. Chip의 절반을 가지고도 A는 예상 Prize Pool의 37%만 차지합니다. 약 $1,282의 "Chip 가치"가 더 작은 Stack으로 새어 나간 것입니다.
Short stack D는 $500가 아니라 $1,099의 가치를 가집니다. 이는 Chip 점유율의 두 배가 넘습니다. Chip의 5%를 가지고도 D는 거의 11%의 돈을 차지합니다.

이것은 특정 Stack의 특이한 현상이 아니라 구조적인 것입니다. Payout 구조의 오목함과 1-Chip Stack조차도 어떤 최종 순위가 보장된다는 사실은 Short stack이 Chip 대비 달러 가치로 체계적으로 과대평가되고, Big stack은 체계적으로 과소평가된다는 것을 의미합니다. 모두가 Payout 스케일의 "중간"으로 끌려가는 것입니다.

이것이 당신의 플레이 방식을 바꾸는 이유

실질적인 결과는 한 문장으로 요약됩니다: risk premium. 당신이 잃는 마지막 Chip이 (달러 가치로) 당신이 얻을 다음 Chip보다 더 가치 있기 때문에, All-in 시의 손익분기점 equity는 순진한 Chip-EV 손익분기점보다 높아집니다. 명백한 Chip-EV Call 상황이 명백한 ICM Fold 상황이 될 수 있습니다.

위의 관점으로 Leader A의 상황을 살펴보세요: A가 미디엄 Stack을 상대로 Chip을 위험에 빠뜨리는 것은 불리한 환율로 달러를 베팅하는 것입니다. A는 손실에 대해 완전한 한계 Chip 비용을 지불하지만, 승리 시에는 할인된 한계 Chip 가치를 얻습니다. 왜냐하면 더블업이 A의 돈을 두 배로 만들지 않기 때문입니다 (A는 이미 곡선 상단에 가깝습니다). 반대로 Short stack D는 더 큰 Stack에 대해 낮은 risk premium을 가집니다. D의 Chip은 위험에 빠뜨리기 저렴합니다. 왜냐하면 D의 하방 위험이 작고, Payout 사다리 equity로 잘 보상되기 때문입니다. 이것이 "Big stack은 Blinds해야 하지만, 다른 Big stack을 상대로는 안 된다"와 "ICM pressure가 미디엄 Stack을 가장 심하게 압박한다"는 말의 수학적 근거입니다. 미디엄 Stack은 잃을 Payout 사다리 equity가 가장 많고 얻을 것이 가장 적습니다.

이것을 눈으로만 확인할 필요는 없습니다. Stack과 Payout을 shadepoker의 ICM 계산기에 입력하고, 각 자리의 $EV를 확인하여, 승리 또는 Bust 전후의 달러 equity를 비교하면 어떤 대결에서든 risk premium이 드러납니다. Chip 변화가 아닌, 전후의 달러 변화가 당신의 River 결정에 반영되어야 할 숫자입니다.

Malmuth-Harville vs Malmuth-Weitzman

Malmuth-Harville은 거의 모든 상업용 ICM 도구의 기본 모델이지만, 유일한 최종 순위 모델은 아닙니다. Malmuth-Weitzman은 Chip count가 주어졌을 때 최종 순위 분포는 무엇인가라는 동일한 질문에 다른 조건부 규칙으로 답합니다.

차이점은 낮은 순위가 도출되는 방식에 있습니다. Harville은 분포를 앞으로 구성합니다. 1등을 하는 사람을 정하고 (확률 = Chip 점유율), 그들을 제거한 다음, 생존자들에게 재귀합니다. 반면에 Weitzman은 아래에서 위로 추론합니다. 꼴찌로 마칠 확률을 Chip Stack에 반비례한다고 모델링한 다음, 탈락 순서를 거쳐 위로 재귀합니다. 두 모델은 P(1등)과 2인 상황에서는 정확히 일치하지만, 더 큰 필드에서는 중간 순위에 약간 다른 확률을 할당하므로 달러 equity도 약간 다르게 할당합니다.

어느 것이 "옳을"까요? 경험적으로 완벽한 것은 없습니다. 둘 다 Blinds, Position, Skill에 의존하는 실제 탈락 과정을 단순화한 것입니다. Harville은 직관적이고 빠르며 관찰된 토너먼트 데이터와 수용 가능한 수준으로 일치하기 때문에 인기를 얻었습니다. Weitzman은 Harville보다 Big stack에 대해 약간 더 비관적이고 Short stack에 대해 약간 더 친절한 경향이 있습니다. 이 의견 불일치는 실제하지만, 둘 다 현실과 비교했을 때 공유하는 모델링 오류에 비하면 일반적으로 작습니다. 실용적인 목적을 위해: "ICM"이 거의 항상 Malmuth-Harville을 의미한다는 것을 알고, Weitzman이 원칙적인 대안으로 존재한다는 것을 알고, 둘 사이의 소수점 둘째 자리 차이에 대해 고민하지 마십시오. 그 차이는 둘이 만드는 가정에 의해 왜소해집니다.

Static ICM을 넘어: Future Game Simulation

솔직한 한계는 다음과 같습니다. Static ICM은 토너먼트가 더 이상의 플레이 없이 해결된다고 가정합니다. 마치 Stack을 고정하는 순간 최종 순위 분포가 결정되는 것처럼요. 두 가지 허구를 포함합니다:

미래의 핸드가 없음. Blinds가 올라가지 않고, antes가 Stack을 소모시키지 않으며, 아무도 누구에게 Open-shove하지 않습니다. Chip은 고정된 복권으로 취급됩니다.
Skill이 없음. 모든 플레이어가 동일합니다. 세계적 수준의 레귤러와 레크레이션 플레이어가 동일한 Stack을 가지고 있으면 동일한 equity를 얻습니다. Button에 대한 Position — 엄청난 Short stack 우위 —은 모델에 보이지 않습니다.

이러한 허구는 미래의 플레이가 많이 남아 있을 때 가장 중요합니다. 즉, 더 깊은 Stack, Stack에 비해 큰 Blinds, 그리고 누군가 Bust되기 전에 Button이 여러 번 돌게 될 때 말이죠. Static ICM은 다음 Orbit 동안 발생하는 Position 및 선점 이점을 무시하기 때문에 이러한 상황을 체계적으로 잘못 평가합니다.

Future Game Simulation (FGS)은 개선된 모델입니다. Stack을 고정하는 대신, FGS는 다음 k 핸드 (일반적으로 한두 핸드에서 네 핸드 정도의 짧은 예측)의 플레이를 시뮬레이션합니다. 이때 Blinds가 어떻게 다투어질지에 대한 간소화된 전략 (종종 push/fold 또는 Solver 기반 모델)을 사용하고, 그 후에 결과적인 Stack 분포에 Static ICM을 적용합니다. 사실상 FGS는 Chip을 달러로 전환하기 전에 Chip이 약간 "미래로 진행"하도록 하여, Position의 가치와 곧 Blinds에 놓이게 될 비용을 포착합니다.

그 결과: FGS는 Short stack에 대한 Position을 갖는 것에 보상하고, Marginal한 핸드로 Big blinds를 곧 지불해야 하는 상황에 벌칙을 가하며, 일반적으로 누군가 탈락하기 전에 Skill과 Position을 사용할 수 있는 상황에서 Static ICM의 가장 가혹한 Fold 일부를 완화합니다. 비용은 계산 및 모델링 복잡성입니다. 시뮬레이션은 미래 핸드에 대해 가정한 전략만큼만 좋으며, 예측 깊이에 따라 상태 공간이 빠르게 폭발하므로 FGS 깊이는 얕게 유지됩니다. FGS를 Static ICM에 다음 Orbit에 대한 짧고 원칙적인 통찰을 더한 것으로 생각하십시오. 미래 플레이가 적은 파이널 테이블 및 Bubble 결정에서는 Static Malmuth-Harville도 이미 훌륭하며, 더 깊은 미드 스테이지의 Payout 점프 상황에서는 FGS가 의미 있는 교정을 제공합니다.

핵심 요약

ICM은 단순히 느낌이 아닙니다. 그것은 구체적인 알고리즘입니다: P(1등)은 Chip 점유율과 같고, 높은 순위의 플레이어를 제거하고 재귀함으로써 낮은 순위가 결정되며, 당신의 달러 equity는 최종 순위 분포와 Payout 사다리의 내적입니다. 어떤 4인 상황에든 이를 적용하면 항상 동일한 구조적 진실이 나타납니다. 즉, Chip leader는 자신의 Stack보다 가치가 적고, Short stack은 더 가치가 높으며, 미디엄 Stack은 이 모델이 가장 심하게 압박하는 대상입니다.

이를 내재화하는 플레이어들은 단순히 "Bubble에서 Tight하게 플레이"하지 않습니다. 그들은 모든 All-in을 Chip 변화가 아닌 달러 변화에 따라 가격을 책정하며, 자신의 risk premium이 언제 도박을 허용하고 언제 제약하는지 알고, 모델의 어떤 가정이 무너지려 하는지 정확히 이해합니다. 이는 FGS나 순수한 판단에 의존해야 할 순간입니다. Chip을 돈으로 취급하는 것과 정확한 환율을 아는 것 사이의 그 간극이 Min-cash와 파이널 테이블 스코어링 사이의 간극입니다. 실제 상황을 shadepoker의 ICM calculator에 입력하고 달러 equity를 읽어서 이 전환을 제2의 천성으로 만드십시오.