ICM a Partir dos Primeiros Princípios: Como Malmuth-Harville Transforma Fichas em Dólares

Fichas em uma mesa final não são dinheiro — são bilhetes de loteria com retornos decrescentes. Aqui está o algoritmo exato que converte um Stack em um valor em dólares, derivado do zero e exemplificado com números reais.

Todo jogador de torneio já ouviu o slogan: "suas fichas não valem seu valor nominal." Ele é repetido em mesas finais como uma escritura, geralmente logo antes de alguém fazer um bad call e culpar a variância. Mas o slogan não é folclore — é um teorema. Existe um algoritmo exato e computável que pega um vetor de Stacks e uma estrutura de payout e retorna um valor em dólares para cada assento. Esse algoritmo é o Independent Chip Model, e a versão mais amplamente utilizada é Malmuth-Harville.

Se você entende o ICM como uma caixa preta — "a calculadora diz fold" — você acertará as situações fáceis e errará as difíceis. Se você o entende como um algoritmo, pode reconstruí-lo na mesa, antecipar quando ele falha e saber exatamente por que o chip leader em uma mesa final é mais pobre do que seu Stack sugere, enquanto o short stack é mais rico do que o seu. Este artigo deriva o modelo de forma clara, apresenta um exemplo concreto de four-handed com números explícitos, compara Malmuth-Harville com seu primo menos conhecido, Malmuth-Weitzman, e então mostra onde o ICM estático termina e a Future Game Simulation começa.

O Problema Central: Fichas Não São Lineares em Dinheiro

Em um cash game, uma ficha é um dólar. Stack EV e money EV são o mesmo objeto, e é por isso que a estratégia de cash se resume a maximizar as fichas ganhas por mão. Torneios cortam essa ligação. Você não pode sacar fichas; você só pode converter sua posição final em um payout. E a estrutura de payout é côncava — o primeiro lugar paga muito menos do que o valor proporcional de todas as fichas em jogo.

Concretamente: em uma estrutura típica, o primeiro lugar pode receber 50% do prize pool enquanto detém 100% das fichas no final. Esses 50 pontos percentuais de equity "faltante" não desapareceram — eles foram distribuídos para todos os outros ao longo do caminho, em proporção às suas chances de superar os outros jogadores. O trabalho completo do ICM é descobrir como dividir um prize pool fixo entre os jogadores restantes com base apenas em seus chip counts atuais.

A palavra "Independent" no nome sinaliza a principal suposição simplificadora: o ICM trata as probabilidades de finalização como se dependessem apenas dos chip counts, ignorando position, skill, blind level e future play. Essa suposição está errada em detalhes e é útil no agregado — mais sobre isso quando chegarmos ao FGS.

O Modelo Malmuth-Harville

Malmuth-Harville baseia-se em um único e claro axioma:

A probabilidade de um determinado jogador terminar em primeiro lugar é igual à sua proporção das fichas totais em jogo.

Se o jogador i possui um Stack $s_i$ e o total de fichas em jogo é $T$, então:

\[P(i \text{ finishes 1st}) = \dfrac{s_i}{T}\]

Este é o motor inteiro. Todo o resto é contabilidade.

A parte elegante é como ele lida com as posições finais mais baixas. Uma vez que você define quem termina em primeiro, esse jogador e suas fichas são removidos da consideração, e você faz a mesma pergunta ao campo restante com as fichas restantes. A probabilidade de o jogador j terminar em segundo é a probabilidade de outra pessoa terminar em primeiro, multiplicada pela probabilidade de j "vencer" o sub-torneio entre os sobreviventes.

Formalmente, a probabilidade de j terminar em segundo é a soma de todos os possíveis finalistas em primeiro lugar k (com k ≠ j):

\[P(j \text{ is 2nd}) = \sum_{k \neq j} P(k \text{ is 1st}) \cdot \dfrac{s_j}{T - s_k}\]

Leia isso cuidadosamente. Condicionado a k terminar em primeiro, as fichas de k saem do pool, o novo total é $T - s_k$, e dentro desse campo reduzido o jogador j termina "primeiro" (ou seja, segundo no geral) com probabilidade $s_j / (T - s_k)$. Some todas as maneiras pelas quais a vaga de primeiro lugar poderia ser preenchida e você terá a probabilidade exata de j terminar em segundo.

O terceiro lugar recursa um nível mais fundo: some sobre todos os pares ordenados de finalistas (1º, 2º), remova ambos os Stacks e compute a proporção de j das fichas restantes-restantes. Em geral, você enumera as ordens de finalização, pondera cada ordem pela sua probabilidade Malmuth-Harville e acumula. Para n jogadores restantes, há n! ordenações — trivial para uma mesa final de nove (362.880 ordens, milissegundos de computação), é por isso que o ICM em uma mesa final real é exato, não aproximado.

Sua Dollar Equity

Uma vez que você tem a distribuição de finalização completa — para cada jogador, a probabilidade de terminar em 1º, 2º, 3º, … — converter para dinheiro é um produto escalar. Seja $\text{pay}[r]$ o payout para terminar na posição r. Então:

\[\text{EV}(i) = \sum_r P(i \text{ finishes in position } r) \cdot \text{pay}[r]\]

Essa única linha é o resultado principal do modelo: sua tournament equity em dólares é a soma, sobre cada posição final, da probabilidade de você chegar lá vezes o que essa posição paga. O ICM não é nada mais do que uma forma fundamentada de calcular essas probabilidades.

Um Exemplo Concreto de Four-Left

A teoria é melhor absorvida através de números. Quatro jogadores restantes. Stacks e um prize pool de $10.000 pagos em 50 / 30 / 15 / 5:

| Jogador | Stack | Proporção de fichas | Payout para essa posição | |---|---|---|---| | A | 5.000 | 50% | 1º = $5.000 | | B | 3.000 | 30% | 2º = $3.000 | | C | 1.500 | 15% | 3º = $1.500 | | D | 500 | 5% | 4º = $500 | | Total | 10.000 | 100% | Pool = $10.000 |

Note a armadilha proposital embutida nesta configuração: os payouts (50/30/15/5) espelham exatamente as proporções de fichas (50/30/15/5). Se as fichas fossem lineares em dinheiro, o $EV de cada jogador seria igual aos seus dólares de proporção de fichas: A = $5.000, B = $3.000, C = $1.500, D = $500. O ICM mostrará que nenhum desses valores se mantém.

Passo 1 — P(1º) é apenas a proporção de fichas

Direto do axioma, e soma exatamente 1:

P(A 1º) = 5000/10000 = 0.5000
P(B 1º) = 3000/10000 = 0.3000
P(C 1º) = 1500/10000 = 0.1500
P(D 1º) = 500/10000 = 0.0500

(0.5000 + 0.3000 + 0.1500 + 0.0500 = 1.0000.) ✓

Passo 2 — Um ramo trabalhado de P(2º)

Vamos calcular P(D termina em 2º) manualmente, somando sobre quem poderia terminar em primeiro:

A 1º (prob 0.5), então D ganha o restante: a proporção de D de $T - 5000 = 5000$ é $500/5000 = 0.1$. Contribuição: 0.5 × 0.1 = 0.05000
B 1º (prob 0.3), então a proporção de D de $10000 - 3000 = 7000$ é $500/7000 \approx 0.0714$. Contribuição: 0.3 × 0.0714 = 0.02143
C 1º (prob 0.15), então a proporção de D de $10000 - 1500 = 8500$ é $500/8500 \approx 0.0588$. Contribuição: 0.15 × 0.0588 = 0.00882

Soma: 0.05000 + 0.02143 + 0.00882 = 0.08025. Assim, D, detendo 5% das fichas, termina em segundo cerca de 8% das vezes. A mesma recursão aplicada a cada jogador (aqui calculada por enumeração completa de todas as 24 ordenações) fornece a distribuição de finalização completa abaixo. A coluna do 1º lugar é exata por axioma; as colunas de 2º/3º/4º são a recursão correta de Malmuth-Harville, arredondada:

| Jogador | P(1º) | P(2º) | P(3º) | P(4º) | |---|---|---|---|---| | A | 0.5000 | 0.3288 | 0.1456 | 0.0255 | | B | 0.3000 | 0.3687 | 0.2613 | 0.0699 | | C | 0.1500 | 0.2222 | 0.4197 | 0.2081 | | D | 0.0500 | 0.0803 | 0.1733 | 0.6965 |

Cada linha soma 1.0, e cada coluna soma 1.0 — ambos são verificações de sanidade que o modelo deve passar. Observe como o short stack D tem uma probabilidade esmagadora de bustar primeiro (69.65%), mas não é mais garantido: a sobrevivência é probabilística até o fim.

Passo 3 — Converter para dólares

Multiplique a distribuição de finalização de cada jogador pelo vetor de payout [5000, 3000, 1500, 500]:

| Jogador | Proporção de fichas | "Chip-equity" $ (linear) | ICM $EV | Delta vs fichas | |---|---|---|---|---| | A | 50% | $5.000 | $3.717,74 | −$1.282,26 | | B | 30% | $3.000 | $3.033,17 | +$33,17 | | C | 15% | $1.500 | $2.150,19 | +$650,19 | | D | 5% | $500 | $1.098,89 | +$598,89 | | Total | 100% | $10.000 | $10.000,00 | 0 |

Os dólares somam de volta ao prize pool total de $10.000 — a equity é conservada, nunca criada ou destruída. Esse é o cerne de todo o modelo, apresentado em números claros:

O chip leader A vale $3.718, não $5.000. Detendo metade das fichas, A captura apenas 37% do prize pool em expectativa. Aproximadamente $1.282 de "valor de ficha" vazaram para os Stacks menores.
O short stack D vale $1.099, não $500 — mais do que o dobro de sua proporção de fichas. Com 5% das fichas, D detém quase 11% do dinheiro.

Isso não é uma peculiaridade desses Stacks específicos; é estrutural. A concavidade da escada de payout, somada ao fato de que até mesmo um Stack de 1 ficha tem alguma posição final garantida, significa que os short stacks são sistematicamente super-valorizados em dólares em relação às fichas, e os big stacks são sistematicamente sub-valorizados. Todos são "puxados para o meio" da escala de pagamento.

Por Que Isso Muda Como Você Joga

A consequência prática reside em uma frase: risk premium. Como suas últimas fichas perdidas valem mais (em $) do que suas próximas fichas ganhas, a breakeven equity para um stack-off sobe acima do breakeven chip-EV ingênuo. Um spot que é um claro chip-EV call pode ser um claro ICM fold.

Analise a situação do líder A através da lente acima: A, arriscando fichas contra um Stack médio, está apostando dólares a uma taxa de câmbio desfavorável — A paga o custo total marginal da ficha nas perdas, mas coleta um valor marginal da ficha descontado nas vitórias, porque dobrar não dobra o dinheiro de A (A já está perto do topo da curva). O short stack D, por outro lado, tem um low risk premium contra os Stacks maiores: as fichas de D são baratas para arriscar porque o risco de queda de D é pequeno e bem compensado pela laddering equity. Esta é a espinha dorsal matemática de "big stacks devem intimidar, mas não contra o outro big stack" e "a pressão do ICM esmaga mais os Stacks médios" — os Stacks médios têm mais ladder equity a perder e menos a ganhar.

Você não precisa fazer isso a olho nu. Insira os Stacks e payouts na Calculadora de ICM da shadepoker, leia o $EV de cada assento, e o risk premium para qualquer confronto dado surge da comparação da dollar equity de ganhar versus bustar antes/depois. Esse swing de dólares antes-vs-depois — não o swing de fichas — é o número contra o qual sua decisão no river deve ser precificada.

Malmuth-Harville vs Malmuth-Weitzman

Malmuth-Harville é o padrão em praticamente todas as ferramentas comerciais de ICM, mas não é o único modelo de ordem de finalização. Malmuth-Weitzman responde à mesma pergunta — dados os chip counts, qual é a distribuição de finalização — com uma regra de condicionamento diferente.

A distinção está em como as posições mais baixas são derivadas. Harville constrói a distribuição adiante: fixe quem termina em primeiro (probabilidade = proporção de fichas), remova-o, e recursa nos sobreviventes. Weitzman, por outro lado, raciocina de baixo para cima — modelando a probabilidade de terminar em último como inversamente relacionada ao chip stack, e então recursando para cima através da ordem de eliminação. Os dois modelos concordam exatamente em P(1º) e no caso de dois jogadores, mas eles atribuem probabilidades ligeiramente diferentes às posições finais intermediárias em campos maiores, e, portanto, dollar equities ligeiramente diferentes.

Qual está "certo"? Nenhum é empiricamente perfeito — ambos são simplificações de um processo de eliminação real que depende de Blinds, position e skill. Harville venceu o concurso de popularidade porque sua recursão forward é intuitiva, rápida e corresponde bem aos dados observados em torneios. Weitzman tende a ser marginalmente mais pessimista para big stacks e marginalmente mais gentil com short stacks do que Harville. A discordância é real, mas geralmente pequena em relação ao erro de modelagem que ambos compartilham em relação à realidade. Para fins práticos: saiba que "ICM" quase sempre significa Malmuth-Harville, saiba que Weitzman existe como uma alternativa de princípios, e não se preocupe com as diferenças de segundo decimal entre eles — elas são ofuscadas pelas suposições que ambos fazem.

Além do ICM Estático: Future Game Simulation

Aqui está a limitação honesta. O ICM estático assume que o torneio se resolve sem mais jogadas — como se a distribuição de finalização se cristalizasse no instante em que você congela os Stacks. Ele incorpora duas ficções:

Sem mãos futuras. Os Blinds não aumentam, os antes não drenam os Stacks, ninguém faz open-shoves em ninguém. As fichas são tratadas como uma loteria fixa.
Sem skill. Todo jogador é idêntico. Um reg de classe mundial e um jogador recreativo com o mesmo Stack recebem a mesma equity. Position em relação ao button — uma enorme vantagem para o short stack — é invisível para o modelo.

Essas ficções importam mais quando há muito future play restante: Stacks mais profundos, big blinds em relação aos Stacks, e um button que girará várias vezes antes que alguém buSte. O ICM estático precifica sistematicamente mal esses spots porque ignora as vantagens posicionais e de iniciativa que se acumulam ao longo da próxima órbita.

Future Game Simulation (FGS) é o refinamento. Em vez de congelar os Stacks, o FGS simula as próximas k mãos de jogo — tipicamente uma pequena antecipação de uma a quatro mãos — usando uma estratégia simplificada (muitas vezes um modelo push/fold ou derivado de solver) para como os Blinds serão contestados, e só então aplica o ICM estático à distribuição resultante dos Stacks. Em efeito, o FGS permite que as fichas "jogem para frente" um pouco antes de serem convertidas em dólares, capturando o valor da position e o custo de estar nos Blinds em breve.

A recompensa: o FGS recompensa ter position sobre um short stack, penaliza estar prestes a postar big blinds com uma holding marginal e geralmente suaviza algumas das folds mais rigorosas do ICM estático em spots onde você poderá usar sua skill e position antes que alguém seja eliminado. O custo é a complexidade computacional e de modelagem — a simulação é tão boa quanto a estratégia que você assume para essas mãos futuras, e o espaço de estados explode rapidamente com a profundidade da antecipação, razão pela qual as profundidades do FGS são mantidas rasas. Pense no FGS como o ICM estático mais um vislumbre curto e principiado da próxima órbita. Para decisões de mesa final e bubble onde o future play é limitado, o Malmuth-Harville estático já é excelente; para spots de pay-jump mais profundos no meio da fase, o FGS o corrige significativamente.

A Conclusão

ICM não é um feeling. É um algoritmo concreto: P(1º) é igual à proporção de fichas, as posições mais baixas seguem removendo os finalistas de posições superiores e recursando, e sua dollar equity é a distribuição de finalização multiplicada pela escada de payout. Execute-o em qualquer spot de four-handed e a mesma verdade estrutural aparecerá todas as vezes — o chip leader vale menos que seu Stack, o short stack vale mais, e os Stacks médios são os que o modelo mais aperta.

Os jogadores que internalizam isso não apenas "jogam tight na bubble." Eles precificam cada All-in contra o swing de dólares em vez do swing de fichas, eles sabem quando seu risk premium os liberta para jogar e quando os prende, e eles entendem exatamente quais suposições do modelo estão prestes a quebrar — que é o momento de se apoiar no FGS ou no puro julgamento. Essa lacuna, entre tratar fichas como dinheiro e saber a taxa de câmbio precisa, é a lacuna entre min-cashing e a pontuação da mesa final. Conecte um spot real na calculadora de ICM da shadepoker, leia as dollar equities, e comece a fazer a conversão de forma natural.