ICM desde los primeros principios: cómo Malmuth-Harville convierte las fichas en dólares

Las fichas en una mesa final no son dinero, son boletos de lotería con rendimientos decrecientes. Aquí está el algoritmo exacto que convierte un stack en una cifra en dólares, derivado desde cero y trabajado con números reales.

Todo jugador de tournament ha escuchado el eslogan: "tus fichas no valen su valor nominal". Se repite en las mesas finales como una escritura, generalmente justo antes de que alguien haga un bad call y culpe a la variance. Pero el eslogan no es folklore, es un teorema. Existe un algoritmo exacto y computable que toma un vector de stacks y una estructura de payout y devuelve una cifra en dólares para cada asiento. Ese algoritmo es el Independent Chip Model, y la versión más utilizada es Malmuth-Harville.

Si entiendes el ICM como una caja negra — "la calculadora dice fold" — acertarás en las situaciones fáciles y fallarás en las difíciles. Si lo entiendes como un algoritmo, puedes reconstruirlo en la mesa, anticipar cuándo falla y saber exactamente por qué el chip leader en una mesa final es más pobre de lo que sugiere su stack, mientras que el short stack es más rico que el suyo. Este artículo deriva el modelo de forma clara, presenta un ejemplo concreto de cuatrohanded con números explícitos, contrasta Malmuth-Harville con su primo menos conocido, Malmuth-Weitzman, y luego muestra dónde termina el ICM estático y comienza la Future Game Simulation.

El problema central: las fichas no son lineales en dinero

En un cash game, una chip es un dólar. Stack EV y money EV son el mismo objeto, razón por la cual la estrategia de cash se reduce a maximizar las fichas ganadas por mano. Los tournaments rompen ese vínculo. No puedes cobrar fichas; solo puedes convertir tu posición final en un payout. Y la estructura de payout es cóncava: el primer puesto paga mucho menos que el valor proporcional de todas las fichas en juego.

Concretamente: en una estructura típica, el primer lugar podría ser el 50% del prize pool mientras se posee el 100% de las fichas al final. Esos 50 puntos porcentuales de equity "perdida" no se desvanecieron, se distribuyeron a todos los demás en el camino, en proporción a sus posibilidades de superar a otros jugadores. El trabajo completo del ICM es averiguar cómo dividir un prize pool fijo entre los jugadores restantes basándose únicamente en sus chip counts actuales.

La palabra "Independent" en el nombre señala el supuesto simplificador central: el ICM trata las probabilidades de posición final como si dependieran solo de los chip counts, ignorando position, skill, blind level y future play. Ese supuesto es incorrecto en detalle y útil en conjunto; más sobre eso cuando lleguemos a FGS.

El modelo Malmuth-Harville

Malmuth-Harville se basa en un axioma único y claro:

La probabilidad de que un jugador dado termine primero es igual a su parte del total de fichas en juego.

Si el jugador i tiene un stack $s_i$ y el total de fichas en juego es $T$, entonces:

\[P(i \text{ finishes 1st}) = \dfrac{s_i}{T}\]

Este es todo el motor. Todo lo demás es contabilidad.

Lo elegante es cómo maneja las posiciones finales inferiores. Una vez que se ha fijado quién termina primero, ese jugador y sus fichas se eliminan de la consideración, y se hace la misma pregunta al campo restante con las fichas restantes. La probabilidad de que el jugador j termine segundo es la probabilidad de que otra persona termine primero, multiplicada por la probabilidad de que j "gane" el subtorneo entre los supervivientes.

Formalmente, la probabilidad de que j termine segundo es una suma sobre cada posible finalista en primer lugar k (con k ≠ j):

\[P(j \text{ is 2nd}) = \sum_{k \neq j} P(k \text{ is 1st}) \cdot \dfrac{s_j}{T - s_k}\]

Lee eso con atención. Condicionado a que k termine primero, las fichas de k abandonan el pool, el nuevo total es $T - s_k$, y dentro de ese campo reducido el jugador j termina "primero" (es decir, segundo en la general) con una probabilidad $s_j / (T - s_k)$. Suma todas las formas en que podría llenarse la posición de primer lugar y tendrás la probabilidad exacta de segundo lugar de j.

El tercer lugar recurre un nivel más profundo: suma sobre todos los pares ordenados de (1º, 2º) finalistas, elimina ambos stacks y calcula la parte de j de las fichas restantes. En general, se enumeran los órdenes de llegada, se pondera cada orden por su probabilidad Malmuth-Harville y se acumula. Para n jugadores restantes hay n! ordenamientos, lo cual es trivial para una mesa final de nueve (362.880 órdenes, milisegundos de cálculo), razón por la cual el ICM en una mesa final real es exacto, no aproximado.

Tu Dollar Equity

Una vez que tienes la finish distribution completa — para cada jugador, la probabilidad de terminar 1º, 2º, 3º, … — la conversión a dinero es un producto escalar. Sea $\text{pay}[r]$ el payout por terminar en la posición r. Entonces:

\[\text{EV}(i) = \sum_r P(i \text{ finishes in position } r) \cdot \text{pay}[r]\]

Esa única línea es el resultado principal del modelo: tu equity de tournament en dólares es la suma, sobre cada posición final, de la probabilidad de que aterrices allí multiplicada por lo que paga esa posición. El ICM no es más que una forma basada en principios para calcular esas probabilidades.

Un ejemplo concreto de cuatro left

La teoría se asimila mejor con números. Quedan cuatro jugadores. Stacks y un prize pool de $10,000 pagados 50 / 30 / 15 / 5:

| Player | Stack | Chip share | Payout por esa posición | |---|---|---|---| | A | 5,000 | 50% | 1º = $5,000 | | B | 3,000 | 30% | 2º = $3,000 | | C | 1,500 | 15% | 3º = $1,500 | | D | 500 | 5% | 4º = $500 | | Total | 10,000 | 100% | Pool = $10,000 |

Nota la trampa deliberada incorporada en esta configuración: los payouts (50/30/15/5) reflejan exactamente las chip shares (50/30/15/5). Si las fichas fueran lineales en dinero, el $EV de cada jugador sería igual a sus dólares de chip-share: A = $5,000, B = $3,000, C = $1,500, D = $500. El ICM mostrará que ninguna de esas equivalencias se sostiene.

Step 1 — P(1st) es simplemente la chip share

Directamente del axioma, y suma exactamente 1:

P(A 1st) = 5000/10000 = 0.5000
P(B 1st) = 3000/10000 = 0.3000
P(C 1st) = 1500/10000 = 0.1500
P(D 1st) = 500/10000 = 0.0500

(0.5000 + 0.3000 + 0.1500 + 0.0500 = 1.0000.) ✓

Step 2 — Una rama calculada de P(2nd)

Calculemos a mano P(D finishes 2nd), sumando quién podría terminar primero:

A 1º (prob 0.5), luego D gana el resto: la parte de D de $T - 5000 = 5000$ es $500/5000 = 0.1$. Contribución: 0.5 × 0.1 = 0.05000
B 1º (prob 0.3), luego la parte de D de $10000 - 3000 = 7000$ es $500/7000 \approx 0.0714$. Contribución: 0.3 × 0.0714 = 0.02143
C 1º (prob 0.15), luego la parte de D de $10000 - 1500 = 8500$ es $500/8500 \approx 0.0588$. Contribución: 0.15 × 0.0588 = 0.00882

Suma: 0.05000 + 0.02143 + 0.00882 = 0.08025. Así que D, con el 5% de las fichas, termina segundo aproximadamente el 8% de las veces. La misma recursión aplicada a cada jugador (aquí calculada por enumeración completa de los 24 ordenamientos) da la distribución completa de posiciones finales a continuación. La columna del 1er puesto es exacta por axioma; las columnas del 2º/3º/4º puesto son la correcta recursión Malmuth-Harville, redondeada:

| Player | P(1st) | P(2nd) | P(3rd) | P(4th) | |---|---|---|---|---| | A | 0.5000 | 0.3288 | 0.1456 | 0.0255 | | B | 0.3000 | 0.3687 | 0.2613 | 0.0699 | | C | 0.1500 | 0.2222 | 0.4197 | 0.2081 | | D | 0.0500 | 0.0803 | 0.1733 | 0.6965 |

Cada fila suma 1.0, y cada columna suma 1.0 — ambos son controles de cordura que el modelo debe pasar. Observa cómo el short stack D es abrumadoramente probable que sea el primero en bustear (69.65%) pero ya no está garantizado a hacerlo: la supervivencia es probabilística hasta el final.

Step 3 — Convertir a dólares

Realiza el producto escalar de la finish distribution de cada jugador con el vector de payouts [5000, 3000, 1500, 500]:

| Player | Chip share | "Chip-equity" $ (lineal) | ICM $EV | Delta vs chips | |---|---|---|---|---| | A | 50% | $5,000 | $3,717.74 | −$1,282.26 | | B | 30% | $3,000 | $3,033.17 | +$33.17 | | C | 15% | $1,500 | $2,150.19 | +$650.19 | | D | 5% | $500 | $1,098.89 | +$598.89 | | Total | 100% | $10,000 | $10,000.00 | 0 |

Los dólares suman de nuevo al prize pool completo de $10,000 — la equity se conserva, nunca se crea ni se destruye. Ese es el punto clave de todo el modelo, presentado en números claros:

El chip leader A vale $3,718, no $5,000. Con la mitad de las fichas, A captura solo el 37% del prize pool en expectativa. Aproximadamente $1,282 de "valor en fichas" se han filtrado a los stacks más pequeños.
El short stack D vale $1,099, no $500 — más del doble de su chip share. Con el 5% de las fichas, D controla casi el 11% del dinero.

Esto no es una peculiaridad de estos stacks en particular; es estructural. La concavidad de la escala de payouts, más el hecho de que incluso un stack de 1 ficha tiene garantizada alguna posición final, significa que los short stacks son sistemáticamente sobrevalorados en dólares en relación con las fichas, y los big stacks sistemáticamente infravalorados. Todos son "atraídos hacia el centro" de la escala de pagos.

Por qué esto cambia tu forma de jugar

La consecuencia práctica se resume en una frase: risk premium. Debido a que tus últimas fichas perdidas valen más (en $) que tus próximas fichas ganadas, la equity de breakeven para un stack-off se eleva por encima del punto de equilibrio ingenuo en chip-EV. Una situación que es un claro call en chip-EV puede ser un claro ICM fold.

Analiza la situación del líder A a través de la lente anterior: A, al arriesgar fichas contra un stack medio, está apostando dólares a un tipo de cambio desfavorable; A paga el coste marginal completo de las fichas en las pérdidas, pero cobra un valor marginal de fichas descontado en las ganancias, porque doblar no duplica el dinero de A (A ya está cerca de la cima de la curva). El short stack D, por el contrario, tiene un risk premium bajo contra los stacks más grandes: las fichas de D son baratas de arriesgar porque su desventaja es pequeña y está bien compensada por la laddering equity. Esta es la columna vertebral matemática de "los big stacks deben presionar, pero no contra el otro big stack" y "la presión del ICM aplasta más a los stacks medios": los stacks medios tienen la mayor ladder equity que perder y la menor que ganar.

No tienes que evaluarlo a ojo. Introduce los stacks y payouts en el Calculadora ICM de shadepoker, lee el $EV de cada asiento, y el risk premium para cualquier confrontación dada resulta de comparar la equity en dólares antes/después de ganar versus bustear. Ese cambio en dólares de antes-vs-después — no el cambio en fichas — es el número contra el que debe valorarse tu decisión en el river.

Malmuth-Harville vs Malmuth-Weitzman

Malmuth-Harville es el predeterminado en prácticamente todas las herramientas comerciales de ICM, pero no es el único modelo de orden de llegada. Malmuth-Weitzman responde la misma pregunta — dados los chip counts, cuál es la finish distribution — con una regla de condicionamiento diferente.

La distinción radica en cómo se derivan los puestos inferiores. Harville construye la distribución hacia adelante: fija quién termina primero (probabilidad = chip share), lo elimina, y recurre sobre los supervivientes. Weitzman, en cambio, razona de abajo hacia arriba, modelando la probabilidad de terminar último como inversamente relacionada con el stack de fichas, y luego recurriendo hacia arriba a través del orden de eliminación. Los dos modelos coinciden exactamente en P(1st) y en el caso de dos jugadores, pero asignan probabilidades ligeramente diferentes a las posiciones finales intermedias en campos más grandes, y por lo tanto, equities en dólares ligeramente diferentes.

¿Cuál es el "correcto"? Ninguno de los dos es empíricamente perfecto; ambos son simplificaciones de un proceso de eliminación real que depende de blinds, position y skill. Harville ganó el concurso de popularidad porque su recursión hacia adelante es intuitiva, rápida y se ajusta aceptablemente bien a los datos observados de los tournaments. Weitzman tiende a ser marginalmente más pesimista para los big stacks y marginalmente más amable con los short stacks que Harville. La discrepancia es real pero generalmente pequeña en relación con el error de modelado que ambos comparten con la realidad. Para propósitos prácticos: sabe que "ICM" casi siempre significa Malmuth-Harville, sabe que Weitzman existe como una alternativa basada en principios, y no te obsesiones con las diferencias de segundo decimal entre ellos — están eclipsadas por los supuestos que ambos hacen.

Más allá del ICM estático: Future Game Simulation

Aquí está la limitación honesta. El ICM estático asume que el tournament se resuelve sin más juego — como si la finish distribution se cristalizara en el instante en que se congelan los stacks. Incorpora dos ficciones:

No hay manos futuras. Las blinds no suben, las antes no agotan los stacks, nadie open-shovea contra nadie. Las fichas son tratadas como una lotería fija.
No hay skill. Cada jugador es idéntico. Un regular de clase mundial y un jugador recreativo con el mismo stack obtienen la misma equity. La position en relación con el button — una enorme ventaja para el short stack — es invisible para el modelo.

Estas ficciones importan más cuando queda mucho future play: stacks más profundos, big blinds relativas a los stacks, y un button que se moverá varias veces antes de que alguien bustee. El ICM estático valora sistemáticamente mal esas situaciones porque ignora las ventajas posicionales y de iniciativa que se acumulan en la próxima órbita.

Future Game Simulation (FGS) es el refinamiento. En lugar de congelar los stacks, FGS simula las próximas k manos de juego — típicamente una pequeña anticipación como de una a cuatro manos — utilizando una estrategia simplificada (a menudo un push/fold o un modelo derivado del solver) sobre cómo se disputarán las blinds, y solo entonces aplica el ICM estático a la distribución resultante de los stacks. En efecto, FGS permite que las fichas "jueguen hacia adelante" un poco antes de convertirlas en dólares, capturando el valor de la position y el costo de estar pronto en las blinds.

La recompensa: FGS premia tener position sobre un short stack, penaliza estar a punto de poner las big blinds con una mano marginal, y generalmente suaviza algunos de los folds más duros del ICM estático en situaciones donde podrás usar tu skill y position antes de que alguien sea eliminado. El costo es la complejidad computacional y de modelado — la simulación es tan buena como la estrategia que asumas para esas manos futuras, y el espacio de estados explota rápidamente con la profundidad de la anticipación, razón por la cual las profundidades de FGS se mantienen poco profundas. Piensa en FGS como el ICM estático más un vistazo corto y basado en principios a la próxima órbita. Para las decisiones de mesa final y bubble donde el future play es escaso, el ICM estático Malmuth-Harville ya es excelente; para las situaciones de pay-jump más profundas en etapas intermedias, FGS lo corrige significativamente.

El mensaje clave

El ICM no es una sensación. Es un algoritmo concreto: P(1st) es igual a la chip share, las posiciones inferiores siguen eliminando a los finalistas superiores y recurriendo, y tu dollar equity es la finish distribution en producto escalar con la ladder de payout. Ejecútalo en cualquier situación de cuatrohanded y la misma verdad estructural aparece cada vez: el chip leader vale menos que su stack, el short stack vale más, y los stacks medios son los que el modelo aprieta más fuerte.

Los jugadores que internalizan esto no solo "juegan tight en la bubble". Valoran cada all-in contra el cambio en dólares en lugar del cambio en fichas, saben cuándo su risk premium los libera para apostar y cuándo los encadena, y entienden exactamente qué supuestos del modelo están a punto de fallar, que es el momento de apoyarse en FGS o en el juicio puro. Esa brecha, entre tratar las fichas como dinero y conocer el tipo de cambio preciso, es la brecha entre el min-cashing y la puntuación de la mesa final. Introduce una situación real en el ICM calculator de shadepoker, lee las dollar equities y empieza a hacer de la conversión una segunda naturaleza.