ICM dai primi principi: come Malmuth-Harville trasforma le chips in dollari

Le chips a un tavolo finale non sono denaro, sono biglietti della lotteria con rendimenti decrescenti. Ecco l'algoritmo esatto che converte uno stack in una cifra in dollari, derivato da zero e analizzato con numeri reali.

Ogni giocatore di tournament ha sentito lo slogan: "le tue chips non valgono il loro valore nominale". Viene ripetuto ai tavoli finali come una sacra scrittura, di solito poco prima che qualcuno faccia un bad call e dia la colpa alla variance. Ma lo slogan non è folklore, è un teorema. Esiste un algoritmo esatto e calcolabile che prende un vettore di stack e una struttura di payout e restituisce una cifra in dollari per ogni posto. Questo algoritmo è l'Independent Chip Model, e la sua versione più utilizzata è Malmuth-Harville.

Se comprendi l'ICM come una black box — "il calcolatore dice fold" — azzeccherai le situazioni facili e sbaglierai quelle difficili. Se lo comprendi come un algoritmo, puoi ricostruirlo al tavolo, anticipare quando non funziona e sapere esattamente perché il chip leader a un tavolo finale è più povero di quanto la sua stack suggerisca, mentre lo short stack è più ricco della sua. Questo articolo deriva il modello in modo chiaro, presenta un esempio concreto a quattro mani con numeri espliciti, confronta Malmuth-Harville con il suo meno noto cugino Malmuth-Weitzman e poi mostra dove finisce l'ICM statico e inizia la Future Game Simulation.

Il problema centrale: le chips non sono lineari nel denaro

In un cash game, una chip è un dollaro. Stack EV e money EV sono lo stesso oggetto, ed è per questo che la strategia del cash si riduce a massimizzare le chips vinte per mano. I tournaments recindono quel legame. Non puoi incassare le chips; puoi solo convertire la tua posizione finale in un payout. E la struttura di payout è concava: il primo posto paga molto meno del valore proporzionale di tutte le chips in gioco.

In concreto: in una struttura tipica, il primo posto potrebbe valere il 50% del prize pool pur detenendo il 100% delle chips alla fine. Quei 50 punti percentuali di equity "mancante" non sono svaniti — sono stati distribuiti a tutti gli altri lungo il percorso, in proporzione alle loro possibilità di resistere più a lungo degli altri giocatori. L'intero compito dell'ICM è capire come dividere un prize pool fisso tra i giocatori rimanenti basandosi solo sui loro attuali chip counts.

La parola "Independent" nel nome indica l'ipotesi semplificatrice centrale: l'ICM tratta le probabilità di piazzamento come se dipendessero solo dai chip counts, ignorando position, skill, blind level e future play. Questa ipotesi è sbagliata nei dettagli e utile nell'insieme — ne parleremo quando arriveremo a FGS.

Il modello Malmuth-Harville

Malmuth-Harville si basa su un unico, chiaro assioma:

La probabilità che un dato giocatore finisca primo è uguale alla sua quota del totale delle chips in gioco.

Se il giocatore i detiene lo stack $s_i$ e il totale delle chips in gioco è $T$, allora:

\[P(i \text{ finishes 1st}) = \dfrac{s_i}{T}\]

Questo è l'intero motore. Tutto il resto è contabilità.

La parte elegante è come gestisce le posizioni di arrivo inferiori. Una volta che hai stabilito chi finisce primo, quel giocatore e le sue chips vengono rimosse dalla considerazione, e si pone la stessa domanda al campo rimanente con le chips rimanenti. La probabilità che il giocatore j finisca secondo è la probabilità che qualcun altro finisca primo, moltiplicata per la probabilità che j "vinca" il sotto-tournament tra i sopravvissuti.

Formalmente, la probabilità che j finisca secondo è una somma su ogni possibile vincitore del primo posto k (con k ≠ j):

\[P(j \text{ is 2nd}) = \sum_{k \neq j} P(k \text{ is 1st}) \cdot \dfrac{s_j}{T - s_k}\]

Leggi attentamente. Condizionato al fatto che k finisca primo, le chips di k lasciano il pool, il nuovo totale è $T - s_k$, e all'interno di quel campo ridotto il giocatore j finisce "primo" (cioè secondo in generale) con probabilità $s_j / (T - s_k)$. Somma su ogni modo in cui il primo posto potrebbe essere riempito e avrai la probabilità esatta del secondo posto di j.

Il terzo posto ricorre un livello più in profondità: somma su tutte le coppie ordinate di (1°, 2°) classificati, rimuovi entrambi gli stack e calcola la quota di j delle chips rimanenti. In generale, si enumerano gli ordini di arrivo, si pondera ogni ordine con la sua probabilità Malmuth-Harville e si accumula. Per n giocatori rimanenti ci sono n! ordinamenti — banale per un tavolo finale di nove (362.880 ordini, millisecondi di calcolo), motivo per cui l'ICM a un vero tavolo finale è esatto, non approssimato.

La tua Dollar Equity

Una volta che hai la finish distribution completa — per ogni giocatore, la probabilità di finire 1°, 2°, 3°, … — la conversione in denaro è un prodotto scalare. Sia $\text{pay}[r]$ il payout per il piazzamento in posizione r. Allora:

\[\text{EV}(i) = \sum_r P(i \text{ finishes in position } r) \cdot \text{pay}[r]\]

Quella singola riga è il risultato principale del modello: la tua equity nel tournament in dollari è la somma, su ogni posizione finale, della probabilità di arrivarci moltiplicata per quanto paga quella posizione. L'ICM non è altro che un modo basato su principi per calcolare quelle probabilità.

Un esempio concreto a quattro left

La teoria si assorbe meglio attraverso i numeri. Rimangono quattro giocatori. Stack e un prize pool di $10.000 pagato 50 / 30 / 15 / 5:

| Player | Stack | Chip share | Payout per quel piazzamento | |---|---|---|---| | A | 5,000 | 50% | 1° = $5,000 | | B | 3,000 | 30% | 2° = $3,000 | | C | 1,500 | 15% | 3° = $1,500 | | D | 500 | 5% | 4° = $500 | | Total | 10,000 | 100% | Pool = $10,000 |

Nota la trappola deliberata insita in questa configurazione: i payout (50/30/15/5) rispecchiano esattamente le chip shares (50/30/15/5). Se le chips fossero lineari nel denaro, l'$EV di ogni giocatore sarebbe uguale ai loro dollari di chip-share: A = $5,000, B = $3,000, C = $1,500, D = $500. L'ICM mostrerà che nessuno di questi è valido.

Step 1 — P(1st) è solo la chip share

Direttamente dall'assioma, e somma esattamente a 1:

P(A 1st) = 5000/10000 = 0.5000
P(B 1st) = 3000/10000 = 0.3000
P(C 1st) = 1500/10000 = 0.1500
P(D 1st) = 500/10000 = 0.0500

(0.5000 + 0.3000 + 0.1500 + 0.0500 = 1.0000.) ✓

Step 2 — Un ramo calcolato di P(2nd)

Calcoliamo a mano P(D finishes 2nd), sommando chi potrebbe finire primo:

A 1° (prob 0.5), poi D vince il resto: la quota di D di $T - 5000 = 5000$ è $500/5000 = 0.1$. Contributo: 0.5 × 0.1 = 0.05000
B 1° (prob 0.3), poi la quota di D di $10000 - 3000 = 7000$ è $500/7000 \approx 0.0714$. Contributo: 0.3 × 0.0714 = 0.02143
C 1° (prob 0.15), poi la quota di D di $10000 - 1500 = 8500$ è $500/8500 \approx 0.0588$. Contributo: 0.15 × 0.0588 = 0.00882

Somma: 0.05000 + 0.02143 + 0.00882 = 0.08025. Quindi D, che detiene il 5% delle chips, finisce secondo circa l'8% delle volte. La stessa ricorsione applicata a ogni giocatore (qui calcolata per enumerazione completa di tutti i 24 ordinamenti) fornisce la distribuzione completa delle posizioni finali qui sotto. La colonna del 1° posto è esatta per assioma; le colonne del 2°/3°/4° posto sono la corretta ricorsione Malmuth-Harville, arrotondate:

| Player | P(1st) | P(2nd) | P(3rd) | P(4th) | |---|---|---|---|---| | A | 0.5000 | 0.3288 | 0.1456 | 0.0255 | | B | 0.3000 | 0.3687 | 0.2613 | 0.0699 | | C | 0.1500 | 0.2222 | 0.4197 | 0.2081 | | D | 0.0500 | 0.0803 | 0.1733 | 0.6965 |

Ogni riga somma a 1.0, e ogni colonna somma a 1.0 — entrambi sono controlli di coerenza che il modello deve superare. Nota come lo short stack D è estremamente probabile che busti per primo (69,65%) ma non è più garantito che lo faccia: la sopravvivenza è probabilistica fino alla fine.

Step 3 — Convertire in dollari

Esegui il prodotto scalare della finish distribution di ogni giocatore con il vettore di payout [5000, 3000, 1500, 500]:

| Player | Chip share | "Chip-equity" $ (lineare) | ICM $EV | Delta vs chips | |---|---|---|---|---| | A | 50% | $5,000 | $3,717.74 | −$1,282.26 | | B | 30% | $3,000 | $3,033.17 | +$33.17 | | C | 15% | $1,500 | $2,150.19 | +$650.19 | | D | 5% | $500 | $1,098.89 | +$598.89 | | Total | 100% | $10,000 | $10,000.00 | 0 |

I dollari tornano a sommare all'intero prize pool di $10.000 — l'equity è conservata, mai creata né distrutta. Questo è il punto cruciale dell'intero modello, espresso in numeri chiari:

Il chip leader A vale $3.718, non $5.000. Detenendo metà delle chips, A cattura solo il 37% del prize pool in aspettativa. Circa $1.282 di "valore in chips" sono stati persi a favore degli stack più piccoli.
Lo short stack D vale $1.099, non $500 — più del doppio della sua chip share. Con il 5% delle chips, D comanda quasi l'11% del denaro.

Questa non è una stranezza di questi particolari stack; è strutturale. La concavità della scala di payout più il fatto che anche uno stack di 1 chip è garantito alcune posizioni finali significa che gli short stack sono sistematicamente sopravvalutati in dollari rispetto alle chips, e i big stack sistematicamente sottovalutati. Tutti sono "spinti verso il centro" della scala di pagamento.

Perché questo cambia il tuo modo di giocare

La conseguenza pratica si riassume in una frase: risk premium. Poiché le tue ultime chips perse valgono di più (in $) delle tue prossime chips vinte, l'equity di breakeven per uno stack-off sale al di sopra del breakeven naive in chip-EV. Una situazione che è un chiaro call in chip-EV può essere un chiaro fold in ICM.

Esamina la situazione del leader A attraverso la lente di cui sopra: A che rischia chips contro uno stack medio sta scommettendo dollari a un tasso di cambio sfavorevole — A paga il costo marginale pieno in chips sulle perdite ma incassa un valore marginale in chips scontato sulle vittorie, perché raddoppiare non raddoppia i soldi di A (A è già vicino alla cima della curva). Lo short stack D, al contrario, ha un risk premium basso contro gli stack più grandi: le chips di D sono economiche da rischiare perché lo svantaggio di D è piccolo e ben compensato dall'equity di scalata. Questa è la spina dorsale matematica di "i big stack dovrebbero bullare, ma non contro l'altro big stack" e "la pressione dell'ICM colpisce più duramente gli stack medi" — gli stack medi hanno la maggiore ladder equity da perdere e la minore da guadagnare.

Non devi stimare a occhio questo. Inserisci gli stack e i payout nel Calcolatore ICM di shadepoker, leggi l'$EV di ogni posto, e il risk premium per qualsiasi confronto dato deriva dal confronto dell'equity in dollari prima/dopo aver vinto o bustato. Quell'oscillazione in dollari prima-vs-dopo — non l'oscillazione in chips — è il numero rispetto al quale la tua decisione al river dovrebbe essere prezzata.

Malmuth-Harville vs Malmuth-Weitzman

Malmuth-Harville è il default in praticamente ogni strumento ICM commerciale, ma non è l'unico modello di ordine di arrivo. Malmuth-Weitzman risponde alla stessa domanda — dati i chip counts, qual è la finish distribution — con una diversa regola di condizionamento.

La distinzione è nel modo in cui vengono derivati i posti inferiori. Harville costruisce la distribuzione in avanti: stabilisce chi finisce primo (probabilità = chip share), lo rimuove, ricorre sui sopravvissuti. Weitzman invece ragiona dal basso verso l'alto — modellando la probabilità di finire ultimo come inversamente correlata allo stack di chips, quindi ricorrendo verso l'alto attraverso l'ordine di eliminazione. I due modelli concordano esattamente su P(1st) e sul caso a due giocatori, ma assegnano probabilità leggermente diverse alle posizioni finali intermedie in campi più grandi, e quindi equity in dollari leggermente diverse.

Qual è quello "giusto"? Nessuno dei due è empiricamente perfetto — entrambi sono semplificazioni di un processo di eliminazione reale che dipende da blinds, position e skill. Harville ha vinto il concorso di popolarità perché la sua ricorsione in avanti è intuitiva, veloce e si adatta abbastanza bene ai dati osservati dei tournament. Weitzman tende ad essere marginalmente più pessimista per i big stack e marginalmente più benevolo per gli short stack rispetto a Harville. Il disaccordo è reale ma di solito piccolo rispetto all'errore di modellazione che entrambi condividono rispetto alla realtà. Per scopi pratici: sappi che "ICM" quasi sempre significa Malmuth-Harville, sappi che Weitzman esiste come un'alternativa basata su principi, e non agonizzare sulle differenze di secondo decimale tra loro — sono eclissate dalle ipotesi che entrambi fanno.

Oltre l'ICM statico: Future Game Simulation

Ecco l'onesta limitazione. L'ICM statico assume che il tournament si risolva senza ulteriori giocate — come se la finish distribution si cristallizzasse nell'istante in cui si congelano gli stack. Incorpora due finzioni:

Nessuna mano futura. I blinds non salgono, gli antes non drenano gli stack, nessuno open-shova contro nessuno. Le chips sono trattate come una lotteria fissa.
Nessuna skill. Ogni giocatore è identico. Un reg di classe mondiale e un giocatore ricreativo con lo stesso stack ottengono la stessa equity. La position rispetto al button — un enorme vantaggio per lo short stack — è invisibile al modello.

Queste finzioni contano di più quando c'è molta future play rimasta: stack più profondi, big blinds relative agli stack e un button che farà diversi giri prima che qualcuno busti. L'ICM statico valuta sistematicamente in modo errato queste situazioni perché ignora i vantaggi posizionali e di iniziativa che si accumulano nel prossimo orbit.

Future Game Simulation (FGS) è l'affinamento. Invece di congelare gli stack, FGS simula le prossime k mani di gioco — tipicamente un piccolo anticipo come una a quattro mani — usando una strategia semplificata (spesso un push/fold o un modello derivato dal solver) per come i blinds saranno contesi, e solo allora applica l'ICM statico alla distribuzione risultante degli stack. In effetti, FGS permette alle chips di "giocare in avanti" un po' prima di convertirle in dollari, catturando il valore della position e il costo di essere presto ai blinds.

Il vantaggio: FGS ricompensa l'avere position su uno short stack, penalizza l'essere sul punto di postare i big blinds con una mano marginale e generalmente riduce alcune delle fold più dure dell'ICM statico in situazioni in cui potrai usare la tua skill e position prima che qualcuno venga eliminato. Il costo è la complessità di calcolo e di modellazione — la simulazione è buona solo quanto la strategia che si assume per quelle mani future, e lo spazio degli stati esplode rapidamente con la profondità dell'anticipo, motivo per cui le profondità di FGS sono mantenute superficiali. Pensa a FGS come l'ICM statico più un breve, basato su principi, sguardo al prossimo orbit. Per le decisioni al tavolo finale e alla bubble dove il gioco futuro è limitato, l'ICM statico Malmuth-Harville è già eccellente; per le situazioni di pay-jump a metà stadio più profonde, FGS lo corregge in modo significativo.

Il messaggio chiave

L'ICM non è un'impressione. È un algoritmo concreto: P(1st) è uguale alla chip share, i posti inferiori seguono rimuovendo i classificati superiori e ricorrendo, e la tua dollar equity è la finish distribution moltiplicata per la ladder di payout. Eseguilo su qualsiasi situazione a quattro mani e la stessa verità strutturale appare ogni volta — il chip leader vale meno del suo stack, lo short stack vale di più, e gli stack medi sono quelli che il modello stringe di più.

I giocatori che internalizzano questo non si limitano a "giocare tight sulla bubble". Essi prezzano ogni all-in contro l'oscillazione in dollari piuttosto che l'oscillazione in chips, sanno quando il loro risk premium li libera di giocare d'azzardo e quando li lega, e capiscono esattamente quali ipotesi del modello stanno per non funzionare — che è il momento di appoggiarsi a FGS o al puro giudizio. Quel divario, tra trattare le chips come denaro e conoscere il tasso di cambio preciso, è il divario tra il min-cash e il punteggio del tavolo finale. Inserisci una situazione reale nel ICM calculator di shadepoker, leggi le dollar equities e inizia a rendere la conversione una seconda natura.