L'ICM depuis les principes fondamentaux : Comment Malmuth-Harville transforme les Chips en Dollars

Les Chips à une table finale ne sont pas de l'argent – ce sont des tickets de loterie à rendement décroissant. Voici l'algorithme exact qui convertit un Stack en valeur monétaire, dérivé de zéro et illustré avec des chiffres réels.

Chaque Tournament Player a entendu le slogan : « tes Chips ne valent pas leur valeur faciale. » Il est répété aux Final Tables comme une écriture sainte, généralement juste avant que quelqu'un ne fasse un mauvais call et blâme la variance. Mais le slogan n'est pas du folklore – c'est un théorème. Il existe un algorithme exact et calculable qui prend un vecteur de Stacks et une Payout Structure et renvoie une valeur en dollars pour chaque siège. Cet algorithme est l'Independent Chip Model, et sa version la plus utilisée est Malmuth-Harville.

Si tu comprends l'ICM comme une boîte noire – « le Calculator dit fold » – tu feras les bons choix sur les Spots faciles et les mauvais sur les difficiles. Si tu le comprends comme un algorithme, tu peux le reconstruire à la table, anticiper quand il échoue, et savoir exactement pourquoi le Chip Leader à une table finale est plus pauvre que son Stack ne le suggère, tandis que le Short Stack est plus riche que le sien. Cet article dérive le modèle de manière claire, présente un exemple concret à quatre joueurs avec des chiffres explicites, contraste Malmuth-Harville avec son cousin moins connu Malmuth-Weitzman, et montre ensuite où l'ICM statique se termine et où la Future Game Simulation commence.

Le Problème Fondamental : Les Chips ne sont pas linéaires par rapport à l'argent

Dans un Cash Game, un Chip est un dollar. Le Stack EV et le Money EV sont le même objet, c'est pourquoi la stratégie de Cash Game se réduit à maximiser les Chips gagnés par main. Les Tournaments rompent ce lien. Tu ne peux pas cash out des Chips ; tu ne peux convertir ta Finishing Position qu'en un payout. Et la Payout Structure est concave – le premier paie beaucoup moins que la valeur proportionnelle de tous les Chips en jeu.

Concrètement : dans une structure typique, la première place pourrait représenter 50 % du Prize Pool tout en détenant 100 % des Chips à la fin. Ces 50 points de pourcentage d'Equity « manquante » n'ont pas disparu – ils ont été distribués à tous les autres en cours de route, proportionnellement à leurs chances de dépasser les autres joueurs. Le travail de l'ICM est de déterminer comment répartir un Prize Pool fixe entre les joueurs restants en se basant uniquement sur leurs Chip Counts actuels.

Le mot « Independent » dans le nom signale l'hypothèse simplificatrice centrale : l'ICM traite les Finishing Probabilities comme si elles ne dépendaient que des Chip Counts, ignorant la Position, le Skill, le Blind Level et le jeu futur. Cette hypothèse est fausse dans le détail et utile dans l'ensemble – nous y reviendrons lorsque nous aborderons la FGS.

Le modèle Malmuth-Harville

Malmuth-Harville repose sur un axiome unique et clair :

La probabilité qu'un joueur donné termine premier est égale à sa part du total des Chips en jeu.

Si le joueur i détient le Stack $s_i$ et que le total des Chips en jeu est $T$, alors :

\[P(i \text{ finishes 1st}) = \dfrac{s_i}{T}\]

C'est le moteur principal. Tout le reste n'est que de la comptabilité.

La partie élégante est la façon dont il gère les Finishing Positions inférieures. Une fois que tu as fixé qui termine premier, ce joueur et ses Chips sont retirés de la considération, et tu poses la même question au reste du champ avec les Chips restants. La probabilité que le joueur j termine deuxième est la probabilité que quelqu'un d'autre termine premier, multipliée par la probabilité que j « gagne » le sous-tournoi parmi les survivants.

Formellement, la probabilité que j termine deuxième est une somme sur chaque possible vainqueur de la première place k (avec k ≠ j) :

\[P(j \text{ is 2nd}) = \sum_{k \neq j} P(k \text{ is 1st}) \cdot \dfrac{s_j}{T - s_k}\]

Lis attentivement. Sous condition que k termine premier, les Chips de k quittent le Pool, le nouveau total est $T - s_k$, et au sein de ce champ réduit, le joueur j termine « premier » (c'est-à-dire deuxième au classement général) avec une probabilité $s_j / (T - s_k)$. En additionnant toutes les façons dont la première place pourrait être occupée, tu obtiens la probabilité exacte de la deuxième place de j.

La troisième place récursive un niveau plus profond : somme sur toutes les paires ordonnées de (1er, 2ème) finishers, retire les deux Stacks, et calcule la part de j des Chips restantes. En général, tu énumères les orders de finish, tu pondères chaque order par sa probabilité Malmuth-Harville, et tu accumules. Pour n joueurs restants, il y a n! orderings – trivial pour une table finale de neuf joueurs (362 880 orderings, millisecondes de calcul), c'est pourquoi l'ICM à une vraie table finale est exact, et non approximatif.

Ton Dollar Equity

Une fois que tu as la finish distribution complète – pour chaque joueur, la probabilité de terminer 1er, 2ème, 3ème, … – la conversion en argent est un produit scalaire. Soit $\text{pay}[r]$ le payout pour avoir terminé en Position r. Alors :

\[\text{EV}(i) = \sum_r P(i \text{ finishes in position } r) \cdot \text{pay}[r]\]

Cette seule ligne est le résultat phare du modèle : ton Tournament Equity en dollars est la somme, sur chaque Finishing Position, de la probabilité que tu y arrives multipliée par ce que cette Position paie. L'ICM n'est rien de plus qu'une manière structurée de calculer ces probabilités.

Un exemple concret à quatre joueurs restants

La théorie s'assimile mieux par les chiffres. Il reste quatre joueurs. Stacks et un Prize Pool de 10 000 $ payé 50 / 30 / 15 / 5 :

| Joueur | Stack | Part de Chips | Payout pour cette position | |---|---|---|---| | A | 5 000 | 50% | 1er = 5 000 $ | | B | 3 000 | 30% | 2ème = 3 000 $ | | C | 1 500 | 15% | 3ème = 1 500 $ | | D | 500 | 5% | 4ème = 500 $ | | Total | 10 000 | 100% | Pool = 10 000 $ |

Note le piège délibéré intégré à cette configuration : les Payouts (50/30/15/5) reflètent exactement les Parts de Chips (50/30/15/5). Si les Chips étaient linéaires par rapport à l'argent, le $EV de chaque joueur serait égal à ses dollars de part de Chips : A = 5 000 $, B = 3 000 $, C = 1 500 $, D = 500 $. L'ICM montrera qu'aucun de ces chiffres ne tient.

Étape 1 — P(1er) est simplement la part de Chips

Directement de l'axiome, et cela s'additionne exactement à 1 :

P(A 1er) = 5000/10000 = 0.5000
P(B 1er) = 3000/10000 = 0.3000
P(C 1er) = 1500/10000 = 0.1500
P(D 1er) = 500/10000 = 0.0500

(0.5000 + 0.3000 + 0.1500 + 0.0500 = 1.0000.) ✓

Étape 2 — Une branche calculée de P(2ème)

Calculons P(D termine 2ème) à la main, en sommant sur tous les possibles vainqueurs de la première place :

A 1er (prob 0,5), puis D gagne le reste : la part de D de $T - 5000 = 5000$ est $500/5000 = 0,1$. Contribution : 0,5 × 0,1 = 0.05000
B 1er (prob 0,3), puis la part de D de $10000 - 3000 = 7000$ est $500/7000 \approx 0,0714$. Contribution : 0,3 × 0,0714 = 0.02143
C 1er (prob 0,15), puis la part de D de $10000 - 1500 = 8500$ est $500/8500 \approx 0,0588$. Contribution : 0,15 × 0,0588 = 0.00882

Somme : 0.05000 + 0.02143 + 0.00882 = 0.08025. Donc D, détenant 5 % des Chips, termine deuxième environ 8 % du temps. La même récursion appliquée à chaque joueur (ici calculée par énumération complète des 24 orderings) donne la finish distribution complète ci-dessous. La colonne de la 1ère place est exacte par axiome ; les colonnes des 2ème/3ème/4ème places sont la récursion correcte de Malmuth-Harville, arrondie :

| Joueur | P(1er) | P(2ème) | P(3ème) | P(4ème) | |---|---|---|---|---| | A | 0.5000 | 0.3288 | 0.1456 | 0.0255 | | B | 0.3000 | 0.3687 | 0.2613 | 0.0699 | | C | 0.1500 | 0.2222 | 0.4197 | 0.2081 | | D | 0.0500 | 0.0803 | 0.1733 | 0.6965 |

Chaque ligne s'additionne à 1.0, et chaque colonne s'additionne à 1.0 – ce sont deux vérifications de cohérence que le modèle doit passer. Remarque comment le Short Stack D est massivement susceptible de bust en premier (69,65 %) mais n'est plus garanti de le faire : la survie est probabiliste jusqu'au bout.

Étape 3 — Convertir en dollars

Applique le produit scalaire entre la finish distribution de chaque joueur et le vecteur de Payout [5000, 3000, 1500, 500] :

| Joueur | Part de Chips | « Chip-Equity » $ (linéaire) | ICM $EV | Différence vs Chips | |---|---|---|---|---| | A | 50% | 5 000 $ | 3 717,74 $ | −1 282,26 $ | | B | 30% | 3 000 $ | 3 033,17 $ | +33,17 $ | | C | 15% | 1 500 $ | 2 150,19 $ | +650,19 $ | | D | 5% | 500 $ | 1 098,89 $ | +598,89 $ | | Total | 100% | 10 000 $ | 10 000,00 $ | 0 |

Les dollars s'additionnent pour revenir au Prize Pool total de 10 000 $ – l'Equity est conservée, jamais créée ni détruite. C'est le nœud de tout le modèle, présenté en chiffres clairs :

Le Chip Leader A vaut 3 718 $, pas 5 000 $. Détenant la moitié des Chips, A ne capture en espérance que 37 % du Prize Pool. Environ 1 282 $ de « valeur de Chips » se sont échappés vers les Stacks plus petits.
Le Short Stack D vaut 1 099 $, pas 500 $ – plus du double de sa part de Chips. Avec 5 % des Chips, D commande près de 11 % de l'argent.

Ce n'est pas une particularité de ces Stacks spécifiques ; c'est structurel. La concavité de l'échelle des Payouts, plus le fait que même un Stack de 1 Chip est garanti une Finishing Position, signifie que les Short Stacks sont systématiquement surévalués en dollars par rapport aux Chips, et les Big Stacks systématiquement sous-évalués. Tout le monde est « tiré vers le milieu » de l'échelle des Payouts.

Pourquoi cela change ta façon de jouer

La conséquence pratique tient en une phrase : la risk premium. Parce que tes derniers Chips perdus valent plus (en $) que tes prochains Chips gagnés, l'Equity de breakeven pour un Stack-off s'élève au-dessus du breakeven naïf du Chip-EV. Un Spot qui est un Call clair en Chip-EV peut être un fold clair en ICM.

Examine la situation du Leader A à travers la lentille ci-dessus : A risquant des Chips contre un Medium Stack mise des dollars à un taux de change défavorable – A paie le coût marginal complet des Chips sur les pertes mais perçoit une valeur marginale de Chips réduite sur les gains, car un Double Up ne double pas l'argent de A (A est déjà proche du sommet de la courbe). Le Short Stack D, en revanche, a une faible risk premium contre les Stacks plus importants : les Chips de D sont peu coûteux à risquer car le Downside de D est faible et bien compensé par l'Equity de laddering. C'est l'épine dorsale mathématique de « les Big Stacks devraient bullyer, mais pas contre l'autre Big Stack » et « la ICM Pressure écrase le plus durement les Medium Stacks » – les Medium Stacks ont le plus d'Equity de laddering à perdre et le moins à gagner.

Tu n'as pas besoin de l'évaluer à l'œil. Entre les Stacks et les Payouts dans le shadepoker's Calculateur ICM, lis le $EV de chaque siège, et la risk premium pour toute confrontation donnée ressort de la comparaison de l'Equity en dollars avant/après la victoire versus le Busting. Ce swing de dollars avant/après – et non le swing de Chips – est le chiffre par rapport auquel ta décision à la River devrait être évaluée.

Malmuth-Harville vs Malmuth-Weitzman

Malmuth-Harville est la valeur par défaut dans pratiquement tous les outils ICM commerciaux, mais ce n'est pas le seul modèle d'ordre de finish. Malmuth-Weitzman répond à la même question – étant donné les Chip Counts, quelle est la finish distribution – avec une règle de conditionnement différente.

La distinction réside dans la manière dont les places inférieures sont dérivées. Harville construit la distribution vers l'avant : fixe qui termine premier (probabilité = part de Chips), les retire, et récurse sur les survivants. Weitzman, au lieu de cela, raisonne de bas en haut – modélisant la probabilité de terminer dernier comme inversement liée au Chip Stack, puis récurse vers le haut à travers l'ordre d'élimination. Les deux modèles s'accordent exactement sur P(1er) et sur le cas à deux joueurs, mais ils assignent des probabilités légèrement différentes aux Finishing Positions intermédiaires dans des champs plus grands, et donc des Dollar Equities légèrement différentes.

Lequel est « correct » ? Aucun n'est empiriquement parfait – les deux sont des simplifications d'un processus d'élimination réel qui dépend des Blinds, de la Position et du Skill. Harville a gagné le concours de popularité car sa récursion vers l'avant est intuitive, rapide et correspond de manière acceptable aux données de Tournaments observées. Weitzman tend à être marginalement plus pessimiste pour les Big Stacks et marginalement plus indulgent envers les Short Stacks que Harville. Le désaccord est réel mais généralement faible par rapport à l'erreur de modélisation que les deux partagent par rapport à la réalité. À des fins pratiques : sache que « ICM » signifie presque toujours Malmuth-Harville, sache que Weitzman existe comme une alternative de principe, et ne t'inquiète pas des différences à la deuxième décimale entre eux – elles sont éclipsées par les hypothèses que les deux font.

Au-delà de l'ICM Statique : La Future Game Simulation

Voici la limitation honnête. L'ICM statique suppose que le Tournament se résout sans plus de jeu – comme si la finish distribution se cristallise à l'instant où tu figes les Stacks. Il intègre deux fictions :

Pas de mains futures. Les Blinds n'augmentent pas, les Antes ne drainent pas les Stacks, personne ne fait de open-shove sur personne. Les Chips sont traitées comme une loterie fixe.
Pas de Skill. Chaque joueur est identique. Un Reg de classe mondiale et un joueur récréatif avec le même Stack obtiennent la même Equity. La Position par rapport au Button – un avantage massif pour les Short Stacks – est invisible pour le modèle.

Ces fictions importent le plus lorsqu'il reste beaucoup de jeu futur : des Stacks plus profonds, des Big Blinds par rapport aux Stacks, et un Button qui fera plusieurs fois le tour avant que quelqu'un ne bust. L'ICM statique sous-estime systématiquement ces Spots car il ignore les avantages positionnels et d'initiative qui s'accumulent au cours de l'orbite suivante.

La Future Game Simulation (FGS) est le raffinement. Au lieu de figer les Stacks, la FGS simule les k prochaines mains de jeu – typiquement une petite anticipation de une à quatre mains – en utilisant une stratégie simplifiée (souvent un modèle push/fold ou dérivé d'un Solver) pour savoir comment les Blinds seront contestées, et seulement ensuite applique l'ICM statique à la distribution de Stacks résultante. En effet, la FGS permet aux Chips de « jouer en avant » un peu avant de les convertir en dollars, capturant la valeur de la Position et le coût de devoir bientôt poster les Blinds.

Le bénéfice : la FGS récompense la Position sur un Short Stack, pénalise le fait d'être sur le point de poster de grosses Blinds avec un Holding marginal, et réduit généralement certains des folds les plus sévères de l'ICM statique dans les Spots où tu pourras utiliser ton Skill et ta Position avant que quiconque ne soit éliminé. Le coût est en calcul et en complexité de modélisation – la simulation n'est aussi bonne que la stratégie que tu supposes pour ces mains futures, et l'espace d'état explose rapidement avec la profondeur d'anticipation, c'est pourquoi les profondeurs de FGS sont maintenues faibles. Pense à la FGS comme à l'ICM statique plus un bref aperçu basé sur des principes de la prochaine orbite. Pour les décisions en Final Table et à la Bubble où le jeu futur est mince, l'ICM statique Malmuth-Harville est déjà excellent ; pour les Spots plus profonds en milieu de partie avec des Pay Jumps, la FGS le corrige significativement.

Ce qu'il faut retenir

L'ICM n'est pas une intuition. C'est un algorithme concret : P(1er) est égal à la part de Chips, les places inférieures suivent en retirant les finishers supérieurs et en récursant, et ton Dollar Equity est la finish distribution multipliée par l'échelle des Payouts. Applique-le à n'importe quel Spot à quatre joueurs et la même vérité structurelle apparaît à chaque fois – le Chip Leader vaut moins que son Stack, le Short Stack vaut plus, et les Medium Stacks sont ceux que le modèle met le plus sous pression.

Les joueurs qui internalisent cela ne se contentent pas de « jouer tight à la Bubble ». Ils évaluent chaque All-in en fonction du swing en dollars plutôt que du swing en Chips, ils savent quand leur risk premium les libère pour gamble et quand elle les entrave, et ils comprennent exactement quelles hypothèses du modèle sont sur le point de rompre – ce qui est le moment de s'appuyer sur la FGS ou un jugement pur à la place. Cet écart, entre traiter les Chips comme de l'argent et connaître le taux de change précis, est l'écart entre le Min-Cashing et un score de Final Table. Connecte un Spot réel au shadepoker's ICM calculator, lis les Dollar Equities, et commence à faire de cette conversion une seconde nature.