ICM第一原理：Malmuth-Harville如何将筹码转化为金钱

决赛桌上的筹码不是钱——它们是回报递减的彩票。这里是精确的算法，可以将一个Stack转换为美元价值，从零开始推导并用实际数字进行演算。

每个锦标赛玩家都听过这句口号：“你的筹码不值其面值。”这在决赛桌上被反复提及，就像圣经一样，通常是在有人做了一个错误的call并归咎于方差之前。但这个口号并非民间传说——它是一个定理。存在一个精确、可计算的算法，它接收一个Stack向量和Payout结构，并为每个座位返回一个美元数值。这个算法就是Independent Chip Model，其中最广泛使用的版本是Malmuth-Harville。

如果你将ICM理解为一个黑盒——“计算器说fold”——那么你会在简单的情况下做对，在困难的情况下做错。如果你将其理解为一个算法，你就能在牌桌上重构它，预判它何时失效，并确切地知道为什么决赛桌上的chip leader比其Stack看起来要穷，而short stack则比其Stack看起来要富有。本文清晰地推导出该模型，通过具体数字阐述了一个四人桌的例子，将Malmuth-Harville与其鲜为人知的“表亲”Malmuth-Weitzman进行对比，然后展示了静态ICM的终点和Future Game Simulation的起点。

核心问题：筹码与金钱并非线性关系

在cash game中，一个筹码就是一美元。Stack EV和money EV是同一个概念，这就是为什么cash game策略可以简化为最大化每手牌赢得的筹码。锦标赛则切断了这种联系。你不能将筹码兑现；你只能将你的最终名次转换为Payout。而且Payout结构是凹形的——第一名支付的远少于场上所有筹码的按比例价值。

具体来说：在典型的结构中，第一名可能获得奖池的50%，而最终却拥有100%的筹码。那50个百分点的“缺失”Equity并没有消失——它们是按照其他玩家淘汰其他玩家的机会比例，沿途分配给每个人的。ICM的全部工作就是根据剩余玩家当前的chip counts，确定如何在一个固定的奖池中进行分配。

名称中的“Independent”（独立）一词标示了其核心简化假设：ICM将完成名次的可能性视为仅取决于chip counts，而忽略了position、skill、blind level和future play。这个假设在细节上是错误的，但在总体上是有用的——当我们讨论FGS时会详细说明。

Malmuth-Harville模型

Malmuth-Harville基于一个单一、清晰的公理：

给定玩家获得第一名的概率等于其在总筹码中所占的份额。

如果玩家i持有Stack $s_i$，并且场上总筹码为$T$，那么：

\[P(i \text{ finishes 1st}) = \dfrac{s_i}{T}\]

这就是整个引擎。其他一切都只是记账。

其精妙之处在于它如何处理较低的完成名次。一旦你确定了谁获得第一名，该玩家及其筹码将被排除在外，然后你对剩余玩家和剩余筹码提出同样的问题。玩家j获得第二名的概率是其他人获得第一名的概率，乘以j在幸存者之间的“子锦标赛”中“获胜”的概率。

形式上，j获得第二名的概率是对所有可能的第一个出局者k（其中k ≠ j）求和：

\[P(j \text{ is 2nd}) = \sum_{k \neq j} P(k \text{ is 1st}) \cdot \dfrac{s_j}{T - s_k}\]

仔细阅读。在k获得第一名的条件下，k的筹码离开池，新的总额为$T - s_k$，并且在该减少的范围内，玩家j以概率$s_j / (T - s_k)$获得“第一名”（即总排名第二）。将第一名可能被填补的所有方式相加，你就得到了j获得第二名的精确概率。

第三名则递归更深一层：对所有有序的（第一名，第二名）完成者对求和，移除两个Stack，并计算j在剩余筹码中所占的份额。一般来说，你列举出所有完成顺序，用其Malmuth-Harville概率加权每个顺序，然后累加。对于剩余的n名玩家，有n!种排序——对于九人决赛桌来说是微不足道的（362,880种排序，几毫秒的计算），这就是为什么真实决赛桌上的ICM是精确的，而不是近似的。

你的美元Equity

一旦你有了完整的完成名次分布——即每个玩家获得第一名、第二名、第三名……的概率——将其转换为金钱就是点积。设$\text{pay}[r]$为获得r名次的Payout。那么：

\[\text{EV}(i) = \sum_r P(i \text{ finishes in position } r) \cdot \text{pay}[r]\]

这一行是该模型最重要的结果：你在锦标赛中的美元Equity，是你在每个完成名次落位的概率乘以该名次所支付的奖金的总和。ICM不过是一种计算这些概率的原则性方法。

一个具体的四人桌例子

理论通过数字更容易理解。剩余四名玩家。Stacks和总奖池10,000美元，按50 / 30 / 15 / 5支付：

| 玩家 | Stack | 筹码份额 | 该名次的Payout | |---|---|---|---| | A | 5,000 | 50% | 1st = $5,000 | | B | 3,000 | 30% | 2nd = $3,000 | | C | 1,500 | 15% | 3rd = $1,500 | | D | 500 | 5% | 4th = $500 | | Total | 10,000 | 100% | Pool = $10,000 |

请注意此设置中故意埋藏的陷阱：Payouts（50/30/15/5）完全镜像了筹码份额（50/30/15/5）。如果筹码与金钱是线性关系，那么每个玩家的$EV将等于他们筹码份额的美元价值：A = $5,000，B = $3,000，C = $1,500，D = $500。ICM将表明这些都不成立。

步骤1 — P(1st)即筹码份额

直接根据公理，且总和恰好为1：

P(A 1st) = 5000/10000 = 0.5000
P(B 1st) = 3000/10000 = 0.3000
P(C 1st) = 1500/10000 = 0.1500
P(D 1st) = 500/10000 = 0.0500

(0.5000 + 0.3000 + 0.1500 + 0.0500 = 1.0000.) ✓

步骤2 — P(2nd)的一个计算分支

让我们手动计算P(D获得2nd)，对可能获得第一名的玩家进行求和：

A 1st (概率0.5)，然后D赢得剩余部分：D在$T - 5000 = 5000$中的份额是$500/5000 = 0.1$。贡献：0.5 × 0.1 = 0.05000
B 1st (概率0.3)，然后D在$10000 - 3000 = 7000$中的份额是$500/7000 \approx 0.0714$。贡献：0.3 × 0.0714 = 0.02143
C 1st (概率0.15)，然后D在$10000 - 1500 = 8500$中的份额是$500/8500 \approx 0.0588$。贡献：0.15 × 0.0588 = 0.00882

总和：0.05000 + 0.02143 + 0.00882 = 0.08025。因此，D持有5%的筹码，大约有8%的时间获得第二名。将相同的递归应用于每个玩家（此处通过完全枚举所有24种排序计算），得到完整的完成名次分布如下。第一名一列根据公理是精确的；第二/第三/第四名列是正确的Malmuth-Harville递归结果，经过四舍五入：

| 玩家 | P(1st) | P(2nd) | P(3rd) | P(4th) | |---|---|---|---|---| | A | 0.5000 | 0.3288 | 0.1456 | 0.0255 | | B | 0.3000 | 0.3687 | 0.2613 | 0.0699 | | C | 0.1500 | 0.2222 | 0.4197 | 0.2081 | | D | 0.0500 | 0.0803 | 0.1733 | 0.6965 |

每行总和为1.0，每列总和也为1.0——两者都是模型必须通过的健全性检查。请注意，short stack D绝大多数情况下会第一个出局（69.65%），但不再是必然的：生存自始至终都是概率性的。

步骤3 — 转换为美元

将每个玩家的完成名次分布与Payout向量[5000, 3000, 1500, 500]进行点积：

| 玩家 | 筹码份额 | “筹码Equity”美元 (线性) | ICM $EV | 与筹码的差额 | |---|---|---|---|---| | A | 50% | $5,000 | $3,717.74 | −$1,282.26 | | B | 30% | $3,000 | $3,033.17 | +$33.17 | | C | 15% | $1,500 | $2,150.19 | +$650.19 | | D | 5% | $500 | $1,098.89 | +$598.89 | | Total | 100% | $10,000 | $10,000.00 | 0 |

美元总额回到了完整的10,000美元奖池——Equity是守恒的，既不产生也不消亡。这就是整个模型的关键所在，以简单的数字呈现出来：

Chip leader A的价值是$3,718，而不是$5,000。持有半数筹码，A预期只能获得奖池的37%。大约有$1,282的“筹码价值”已经流向了较小的Stack。
Short stack D的价值是$1,099，而不是$500——超过其筹码份额的两倍。凭借5%的筹码，D几乎掌握了11%的奖金。

这并非这些特定Stack的怪癖；它是结构性的。Payout阶梯的凹性，加上即使是1个筹码的Stack也保证了某个完成名次，这意味着short stacks在美元价值上相对于筹码而言系统性地被高估，而big stacks则系统性地被低估。每个人都被“拉向”薪资等级的中间。

这如何改变你的打法

实际影响体现在一个短语中：risk premium（风险溢价）。因为你失去的最后几个筹码（以美元计）比你赢得的接下来几个筹码价值更高，所以All-in的盈亏平衡Equity会高于天真的chip-EV盈亏平衡。一个明显的chip-EV call牌局，在ICM下可能是明显的fold。

从上述角度来看待leader A的情况：A冒着筹码对抗中等Stack，是在以不利的汇率下注美元——A在损失时支付全部边际筹码成本，但在获胜时却只能获得打折的边际筹码价值，因为Stack翻倍并不会使A的金钱翻倍（A已经接近曲线顶部）。相比之下，short stack D对抗更大的Stack时具有较低的risk premium：D的筹码风险成本低，因为D的下行空间小，且通过laddering equity得到了很好的补偿。这就是“big stacks应该欺负人，但不要欺负其他big stack”以及“ICM压力对中等Stack打击最大”的数学基础——中等Stack拥有的ladder equity最多，但也最容易失去，而所得最少。

你不需要靠肉眼判断。将Stack和Payouts输入shadepoker的ICM 计算器，读出每个座位的$EV，任何给定对抗的risk premium都将通过比较获胜与出局前后的美元Equity而得出。这种前后美元波动——而非筹码波动——才是你河牌决定应该据此定价的数字。

Malmuth-Harville 对比 Malmuth-Weitzman

Malmuth-Harville基本上是所有商业ICM工具的默认模型，但它并非唯一的完成顺序模型。Malmuth-Weitzman以不同的条件规则回答了同样的问题——给定chip counts，完成名次分布是怎样的。

区别在于较低名次的推导方式。Harville是正向构建分布的：确定谁获得第一名（概率=筹码份额），将其移除，然后对幸存者进行递归。而Weitzman则是从下往上推论的——将获得最后一名的概率建模为与chip stack成反比，然后通过淘汰顺序向上递归。这两种模型在P(1st)和两人对局的情况下完全一致，但在更大的牌局中，它们对中间完成名次分配的概率略有不同，因此美元Equity也略有不同。

哪一个“正确”？两者在经验上都不完美——它们都是对依赖于Blinds、position和skill的真实淘汰过程的简化。Harville之所以赢得人气竞赛，是因为其正向递归直观、快速，并且与观察到的锦标赛数据吻合良好。Weitzman对big stacks通常略显悲观，而对short stacks则略显友善。分歧是真实存在的，但相对于两者与现实之间的模型误差而言，通常很小。出于实际目的：要知道“ICM”几乎总是指Malmuth-Harville，要知道Weitzman作为一个有原则的替代方案存在，并且不要为它们之间小数点后两位数的差异而烦恼——这些差异在它们都做出的假设面前显得微不足道。

超越静态ICM：未来游戏模拟 (Future Game Simulation)

这是其诚实的局限性。静态ICM假设锦标赛在没有进一步游戏的情况下解决——就好像你冻结Stack的那一刻，完成名次分布就已确定。它包含两个虚构之处：

没有未来的牌局。Blinds不会上涨，Antes不会耗尽Stack，没有人会open-shoves。筹码被视为固定的彩票。
没有skill。每个玩家都是相同的。世界级的reg和拥有相同Stack的娱乐玩家获得相同的Equity。相对于button的position——一个巨大的short stack优势——对模型来说是不可见的。

当存在大量未来游戏时，这些虚构之处最为重要：更深的Stack，相对于Stack较大的Blinds，以及在有人出局之前Button会轮转几次。静态ICM系统性地错误定价了这些牌局，因为它忽略了下一轮中累积的position和主动权优势。

Future Game Simulation (FGS)是这种改进。FGS不是冻结Stack，而是模拟接下来的k手牌——通常是1到4手牌的短视预判——使用简化的策略（通常是push/fold或solver派生模型）来模拟Blinds的争夺方式，然后才对由此产生的Stack分布应用静态ICM。实际上，FGS让筹码在兑换成美元之前“向前玩”一小段，捕捉了position的价值以及即将处于Blinds的成本。

回报是：FGS奖励对short stack拥有position，惩罚即将用边缘牌型下注big blinds，并且通常会缩小静态ICM在那些你可以在有人被淘汰之前利用自己的skill和position的牌局中一些最严苛的folds。成本是计算和建模的复杂性——模拟的质量取决于你对未来牌局所假设的策略，并且状态空间会随着预判深度的增加而迅速膨胀，这就是FGS深度保持较浅的原因。可以将FGS视为静态ICM加上对下一个轨道进行简短而有原则的预见。对于未来游戏较少的决赛桌和bubble决策，静态Malmuth-Harville已经非常出色；对于更深阶段的pay-jump牌局，FGS能有效地纠正它。

总结

ICM不是一种感觉。它是一个具体的算法：P(1st)等于筹码份额，较低名次通过移除较高名次完成者并递归得出，你的美元Equity是完成名次分布与Payout阶梯的点积。在任何四人牌局中运行它，每次都会出现相同的结构性真相——chip leader的价值低于其Stack，short stack的价值更高，而中等Stack是模型压榨最厉害的。

内化这一点的玩家不只是“在bubble时打得tight”。他们会根据美元波动而非筹码波动来评估每次All-in，他们知道何时他们的risk premium让他们可以大胆冒险，何时又束缚了他们，并且他们确切地理解模型中的哪些假设即将失效——那正是转向FGS或纯粹判断力的时刻。将筹码视为金钱与了解精确汇率之间的这种差距，正是min-cashing和决赛桌得分之间的差距。将一个真实牌局输入shadepoker的ICM calculator，读取美元Equity，并开始让这种转换成为你的第二天性。