ICM第一原理:Malmuth-Harville如何将筹码转化为金钱
决赛桌上的筹码不是钱——它们是回报递减的彩票。这里是精确的算法,可以将一个Stack转换为美元价值,从零开始推导并用实际数字进行演算。
每个锦标赛玩家都听过这句口号:“你的筹码不值其面值。”这在决赛桌上被反复提及,就像圣经一样,通常是在有人做了一个错误的call并归咎于方差之前。但这个口号并非民间传说——它是一个定理。存在一个精确、可计算的算法,它接收一个Stack向量和Payout结构,并为每个座位返回一个美元数值。这个算法就是Independent Chip Model,其中最广泛使用的版本是Malmuth-Harville。
如果你将ICM理解为一个黑盒——“计算器说fold”——那么你会在简单的情况下做对,在困难的情况下做错。如果你将其理解为一个算法,你就能在牌桌上重构它,预判它何时失效,并确切地知道为什么决赛桌上的chip leader比其Stack看起来要穷,而short stack则比其Stack看起来要富有。本文清晰地推导出该模型,通过具体数字阐述了一个四人桌的例子,将Malmuth-Harville与其鲜为人知的“表亲”Malmuth-Weitzman进行对比,然后展示了静态ICM的终点和Future Game Simulation的起点。
核心问题:筹码与金钱并非线性关系
在cash game中,一个筹码就是一美元。Stack EV和money EV是同一个概念,这就是为什么cash game策略可以简化为最大化每手牌赢得的筹码。锦标赛则切断了这种联系。你不能将筹码兑现;你只能将你的最终名次转换为Payout。而且Payout结构是凹形的——第一名支付的远少于场上所有筹码的按比例价值。
具体来说:在典型的结构中,第一名可能获得奖池的50%,而最终却拥有100%的筹码。那50个百分点的“缺失”Equity并没有消失——它们是按照其他玩家淘汰其他玩家的机会比例,沿途分配给每个人的。ICM的全部工作就是根据剩余玩家当前的chip counts,确定如何在一个固定的奖池中进行分配。
名称中的“Independent”(独立)一词标示了其核心简化假设:ICM将完成名次的可能性视为仅取决于chip counts,而忽略了position、skill、blind level和future play。这个假设在细节上是错误的,但在总体上是有用的——当我们讨论FGS时会详细说明。
Malmuth-Harville模型
Malmuth-Harville基于一个单一、清晰的公理:
给定玩家获得第一名的概率等于其在总筹码中所占的份额。
如果玩家i持有Stack \(s_i\),并且场上总筹码为\(T\),那么:
\[P(i \text{ finishes 1st}) = \dfrac{s_i}{T}\]
这就是整个引擎。其他一切都只是记账。
其精妙之处在于它如何处理较低的完成名次。一旦你确定了谁获得第一名,该玩家及其筹码将被排除在外,然后你对剩余玩家和剩余筹码提出同样的问题。玩家j获得第二名的概率是其他人获得第一名的概率,乘以j在幸存者之间的“子锦标赛”中“获胜”的概率。
形式上,j获得第二名的概率是对所有可能的第一个出局者k(其中k ≠ j)求和:
\[P(j \text{ is 2nd}) = \sum_{k \neq j} P(k \text{ is 1st}) \cdot \dfrac{s_j}{T - s_k}\]
仔细阅读。在k获得第一名的条件下,k的筹码离开池,新的总额为\(T - s_k\),并且在该减少的范围内,玩家j以概率\(s_j / (T - s_k)\)获得“第一名”(即总排名第二)。将第一名可能被填补的所有方式相加,你就得到了j获得第二名的精确概率。
第三名则递归更深一层:对所有有序的(第一名,第二名)完成者对求和,移除两个Stack,并计算j在剩余筹码中所占的份额。一般来说,你列举出所有完成顺序,用其Malmuth-Harville概率加权每个顺序,然后累加。对于剩余的n名玩家,有n!种排序——对于九人决赛桌来说是微不足道的(362,880种排序,几毫秒的计算),这就是为什么真实决赛桌上的ICM是精确的,而不是近似的。
你的美元Equity
一旦你有了完整的完成名次分布——即每个玩家获得第一名、第二名、第三名……的概率——将其转换为金钱就是点积。设\(\text{pay}[r]\)为获得r名次的Payout。那么:
\[\text{EV}(i) = \sum_r P(i \text{ finishes in position } r) \cdot \text{pay}[r]\]
这一行是该模型最重要的结果:你在锦标赛中的美元Equity,是你在每个完成名次落位的概率乘以该名次所支付的奖金的总和。ICM不过是一种计算这些概率的原则性方法。
一个具体的四人桌例子
理论通过数字更容易理解。剩余四名玩家。Stacks和总奖池10,000美元,按50 / 30 / 15 / 5支付:
| 玩家 | Stack | 筹码份额 | 该名次的Payout | |---|---|---|---| | A | 5,000 | 50% | 1st = $5,000 | | B | 3,000 | 30% | 2nd = $3,000 | | C | 1,500 | 15% | 3rd = $1,500 | | D | 500 | 5% | 4th = $500 | | Total | 10,000 | 100% | Pool = $10,000 |
请注意此设置中故意埋藏的陷阱:Payouts(50/30/15/5)完全镜像了筹码份额(50/30/15/5)。如果筹码与金钱是线性关系,那么每个玩家的$EV将等于他们筹码份额的美元价值:A = $5,000,B = $3,000,C = $1,500,D = $500。ICM将表明这些都不成立。
步骤1 — P(1st)即筹码份额
直接根据公理,且总和恰好为1:
- P(A 1st) = 5000/10000 = 0.5000
- P(B 1st) = 3000/10000 = 0.3000
- P(C 1st) = 1500/10000 = 0.1500
- P(D 1st) = 500/10000 = 0.0500
(0.5000 + 0.3000 + 0.1500 + 0.0500 = 1.0000.) ✓
步骤2 — P(2nd)的一个计算分支
让我们手动计算P(D获得2nd),对可能获得第一名的玩家进行求和:
- A 1st (概率0.5),然后D赢得剩余部分:D在\(T - 5000 = 5000\)中的份额是\(500/5000 = 0.1\)。贡献:0.5 × 0.1 = 0.05000
- B 1st (概率0.3),然后D在\(10000 - 3000 = 7000\)中的份额是\(500/7000 \approx 0.0714\)。贡献:0.3 × 0.0714 = 0.02143
- C 1st (概率0.15),然后D在\(10000 - 1500 = 8500\)中的份额是\(500/8500 \approx 0.0588\)。贡献:0.15 × 0.0588 = 0.00882
总和:0.05000 + 0.02143 + 0.00882 = 0.08025。因此,D持有5%的筹码,大约有8%的时间获得第二名。将相同的递归应用于每个玩家(此处通过完全枚举所有24种排序计算),得到完整的完成名次分布如下。第一名一列根据公理是精确的;第二/第三/第四名列是正确的Malmuth-Harville递归结果,经过四舍五入:
| 玩家 | P(1st) | P(2nd) | P(3rd) | P(4th) | |---|---|---|---|---| | A | 0.5000 | 0.3288 | 0.1456 | 0.0255 | | B | 0.3000 | 0.3687 | 0.2613 | 0.0699 | | C | 0.1500 | 0.2222 | 0.4197 | 0.2081 | | D | 0.0500 | 0.0803 | 0.1733 | 0.6965 |
每行总和为1.0,每列总和也为1.0——两者都是模型必须通过的健全性检查。请注意,short stack D绝大多数情况下会第一个出局(69.65%),但不再是必然的:生存自始至终都是概率性的。
步骤3 — 转换为美元
将每个玩家的完成名次分布与Payout向量[5000, 3000, 1500, 500]进行点积:
| 玩家 | 筹码份额 | “筹码Equity”美元 (线性) | ICM $EV | 与筹码的差额 | |---|---|---|---|---| | A | 50% | $5,000 | $3,717.74 | −$1,282.26 | | B | 30% | $3,000 | $3,033.17 | +$33.17 | | C | 15% | $1,500 | $2,150.19 | +$650.19 | | D | 5% | $500 | $1,098.89 | +$598.89 | | Total | 100% | $10,000 | $10,000.00 | 0 |
美元总额回到了完整的10,000美元奖池——Equity是守恒的,既不产生也不消亡。这就是整个模型的关键所在,以简单的数字呈现出来:
- Chip leader A的价值是$3,718,而不是$5,000。持有半数筹码,A预期只能获得奖池的37%。大约有$1,282的“筹码价值”已经流向了较小的Stack。
- Short stack D的价值是$1,099,而不是$500——超过其筹码份额的两倍。凭借5%的筹码,D几乎掌握了11%的奖金。
这并非这些特定Stack的怪癖;它是结构性的。Payout阶梯的凹性,加上即使是1个筹码的Stack也保证了某个完成名次,这意味着short stacks在美元价值上相对于筹码而言系统性地被高估,而big stacks则系统性地被低估。每个人都被“拉向”薪资等级的中间。
这如何改变你的打法
实际影响体现在一个短语中:risk premium(风险溢价)。因为你失去的最后几个筹码(以美元计)比你赢得的接下来几个筹码价值更高,所以All-in的盈亏平衡Equity会高于天真的chip-EV盈亏平衡。一个明显的chip-EV call牌局,在ICM下可能是明显的fold。
从上述角度来看待leader A的情况:A冒着筹码对抗中等Stack,是在以不利的汇率下注美元——A在损失时支付全部边际筹码成本,但在获胜时却只能获得打折的边际筹码价值,因为Stack翻倍并不会使A的金钱翻倍(A已经接近曲线顶部)。相比之下,short stack D对抗更大的Stack时具有较低的risk premium:D的筹码风险成本低,因为D的下行空间小,且通过laddering equity得到了很好的补偿。这就是“big stacks应该欺负人,但不要欺负其他big stack”以及“ICM压力对中等Stack打击最大”的数学基础——中等Stack拥有的ladder equity最多,但也最容易失去,而所得最少。
你不需要靠肉眼判断。将Stack和Payouts输入shadepoker的ICM 计算器,读出每个座位的$EV,任何给定对抗的risk premium都将通过比较获胜与出局前后的美元Equity而得出。这种前后美元波动——而非筹码波动——才是你河牌决定应该据此定价的数字。
Malmuth-Harville 对比 Malmuth-Weitzman
Malmuth-Harville基本上是所有商业ICM工具的默认模型,但它并非唯一的完成顺序模型。Malmuth-Weitzman以不同的条件规则回答了同样的问题——给定chip counts,完成名次分布是怎样的。
区别在于较低名次的推导方式。Harville是正向构建分布的:确定谁获得第一名(概率=筹码份额),将其移除,然后对幸存者进行递归。而Weitzman则是从下往上推论的——将获得最后一名的概率建模为与chip stack成反比,然后通过淘汰顺序向上递归。这两种模型在P(1st)和两人对局的情况下完全一致,但在更大的牌局中,它们对中间完成名次分配的概率略有不同,因此美元Equity也略有不同。
哪一个“正确”?两者在经验上都不完美——它们都是对依赖于Blinds、position和skill的真实淘汰过程的简化。Harville之所以赢得人气竞赛,是因为其正向递归直观、快速,并且与观察到的锦标赛数据吻合良好。Weitzman对big stacks通常略显悲观,而对short stacks则略显友善。分歧是真实存在的,但相对于两者与现实之间的模型误差而言,通常很小。出于实际目的:要知道“ICM”几乎总是指Malmuth-Harville,要知道Weitzman作为一个有原则的替代方案存在,并且不要为它们之间小数点后两位数的差异而烦恼——这些差异在它们都做出的假设面前显得微不足道。
超越静态ICM:未来游戏模拟 (Future Game Simulation)
这是其诚实的局限性。静态ICM假设锦标赛在没有进一步游戏的情况下解决——就好像你冻结Stack的那一刻,完成名次分布就已确定。它包含两个虚构之处:
- 没有未来的牌局。Blinds不会上涨,Antes不会耗尽Stack,没有人会open-shoves。筹码被视为固定的彩票。
- 没有skill。每个玩家都是相同的。世界级的reg和拥有相同Stack的娱乐玩家获得相同的Equity。相对于button的position——一个巨大的short stack优势——对模型来说是不可见的。
当存在大量未来游戏时,这些虚构之处最为重要:更深的Stack,相对于Stack较大的Blinds,以及在有人出局之前Button会轮转几次。静态ICM系统性地错误定价了这些牌局,因为它忽略了下一轮中累积的position和主动权优势。
Future Game Simulation (FGS)是这种改进。FGS不是冻结Stack,而是模拟接下来的k手牌——通常是1到4手牌的短视预判——使用简化的策略(通常是push/fold或solver派生模型)来模拟Blinds的争夺方式,然后才对由此产生的Stack分布应用静态ICM。实际上,FGS让筹码在兑换成美元之前“向前玩”一小段,捕捉了position的价值以及即将处于Blinds的成本。
回报是:FGS奖励对short stack拥有position,惩罚即将用边缘牌型下注big blinds,并且通常会缩小静态ICM在那些你可以在有人被淘汰之前利用自己的skill和position的牌局中一些最严苛的folds。成本是计算和建模的复杂性——模拟的质量取决于你对未来牌局所假设的策略,并且状态空间会随着预判深度的增加而迅速膨胀,这就是FGS深度保持较浅的原因。可以将FGS视为静态ICM加上对下一个轨道进行简短而有原则的预见。对于未来游戏较少的决赛桌和bubble决策,静态Malmuth-Harville已经非常出色;对于更深阶段的pay-jump牌局,FGS能有效地纠正它。
总结
ICM不是一种感觉。它是一个具体的算法:P(1st)等于筹码份额,较低名次通过移除较高名次完成者并递归得出,你的美元Equity是完成名次分布与Payout阶梯的点积。在任何四人牌局中运行它,每次都会出现相同的结构性真相——chip leader的价值低于其Stack,short stack的价值更高,而中等Stack是模型压榨最厉害的。
内化这一点的玩家不只是“在bubble时打得tight”。他们会根据美元波动而非筹码波动来评估每次All-in,他们知道何时他们的risk premium让他们可以大胆冒险,何时又束缚了他们,并且他们确切地理解模型中的哪些假设即将失效——那正是转向FGS或纯粹判断力的时刻。将筹码视为金钱与了解精确汇率之间的这种差距,正是min-cashing和决赛桌得分之间的差距。将一个真实牌局输入shadepoker的ICM calculator,读取美元Equity,并开始让这种转换成为你的第二天性。