PKO和神秘赏金的数学:将赏金计入每一次All-in

在赏金赛制中,名义上的equity只是一半的考量。学习如何将赏金计入所需的equity,这样你才能避免在最有利可图的局面中弃牌。

赏金锦标赛是高手们悄然漏掉最多优势的地方——不是因为postflop更难,而是因为他们持续用错误的数字评估All-in。他们看到一次shove,脑中计算chip-EV,发现自己稍微低于所需的equity,然后fold。在freezeout中,这个fold是正确的。但在PKO中,如果你cover了shover,同样的fold往往是一个巨大的错误,因为pot上面还有一笔现金从未进入计算。

赏金是你只有在淘汰一名被你cover的对手时才能获得的额外现金equity。这一句话包含了整个战略调整。任务是将这笔现金转化为chip-equivalent equity,并将其添加到你正在争夺的pot中——这样你call所需的required equity就会下降。如果转换正确,你将call那些看起来边缘的shove并大赚一笔。如果转换错误(或忽略它),你就会在赛制中最有利可图的局面中弃牌。

本文将详细阐述数学原理:PKO奖金如何分配,如何将赏金转换为equity点数,一个数值示例展示赏金如何实际降低你的calling threshold,为什么带有赏金的short stacks会成为“磁铁”,以及在pay jumps附近bounty-EV和ICM生存之间的真实张力。然后是mystery bounty,它是一个具有概率性 payout 的相同引擎。

PKO中奖金如何分配

在标准的Progressive Knockout中,你的buy-in一分为二。一半进入常规prize pool(你通过生存和获得高名次来攀升的 payout 阶梯)。另一半成为你的bounty——这笔现金就在你头上,任何淘汰你的人都会获得。

“progressive”部分是使该赛制独具特色的关键。当你淘汰某人时,你不会赢得他们全部的赏金。通常,你赢得的赏金有一半会立即以现金形式支付给你,而另一半则会加到你自己的头上,从而增加其他玩家现在追逐的赏金。因此,淘汰会累积:一名在早期淘汰了三名对手的玩家可能带着是初始赏金数倍的赏金,他们未来每一次淘汰都会带来更大的回报。

这种渐进机制很重要,原因有二:

对比非渐进式/Bovada风格的flat bounties,在这种情况下,你赢得的全部赏金都以现金支付,而你自己的head value则保持在起始金额不变。Flat bounties更简单——没有累积,也没有不断增长的目标——但核心的call/shove调整是相同的:赏金是你只有在你cover并淘汰对手时才能赢得的现金。

核心调整:将赏金视为equity点数

在每一次活赏金的All-in中,你脑中应该运行的机制是这样的。

通常,为了通过chip-EV有利可图地call一个All-in,你需要足够的equity来证明你所冒的筹码风险与你正在赢得的pot是合理的。标准pot-odds:如果你call X去赢得一个P的pot(包括你的call),你大约需要X / P的equity。

赏金改变了奖品。当你cover shover时,赢得这手牌你将赢得pot加上赏金现金。赏金是只在“赢并淘汰”的分支上才能获得的额外奖励。因此,它的作用就像在pot中添加筹码——但只是你淘汰玩家时才能获得的筹码。

为了使赏金与筹码具有可比性,使用chip-EV-to-prize ratio进行转换:大约一个锦标赛筹码在此阶段值多少现金。如果平均Stack是40,000筹码,而一个Stack的平均现金equity是某个美元数字,你就可以反推出“X美元的赏金在筹码上价值多少?”在实践中,你不需要非常精确——你需要的是数量级。更清晰的操作性思考方式是:

将赏金表示为pot的一部分。 如果你正在争夺的pot以筹码计价,其现金价值为C,而赏金的现金价值为B,那么赏金就是“额外的B/C pot”——正是这个比例降低了你的required equity。

为什么它会降低required equity?因为在你获胜的分支上,奖励增加了,而call的成本保持不变。相同的风险获得更多奖励意味着你可以更少次地获胜,但仍然能打平。

一个调整后阈值的有用近似值:

Required equity ≈ (所冒筹码) / (pot中筹码 + 筹码化赏金),其中赏金仅在您获胜并淘汰对手的分支中计算。

严格来说,赏金只与“你获胜且被cover的short stack被淘汰”这个结果相关——在一个干净的heads-up All-in中,如果你cover,这等同于“你赢得这手牌”,所以你可以直接将其计入pot。在multiway局面中会更复杂(下文将详细阐述),但如果在heads-up对抗被你cover的shover时,赏金只会使pot膨胀。

一个实例

我们来计算一个价格。

设置。 中期PKO。一个short stack从small blind open-shoves 10个big blinds。你在big blind,你轻松cover,局面是heads-up。Antes和blinds都计入计算,但为了简化:你正在call 多9个bb,以赢得一个pot——在他们10个bb的shove,你已经投入的1个bb,再加上blinds/antes之后——总计大约22个bb

仅考虑Chip-EV(无赏金)。 你冒险9个筹码去赢得22个筹码。

Required equity ≈ 9 / 22 ≈ 41%

因此,在一个freezeout中,你需要大约41%的equity才能call。对抗一个10 bb SB的shoving range,很多手牌都能达到这个要求——但像K9o、Q9s、小offsuit aces、弱suited kings这样的手牌就在这个阈值附近,许多玩家会选择fold。

现在加上赏金。 假设这个short stack的赏金,以现金计,在此阶段大约相当于8个bb的筹码价值。(你可以从赏金/ICM工具中获得这种转换——重点是数量级:一个有意义但不巨大的赏金。)因为你cover并且是heads-up,赏金会干净地附着在你的获胜分支上,所以它会膨胀有效pot:

有效pot ≈ 22 (筹码) + 8 (筹码化赏金) ≈ 30

你仍然冒险9个筹码。你所需的required equity变为:

Required equity ≈ 9 / 30 ≈ 30%

赏金刚刚将你的calling threshold从~41%降低到~30%——大约11个equity点。

这是巨大的。11个点数是放弃你call range底部三分之一与有利可图地call之间的区别。在freezeout中你会弃掉的手牌——K7s、Q8s、J9o、A2o、你担心充其量是flips的小pairs——都变成了明确的calls,因为对抗一个10 bb的shoving range,几乎所有牌都有30%以上的equity。事实上,拥有如此大的赏金,你常常会数学上call任何两张牌,因为即使32o对抗一个宽泛的shove也有大约30%以上的equity。

波动的大小与赏金相对于pot的比例有关。一个价值8 bb的赏金对抗22 bb的pot是巨大的。同样的赏金对抗120 bb的pot(更深的stacks,更大的All-in)几乎不会有太大影响——可能只有几个equity点。All-in相对于赏金越浅,赏金的影响力就越大。 这是该赛制中最重要的直觉。

为什么带有赏金的short stacks是目标

这个例子直接解释了这种动态。将一个被cover的赏金置于风险之中越便宜,赏金对你的价格扭曲就越大。所以:

矛盾:bounty-EV vs ICM生存

以上所有内容都旨在最大化bounty-EV = chip-EV + 淘汰获得的即时现金。在锦标赛早期和中期,当生存成本低廉且 payout 阶梯遥远时,bounty-EV是接近正确的目标,你应该积极地追逐。

但赏金并不能废除ICM。当你接近pay jump时——例如money bubble、决赛桌的 payout 阶梯、或者卫星赛的flat结构——bust会让你损失真正的prize-pool equity,而且这个成本可能超过你正在追逐的赏金。

坦率地说:在pay jump附近,赏金部分抵消了ICM风险,但不能完全覆盖它。

实用的规则是:赏金折扣在ICM压力最低时最大,并随着ICM压力的增加而减小。 不要在bubble阶段应用完全的mid-game折扣,也不要在生存几乎免费的第六级别应用bubble阶段的紧缩ICM ranges。

这正是计算数值胜过感觉的地方。shadepoker的ICM 计算器让你可以在同一个局面中将赏金计入所需的equity,并将其与ICM生存进行权衡,这样你就能看到头上的现金是否真的抵消了ICM tax,或者只是略微影响了它。

Multiway和渐进式人头赏金

有两个值得注意的复杂情况。

神秘赏金:相同引擎,概率性 payout

神秘赏金将赏金重塑为一种彩票。你淘汰某人后,不是获得一个固定金额,而是从一个奖池中抽取一个密封的赏金——大多数很小,少数很大,有一两个是改变人生的jackpots。关键是,在大多数神秘赛制中都有一个赏金阶段:赏金在某个特定时间点(通常是money bubble或某个固定级别)“激活”,只有在激活后淘汰对手才能获得一次抽取机会。

数学调整很简单:淘汰的EV是所有信封分布中赏金的平均值。 例如,如果奖池是1,000,000美元,分布在1,000个信封中,那么每次淘汰的期望值就是1,000美元,无论是否有jackpot。你将这个期望值计入你的required equity,就像PKO的例子一样——将平均赏金转换为chip-equivalent,将其添加到赢得并淘汰的分支的pot中,然后重新计算threshold。

有两个值得注意的复杂情况:

渐进式与flat的区别同样适用。PokerStars风格的神秘赛制可能会在渐进式结构之上叠加神秘抽取;Bovada风格和许多现场神秘赛事使用没有head growth的flat抽取。转换是相同的——平均赏金输入,chip-equivalent输出——只是复合方式不同。

要点

在赏金赛制中,名义上的equity只是一半的考量。另一半是你cover对手并淘汰他们时获得的现金,这笔现金会转换为equity点数并添加到pot中。跳过这个转换,你就会fold掉那些明显有利可图的手牌;All-in相对于赏金越浅,这个错误就越大。

遵循的规则是机械性的:

  1. 我是否cover对手? 如果没有,赏金无关紧要——按chip-EV和ICM来打。
  2. 将赏金转换为chip-equivalent(神秘赛制中的平均赏金),并将其添加到赢得并淘汰分支的pot中。
  3. 重新计算required equity——它会下降,通常在对抗shallow shoves时会下降很多点。
  4. 检查ICM。 在pay jump附近,赏金部分抵消了ICM tax,但没有完全覆盖它。远离pay jumps时,则完全享受折扣。
  5. 隔离被cover的short stacks,将multiway的打折赏金转化为全额heads-up赏金。

无论哪个方向错误地估价赏金——在你cover时忽略它,或者在bubble阶段通过ICM壁垒去追逐它——你都会流失EV。正确地估价它,赏金就不再是一个模糊的“淘汰奖励”,而是它真正所是:你stack筹码和现金所需equity的一个精确的、可量化的减少。