河牌决策:极化、阻断牌和诈唬与价值的Alpha公式
河牌是直觉最容易出错、纪律回报最高的地方。这是支配河牌的理论——极化、Alpha公式、MDF和将猜测转化为计算的阻断牌逻辑。
河牌是唯一一张牌停止“说话”的街。没有即将到来的转牌,没有要实现的 equity,没有要追逐的 implied odds。每手牌都已完成:要么是最好的牌,要么不是。正是这种终结性,使得河牌成为无限注德州扑克中 leverage 最高、最难打的街。 pot 达到最大,错误代价最为昂贵,“我有 outs”这种舒服的迷雾已完全消散。
在前面的街,你可以大致玩牌并生存下来。但在河牌,每一次决策的近似都会导致筹码流失,并且在大规模下——在 tournament grind 或 cash sample 的数千个 spot 中——这种流失是赢家和 breakeven 玩家之间的区别。好消息是,河牌的打法,剥去神秘面纱后,是游戏中最 机械化 的部分之一。它由两套小公式支配的 combo 计数和阻断牌逻辑组成。熟练掌握它们,你就能在直觉最不可靠的地方,用算术取代直觉。
河牌为何呈极化分布
在翻牌和转牌, betting ranges 宽泛且融合,因为许多牌都具有 equity — 它们既非价值牌也非空气牌,而是听牌和中等强度的持牌,能从 folding equity、阻断和看到下一张牌的权利中受益。河牌消除了所有这些。没有更多的牌了。一手牌不能“改进”,也没有什么可阻断的。
因此,河牌将所有持牌归结为两类:
- Value: 那些会被更差的牌跟注并希望被跟注的牌。
- Bluffs: 在 villain 的 continuing range 中没有任何牌能被它击败,只有 villain fold 才能获胜的牌。
介于两者之间的一切——第二对子、已失败的听牌、弱的成牌——都不是融合意义上的“ betting hand ”。它要么足够强,可以进行价值下注(被更差的牌跟注),要么是诈唬候选牌(如果被跟注则输掉,因此只下注以使更好的牌 fold 掉),要么是 check。河牌上没有第三种情况。这就是 polarization,它不是一种风格选择;它是由牌局结构所强制的。
实际结果是:你的河牌 betting range 应该是极化的——强的 value 牌加上选定的 bluffs——而你的中等强度牌则 check 并成为 bluff-catchers。那么有趣的问题就纯粹是量化的:相对于 value 牌有多少 bluffs,以及 哪些特定的 combos 扮演每个角色。这就是本文其余部分要回答的两个问题。
Alpha公式:多少诈唬
设 \(s\) 为你下注大小占 pot 的分数(半 pot 下注为 \(s = 0.5\), pot-sized 下注为 \(s = 1\),2倍 pot overbet 为 \(s = 2\))。
当你下注时,你给对手提供了一个跟注的价格。他冒 \(s\) 的风险去赢得 \(1 + s\)(现有的 pot 1 加上你的下注 \(s\))。除非你诈唬的频率足够低,否则他的跟注是盈利的。使他用纯粹的 bluff-catcher 在跟注和 fold 之间精确地 indifferent 的频率是:
\[\alpha = \dfrac{s}{1 + s}\]
这个 \(\alpha\) 是你的 betting range 中应该属于 bluffs 的比例。请仔细阅读——这是下注中诈唬的份额,而不是价值与诈唬的比率。将这两者混淆是河牌理论中最常见的错误,因此我们将它们严格区分。
如果 bluffs 占 betting range 的 \(\alpha\),那么 value 占 \(1 - \alpha\),价值与诈唬的比率是 \((1 - \alpha) : \alpha\)。让我们看看标准大小:
- Half pot, \(s = 0.5\): \(\alpha = 0.5 / 1.5 = 1/3\)。Bluffs 占你下注的三分之一。Value 占三分之二。Value:bluff = 2:1 — 大约每两个 value combos 有一个 bluff。
- Pot, \(s = 1\): \(\alpha = 1 / 2 = 1/2\)。Bluffs 占你下注的一半。Value:bluff = 1:1。
- 2x-pot overbet, \(s = 2\): \(\alpha = 2 / 3\)。Bluffs 占你下注的三分之二。Value:bluff = 1:2 — 在这种大小下,你 bluff 的频率是 value-bet 的 两倍。
“下注越大,诈唬越多”背后的直觉是风险定价。更大的下注会让你在每次诈唬中冒更大的筹码风险,因此它必须更频繁地成功才能 break even——这意味着你可以有利可图地进行更多的诈唬,因为更大的下注也会使 villain 的更多 range fold。 overbet 是一种诈唬主导的武器,这正是为什么你需要 nut combos 来支持它;没有它们,你只是在价格要求你不要诈唬的时候过度诈唬。
另一方面:跟注者的MDF
下注者的 \(\alpha\) 在 防御者 身上有一个镜像。为了阻止下注者通过诈唬每一手垃圾牌而自动获利,跟注者必须足够频繁地继续。 minimum defense frequency (MDF) 是:
\[\text{MDF} = \dfrac{\text{pot}}{\text{pot} + \text{bet}} = \dfrac{1}{1 + s} = 1 - \alpha\]
最后一个等式是其精妙之处:MDF = 1 - alpha。跟注者防御那些能够合理继续的牌的 \(1 - \alpha\),最多 fold 掉 \(\alpha\)。如果他 fold 超过 \(\alpha\),纯诈唬就会赚钱,下注者应该诈唬每一手垃圾 combo。如果他过度防御,薄价值下注就变得免费。
关于 MDF 的两点注意事项。首先,它是一个 no-exploit 基准,而不是你盲目达到的目标——对于在河牌 under-bluffs 的 villain(坦白说,整个 mid-stakes pool),你应该 fold 多于 MDF 允许的范围,因为 indifference 的数学计算假设下注者实际以 \(\alpha\) 的频率进行诈唬。其次,MDF 是根据 到达 河牌并能够击败诈唬的 range 定义的;它不是“防御你起手牌 range 的 X%”。它是基于你实际的河牌到达 range 的频率。
主表
以上所有内容浓缩为一张表格。这些关系是精确的:\(\alpha = s/(1+s)\),\(\text{MDF} = 1/(1+s) = 1 - \alpha\),以及 value:bluff 为 \((1 - \alpha) : \alpha\)。
| 下注大小 (s, x pot) | alpha = 下注中诈唬的比例 | Value : Bluff | 跟注者 MDF (= 1 - alpha) | |---|---|---|---| | 0.33 (三分之一 pot) | 0.250 | 3 : 1 | 0.750 | | 0.50 (半 pot) | 0.333 | 2 : 1 | 0.667 | | 0.75 (四分之三 pot) | 0.429 | 4 : 3 | 0.571 | | 1.00 (满 pot) | 0.500 | 1 : 1 | 0.500 | | 1.50 (1.5倍 pot) | 0.600 | 2 : 3 | 0.400 | | 2.00 (2倍 overbet) | 0.667 | 1 : 2 | 0.333 |
检查锚点是否合理:半 pot 给出 \(\alpha = 0.333\) 和 \(\text{MDF} = 0.667\); pot 给出 \(0.5 / 0.5\);2倍 overbet 给出 \(0.667 / 0.333\)。诈唬比例和跟注者的 fold 允许量是相同的数字——\(\alpha\)——这就是河牌的全部对称性。
关于在实践中计算这些比率的说明:它们适用于 combinations,而不是手牌类别。“半 pot 时一个 bluff 对两个 value”意味着如果你有 12 个采取此线路的 value combos,你大约需要 6 个 bluff combos——而不是“一个诈唬的 手牌类型”。计算 combos 是整个纪律;接下来我们将讨论哪些 combos。
阻断牌:哪些 combos 扮演什么角色
知道你需要,比如,六个 bluff combos 并不告诉你 是哪 六个。这就是阻断牌将河牌从频率练习转变为牌面移除练习的地方。一个 blocker 是你手中的一张牌,它从 villain 的 range 中移除一个特定的 combo;一个 unblocker 是没有这样一张牌,从而让这些 combos 活跃。
这种逻辑根据角色清晰地划分。
选择诈唬牌
当你诈唬时,你希望 villain fold 牌。因此,你理想的诈唬牌应该:
- 阻断 villain 的 value/calling combos —— 你持有的一张牌移除了最可能跟注的牌,从而使 fold 的可能性更大。
- 不阻断 villain 的 folding combos —— 你 没有 那些构成他会 fold 的 busted draws 和 air 的牌,因此这些 combos 在他的 range 中完全活跃,并可以实际 fold 掉。
经典的错误是仅仅因为“没有 showdown value”而用 busted draw 进行诈唬。这是必要条件,但不是充分条件。在你的 busted hands 中,最好 的诈唬牌是那些特定牌阻断了坚果牌并 unblock 了 fold 牌的。例如,一个 busted flush draw 如果还持有阻断 nut value 的 A,它比没有该 blocker 的相同 busted draw 要好得多——因为它使得 villain 最强的 continues 可能性降低。
选择价值下注(和薄价值下注的 sizing)
当你 value-bet 时,你希望 villain call。因此阻断牌逻辑反转:
- 不阻断 villain 的跟注牌 —— 你希望构成他跟注 range 的牌 存在于 他的 range 中,而不是在你手中。如果你持有他跟注所需的牌,你就阻断了自己的行动。
这就是为什么 thin value bets 的 sizing 和选择取决于它们 不 阻断什么。下注一手阻断了 villain 所有更差跟注牌的牌是自毁前程的;你下注,他 fold 掉所有你打败的牌。最好的 thin value 目标是 villain 实际可能持有的较差牌。
Hero-calling
防御者的阻断牌逻辑是诈唬者的镜像。当你面对河牌的极化下注并决定是否 bluff-catch 时,正确的跟注牌是那些 阻断 villain 的 value 牌 并 不阻断他的 bluffs 的牌:
- 持有一张牌,该牌移除了 villain 可能的 nut/value combos,这意味着,通过排除法,他 betting range 中更大一部分是 bluffs——因此你的 bluff-catcher 更有可能获胜。
- 相反,如果你的 bluff-catcher 阻断了他会用来诈唬的 busted draws,你就是在从等式中移除他的 bluffs,给他留下更多的 value 牌——这是一个更差的 call。
所以两张原始强度相同的 bluff-catchers 并不是同等的跟注。持有阻断 villain value 牌的牌是跟注;阻断他 bluffs 的牌是 fold。这就是为什么“我有一张 bluff-catcher”永远不是跟注的完整理由——哪张 bluff-catcher 才是问题的关键。
河牌实战范例
范例1 — 一个极化的 overbet,以及用哪种 busted draw 诈唬
单次加注的 pot,你在 button 位加注, big blind 跟注。牌面是 K♠ 9♠ 4♦ 7♠ 2♥。河牌没有发出前门同花;黑桃听牌落空。
你希望在这里用极化 range 下注,并选择 overbet (\(s \approx 1.5\)),根据表格这表示 value:bluff ≈ 2:3——诈唬偏重,要求 nut combos 作为骨干(sets、两对,少数改进的 Kx)。那么,哪些 busted hands 适合诈唬?
比较两个候选牌:A♠Q♠ (busted nut flush draw) 对比 J♠T♠ (busted second-flush/straight draw)。
A♠Q♠持有A♠。这阻断了 nut flush——但在这张空白河牌上,nut flush 也落空了,所以同花不是价值类别。更有用的是,A♠阻断了 villain 可能转化为 bluffs 的Ax 黑桃 combos,而Q并没有太多阻断他的Kx calls。这是一个不错的,但并非完美的诈唬。J♠T♠不阻断任何 value,并且完全 不阻断 villain 的Kx 和9x calling range,而它自己的 busted-draw 牌正是 villain 也会 fold 的那种类型。更好的是,持有J和T移除了 villain 自己的一些 missed straight draws——一个混合信号。
运作中的原则是:偏爱那些阻断你试图 fold 掉的 calls 并让 folds 活跃的 busted combo。在实践中, solvers 会在这里诈唬一个 mix,但选择正是由这种移除计算驱动的——而不是由“哪个听牌最可惜地落空了”驱动。将大小输入 shadepoker 的 alpha/MDF 助手,你会看到 overbet 大约需要三个 bluff combos 对两个 value combos;你的任务是 用最好的阻断 busted hands 填补这三个空位。
范例2 — 一张牌决定的 hero-call
你在 big blind 位防守并在 Q♥ J♥ 5♣ 8♦ 3♠ 的牌面上 check-call 到河牌。 villain 在河牌下注一个极化的 three-quarter pot (\(s = 0.75\)),所以根据表格,如果他平衡的话,他代表的 range 大约是 43% bluffs (value:bluff = 4:3, 你这边的 MDF = 0.571)。红心牌落空, straight draws (T9、T7、97) 落空。
你持有两手强度相似的候选 bluff-catchers:Q♥9♥ (顶对,持有两张红心) 对比 Q♠9♣ (顶对,没有红心)。
Q♥9♥阻断了 villain 的 missed-flush bluffs——他会用来 barreling 作为 bluffs 的X♥X♥combos 部分在你手中。通过移除他的 bluffs,你使他的 betting range 更 偏向 value。这是一个 更差的 bluff-catcher:你应该倾向于 fold。Q♠9♣不阻断任何 busted heart draw,让他的 bluff combos 完全活跃,而9阻断了他的一些Q9/98value。这手牌 bluff-catch 更好——它阻断 value 并且不阻断 bluffs。这就是 call。
相同的对子,相同的 kicker 类别,却做出相反的决定——完全取决于每手牌从 villain range 中移除了哪些 combos。这就是河牌的一个例子:原始强度是起点,牌面移除是裁决。
付诸实践
河牌奖励一种特定的纪律:停止问“我的牌好吗?”并开始问三个精确的问题。
- 我是 value 还是 bluff? 河牌上没有中间地带;如果你下注,就选一边。
- 在我选择的大小下,bluff 比例 (alpha) 和 value:bluff 比率是多少? 使用 \(\alpha = s/(1+s)\)。更大的大小,更多的 bluffs,value-to-bluff 比率更偏向 bluffs。
- 具体是哪些 combos? 用那些阻断 villain 跟注牌并 unblock 他 fold 牌的 busted hands 进行诈唬;用那些 unblock 他跟注牌的牌进行 value-bet;只用那些阻断 villain value 牌并 unblock 他 bluffs 的 bluff-catchers 进行 hero-call。
而在防守时:以 \(\text{MDF} = 1 - \alpha\) 作为你的 no-exploit 底线,然后针对那些在河牌 under-bluffs 的 pool(坦白说,大多数 pool 大部分时间都是如此)进行 更紧的 偏离。数学给你基线;读牌告诉你偏离多少。
这些都是小计算,但在牌桌压力下很容易出错。使用 shadepoker 的 底池大小计算器进行数百次练习——输入下注大小并读出 alpha、MDF 和你被要求的价格——可以培养实时执行这些计算的直觉。目标不是每手牌都现场计算;而是经常进行算术,以至于正确的 combo 计数和正确的 blocker 看起来就是 正确 的。
河牌是直觉最容易出错的地方,因为没有什么可以再听牌,而一切都可能输掉。用 combo 计数和阻断牌逻辑取代直觉,最难的街就会变成最容易解决的。这里的纪律比游戏中的任何地方都更有价值——正是因为很少有玩家费心去计算。