河牌决策:极化、阻断牌和诈唬与价值的Alpha公式

河牌是直觉最容易出错、纪律回报最高的地方。这是支配河牌的理论——极化、Alpha公式、MDF和将猜测转化为计算的阻断牌逻辑。

河牌是唯一一张牌停止“说话”的街。没有即将到来的转牌,没有要实现的 equity,没有要追逐的 implied odds。每手牌都已完成:要么是最好的牌,要么不是。正是这种终结性,使得河牌成为无限注德州扑克中 leverage 最高、最难打的街。 pot 达到最大,错误代价最为昂贵,“我有 outs”这种舒服的迷雾已完全消散。

在前面的街,你可以大致玩牌并生存下来。但在河牌,每一次决策的近似都会导致筹码流失,并且在大规模下——在 tournament grind 或 cash sample 的数千个 spot 中——这种流失是赢家和 breakeven 玩家之间的区别。好消息是,河牌的打法,剥去神秘面纱后,是游戏中最 机械化 的部分之一。它由两套小公式支配的 combo 计数和阻断牌逻辑组成。熟练掌握它们,你就能在直觉最不可靠的地方,用算术取代直觉。

河牌为何呈极化分布

在翻牌和转牌, betting ranges 宽泛且融合,因为许多牌都具有 equity — 它们既非价值牌也非空气牌,而是听牌和中等强度的持牌,能从 folding equity、阻断和看到下一张牌的权利中受益。河牌消除了所有这些。没有更多的牌了。一手牌不能“改进”,也没有什么可阻断的。

因此,河牌将所有持牌归结为两类:

介于两者之间的一切——第二对子、已失败的听牌、弱的成牌——都不是融合意义上的“ betting hand ”。它要么足够强,可以进行价值下注(被更差的牌跟注),要么是诈唬候选牌(如果被跟注则输掉,因此只下注以使更好的牌 fold 掉),要么是 check。河牌上没有第三种情况。这就是 polarization,它不是一种风格选择;它是由牌局结构所强制的。

实际结果是:你的河牌 betting range 应该是极化的——强的 value 牌加上选定的 bluffs——而你的中等强度牌则 check 并成为 bluff-catchers。那么有趣的问题就纯粹是量化的:相对于 value 牌有多少 bluffs,以及 哪些特定的 combos 扮演每个角色。这就是本文其余部分要回答的两个问题。

Alpha公式:多少诈唬

设 \(s\) 为你下注大小占 pot 的分数(半 pot 下注为 \(s = 0.5\), pot-sized 下注为 \(s = 1\),2倍 pot overbet 为 \(s = 2\))。

当你下注时,你给对手提供了一个跟注的价格。他冒 \(s\) 的风险去赢得 \(1 + s\)(现有的 pot 1 加上你的下注 \(s\))。除非你诈唬的频率足够低,否则他的跟注是盈利的。使他用纯粹的 bluff-catcher 在跟注和 fold 之间精确地 indifferent 的频率是:

\[\alpha = \dfrac{s}{1 + s}\]

这个 \(\alpha\) 是你的 betting range 中应该属于 bluffs 的比例。请仔细阅读——这是下注中诈唬的份额,而不是价值与诈唬的比率。将这两者混淆是河牌理论中最常见的错误,因此我们将它们严格区分。

如果 bluffs 占 betting range 的 \(\alpha\),那么 value 占 \(1 - \alpha\),价值与诈唬的比率是 \((1 - \alpha) : \alpha\)。让我们看看标准大小:

“下注越大,诈唬越多”背后的直觉是风险定价。更大的下注会让你在每次诈唬中冒更大的筹码风险,因此它必须更频繁地成功才能 break even——这意味着你可以有利可图地进行更多的诈唬,因为更大的下注也会使 villain 的更多 range fold。 overbet 是一种诈唬主导的武器,这正是为什么你需要 nut combos 来支持它;没有它们,你只是在价格要求你不要诈唬的时候过度诈唬。

另一方面:跟注者的MDF

下注者的 \(\alpha\) 在 防御者 身上有一个镜像。为了阻止下注者通过诈唬每一手垃圾牌而自动获利,跟注者必须足够频繁地继续。 minimum defense frequency (MDF) 是:

\[\text{MDF} = \dfrac{\text{pot}}{\text{pot} + \text{bet}} = \dfrac{1}{1 + s} = 1 - \alpha\]

最后一个等式是其精妙之处:MDF = 1 - alpha。跟注者防御那些能够合理继续的牌的 \(1 - \alpha\),最多 fold 掉 \(\alpha\)。如果他 fold 超过 \(\alpha\),纯诈唬就会赚钱,下注者应该诈唬每一手垃圾 combo。如果他过度防御,薄价值下注就变得免费。

关于 MDF 的两点注意事项。首先,它是一个 no-exploit 基准,而不是你盲目达到的目标——对于在河牌 under-bluffs 的 villain(坦白说,整个 mid-stakes pool),你应该 fold 多于 MDF 允许的范围,因为 indifference 的数学计算假设下注者实际以 \(\alpha\) 的频率进行诈唬。其次,MDF 是根据 到达 河牌并能够击败诈唬的 range 定义的;它不是“防御你起手牌 range 的 X%”。它是基于你实际的河牌到达 range 的频率。

主表

以上所有内容浓缩为一张表格。这些关系是精确的:\(\alpha = s/(1+s)\),\(\text{MDF} = 1/(1+s) = 1 - \alpha\),以及 value:bluff 为 \((1 - \alpha) : \alpha\)。

| 下注大小 (s, x pot) | alpha = 下注中诈唬的比例 | Value : Bluff | 跟注者 MDF (= 1 - alpha) | |---|---|---|---| | 0.33 (三分之一 pot) | 0.250 | 3 : 1 | 0.750 | | 0.50 (半 pot) | 0.333 | 2 : 1 | 0.667 | | 0.75 (四分之三 pot) | 0.429 | 4 : 3 | 0.571 | | 1.00 (满 pot) | 0.500 | 1 : 1 | 0.500 | | 1.50 (1.5倍 pot) | 0.600 | 2 : 3 | 0.400 | | 2.00 (2倍 overbet) | 0.667 | 1 : 2 | 0.333 |

检查锚点是否合理:半 pot 给出 \(\alpha = 0.333\) 和 \(\text{MDF} = 0.667\); pot 给出 \(0.5 / 0.5\);2倍 overbet 给出 \(0.667 / 0.333\)。诈唬比例和跟注者的 fold 允许量是相同的数字——\(\alpha\)——这就是河牌的全部对称性。

关于在实践中计算这些比率的说明:它们适用于 combinations,而不是手牌类别。“半 pot 时一个 bluff 对两个 value”意味着如果你有 12 个采取此线路的 value combos,你大约需要 6 个 bluff combos——而不是“一个诈唬的 手牌类型”。计算 combos 是整个纪律;接下来我们将讨论哪些 combos。

阻断牌:哪些 combos 扮演什么角色

知道你需要,比如,六个 bluff combos 并不告诉你 是哪 六个。这就是阻断牌将河牌从频率练习转变为牌面移除练习的地方。一个 blocker 是你手中的一张牌,它从 villain 的 range 中移除一个特定的 combo;一个 unblocker 是没有这样一张牌,从而让这些 combos 活跃。

这种逻辑根据角色清晰地划分。

选择诈唬牌

当你诈唬时,你希望 villain fold 牌。因此,你理想的诈唬牌应该:

经典的错误是仅仅因为“没有 showdown value”而用 busted draw 进行诈唬。这是必要条件,但不是充分条件。在你的 busted hands 中,最好 的诈唬牌是那些特定牌阻断了坚果牌并 unblock 了 fold 牌的。例如,一个 busted flush draw 如果还持有阻断 nut value 的 A,它比没有该 blocker 的相同 busted draw 要好得多——因为它使得 villain 最强的 continues 可能性降低。

选择价值下注(和薄价值下注的 sizing)

当你 value-bet 时,你希望 villain call。因此阻断牌逻辑反转:

这就是为什么 thin value bets 的 sizing 和选择取决于它们 阻断什么。下注一手阻断了 villain 所有更差跟注牌的牌是自毁前程的;你下注,他 fold 掉所有你打败的牌。最好的 thin value 目标是 villain 实际可能持有的较差牌。

Hero-calling

防御者的阻断牌逻辑是诈唬者的镜像。当你面对河牌的极化下注并决定是否 bluff-catch 时,正确的跟注牌是那些 阻断 villain 的 value 牌不阻断他的 bluffs 的牌:

所以两张原始强度相同的 bluff-catchers 并不是同等的跟注。持有阻断 villain value 牌的牌是跟注;阻断他 bluffs 的牌是 fold。这就是为什么“我有一张 bluff-catcher”永远不是跟注的完整理由——哪张 bluff-catcher 才是问题的关键。

河牌实战范例

范例1 — 一个极化的 overbet,以及用哪种 busted draw 诈唬

单次加注的 pot,你在 button 位加注, big blind 跟注。牌面是 K♠ 9♠ 4♦ 7♠ 2♥。河牌没有发出前门同花;黑桃听牌落空。

你希望在这里用极化 range 下注,并选择 overbet (\(s \approx 1.5\)),根据表格这表示 value:bluff ≈ 2:3——诈唬偏重,要求 nut combos 作为骨干(sets、两对,少数改进的 Kx)。那么,哪些 busted hands 适合诈唬?

比较两个候选牌:A♠Q♠ (busted nut flush draw) 对比 J♠T♠ (busted second-flush/straight draw)。

运作中的原则是:偏爱那些阻断你试图 fold 掉的 calls 并让 folds 活跃的 busted combo。在实践中, solvers 会在这里诈唬一个 mix,但选择正是由这种移除计算驱动的——而不是由“哪个听牌最可惜地落空了”驱动。将大小输入 shadepoker 的 alpha/MDF 助手,你会看到 overbet 大约需要三个 bluff combos 对两个 value combos;你的任务是 用最好的阻断 busted hands 填补这三个空位。

范例2 — 一张牌决定的 hero-call

你在 big blind 位防守并在 Q♥ J♥ 5♣ 8♦ 3♠ 的牌面上 check-call 到河牌。 villain 在河牌下注一个极化的 three-quarter pot (\(s = 0.75\)),所以根据表格,如果他平衡的话,他代表的 range 大约是 43% bluffs (value:bluff = 4:3, 你这边的 MDF = 0.571)。红心牌落空, straight draws (T9T797) 落空。

你持有两手强度相似的候选 bluff-catchers:Q♥9♥ (顶对,持有两张红心) 对比 Q♠9♣ (顶对,没有红心)。

相同的对子,相同的 kicker 类别,却做出相反的决定——完全取决于每手牌从 villain range 中移除了哪些 combos。这就是河牌的一个例子:原始强度是起点,牌面移除是裁决。

付诸实践

河牌奖励一种特定的纪律:停止问“我的牌好吗?”并开始问三个精确的问题。

  1. 我是 value 还是 bluff? 河牌上没有中间地带;如果你下注,就选一边。
  2. 在我选择的大小下,bluff 比例 (alpha) 和 value:bluff 比率是多少? 使用 \(\alpha = s/(1+s)\)。更大的大小,更多的 bluffs,value-to-bluff 比率更偏向 bluffs。
  3. 具体是哪些 combos? 用那些阻断 villain 跟注牌并 unblock 他 fold 牌的 busted hands 进行诈唬;用那些 unblock 他跟注牌的牌进行 value-bet;只用那些阻断 villain value 牌并 unblock 他 bluffs 的 bluff-catchers 进行 hero-call

而在防守时:以 \(\text{MDF} = 1 - \alpha\) 作为你的 no-exploit 底线,然后针对那些在河牌 under-bluffs 的 pool(坦白说,大多数 pool 大部分时间都是如此)进行 更紧的 偏离。数学给你基线;读牌告诉你偏离多少。

这些都是小计算,但在牌桌压力下很容易出错。使用 shadepoker 的 底池大小计算器进行数百次练习——输入下注大小并读出 alpha、MDF 和你被要求的价格——可以培养实时执行这些计算的直觉。目标不是每手牌都现场计算;而是经常进行算术,以至于正确的 combo 计数和正确的 blocker 看起来就是 正确 的。

河牌是直觉最容易出错的地方,因为没有什么可以再听牌,而一切都可能输掉。用 combo 计数和阻断牌逻辑取代直觉,最难的街就会变成最容易解决的。这里的纪律比游戏中的任何地方都更有价值——正是因为很少有玩家费心去计算。