纳什均衡

Also known as: Nash, equilibrium strategy, Nash EQ

一种策略组合,其中任何玩家都无法通过单方面改变策略来提高其EV——这是GTO的正式基础。

纳什均衡是一组策略——每个玩家一项——其中每个玩家的策略都是对其他玩家的最佳回应,因此没有玩家可以单独偏离而提高其EV

这是GTO的正式定义:GTO策略是纳什均衡对的一半。

扑克是一种零和游戏(一个玩家的胜利是另一个玩家的损失,减去rake),对于单挑零和游戏,均衡有一个强大的特性:无论对手做什么,每个均衡策略都至少保证游戏价值。这就是为什么GTO策略是不可剥削的。

均衡建立在无差别原则之上:在一个构建良好的均衡中,玩家在关键决策点对其选项感到无差别,这正是混合策略出现的原因——玩家只在多个行动共享相同EV时才进行随机化。

多人底池(3个或更多玩家)更复杂:可能存在多个均衡,并且它们不像单挑均衡那样保证不可剥削。这就是为什么solver在单挑范围对范围的情况下最受信任,以及为什么多人solver的输出被视为指导方针而非金科玉律。

Example

push/fold残局中,纳什均衡已完全解决:在10 bb时,全下玩家和跟注玩家各自有一个固定的Range,使得任何一方都无法有利可图地偏离。纳什Push/Fold图表实际上是一个表格化的纳什均衡。