ナッシュ均衡

Also known as: Nash, equilibrium strategy, Nash EQ

どのプレイヤーも一方的に戦略を変更することでEVを改善できない戦略プロファイル — GTOの形式的な基礎。

ナッシュ均衡とは、各プレイヤーの戦略が他のプレイヤーに対する最適応答となる戦略の集合(各プレイヤーにつき1つ)であり、どのプレイヤーも単独で逸脱することでEVを向上させることはできません。これはGTOの根底にある形式的な定義です。GTO戦略はナッシュ均衡ペアの一方を構成します。

ポーカーはゼロサムゲームであり(一人のプレイヤーの勝利は、レーキを差し引いた他のプレイヤーの損失です)、ヘッズアップのゼロサムゲームでは、均衡に強い特性があります。どの均衡戦略も、相手が何をしても少なくともゲームの価値を保証します。これがGTO戦略がアンエクスプロイタブルである理由です。

均衡は無差別から構築されます。うまく構築された均衡では、プレイヤーは重要な意思決定ポイントでの選択肢に対して無差別となり、まさにこれが混合戦略が出現する理由です。プレイヤーは、複数のアクションが同じEVを共有する場合にのみランダム化します。

マルチウェイポット(3人以上のプレイヤー)はより複雑です。複数の均衡が存在しうる上、ヘッズアップの均衡のようにアンエクスプロイタブルであるとは限りません。このため、solverはヘッズアップのRange vs Rangeの状況で最も信頼され、マルチウェイのsolverの出力は金科玉条ではなく、ガイドラインとして扱われます。

Example

push/foldのエンドゲームでは、ナッシュ均衡は完全に解かれています。10 bbの状況で、ショービングプレイヤーとコーリングプレイヤーはそれぞれ固定のRangeを持ち、どちらも利益的に逸脱することはできません。ナッシュpush/foldチャートは、文字通り表形式のナッシュ均衡です。