Ótimo em Teoria dos Jogos (GTO) (GTO)

Also known as: Game Theory Optimal, game theoretically optimal, GTO play

Uma estratégia inexplorável: mesmo que o adversário a veja, ele não consegue lucrar mais do que o equilíbrio contra ela.

GTO é a abreviação de jogar uma estratégia de Equilíbrio de Nash no poker. Uma estratégia GTO é inexplorável: ela defende com frequência suficiente, blefa na proporção correta e equilibra suas Ranges de modo que nenhuma contra-estratégia mostre lucro contra ela. É uma referência defensiva, não um maximizador de lucro — contra oponentes fracos, o exploitative play deliberado rende mais.

O mecanismo principal está todo aqui: defender no MDF para que um apostador não possa lucrar apostando quaisquer duas cartas, apostar em uma proporção de blefe derivada de alpha e tornar os oponentes indiferentes entre suas opções através de estratégias mistas. As referências GTO reais vêm de um solver, calculado range vs range.

Duas ressalvas mantêm os profissionais honestos. Primeiro, o verdadeiro GTO em uma árvore de jogo completa de No-Limit é computacionalmente enorme; solvers o aproximam por spot com abstrações. Segundo, ninguém na mesa está realmente jogando GTO — então o equilíbrio é um quadro de referência para encontrar onde os oponentes se desviam, e então atacar isso, e não um roteiro a ser seguido cegamente. Conheça a base friamente; desvie-se de propósito.

Example

Numa aposta de River do tamanho do pote, GTO diz para apostar 2 de valor : 1 de blefe e o pagador defende \(\tfrac{1}{2}\) dos catadores de blefe. Se você, em vez disso, apostar apenas por valor, você está "GTO" no sentido de inexplorável para valor — mas você deixa dinheiro na mesa que um exploit (blefar demais um pagador que nunca desiste, ou foldar demais um nit) capturaria.