리버 결정: 폴러리제이션, 블로커, 그리고 블러프-밸류 알파 공식

리버는 직관이 가장 많이 실패하고 규율이 가장 많이 보상받는 곳입니다. 여기 이를 지배하는 이론, 즉 폴러리제이션, 알파 공식, MDF, 그리고 추측을 계산으로 바꾸는 블로커 논리가 있습니다.

리버는 카드가 더 이상 말을 하지 않는 유일한 스트릿입니다. 더 이상의 턴도, 실현할 equity도, 쫓아갈 implied odds도 없습니다. 모든 핸드가 끝났습니다: 그것은 최고의 핸드이거나 그렇지 않거나 둘 중 하나입니다. 이러한 최종성은 리버를 No-Limit Hold'em에서 가장 높은 레버리지와 가장 어려운 스트릿으로 만드는 정확한 이유입니다. 팟은 가장 커지고, 실수는 가장 비싸지며, '나는 outs가 있어'라는 편안한 안개는 완전히 걷혔습니다.

이전 스트릿에서는 대략적으로 플레이하고 생존할 수 있습니다. 리버에서는 모든 결정에서 대략적인 플레이가 칩을 잃게 하며, 토너먼트 그라인드나 캐시 샘플에서 수천 개의 스팟에 걸쳐 규모를 키우면 그 칩 손실은 승리하는 플레이어와 본전치기 플레이어의 차이가 됩니다. 좋은 소식은 리버 플레이가 신비주의를 벗겨내면 게임에서 가장 기계적인 부분 중 하나라는 것입니다. 그것은 두 가지 작은 공식에 의해 지배되는 콤보 카운팅과 블로커 논리입니다. 이 공식들을 완벽하게 익히면 직관이 가장 신뢰할 수 없는 곳에서 직관을 산술로 대체할 수 있습니다.

리버가 폴러인 이유

플롭과 턴에서, 베팅 Range는 넓고 혼합되어 있습니다. 많은 핸드들이 equity를 가지고 있기 때문입니다 — 그들은 밸류도 아니고 에어도 아니며, 폴딩 Equity, 상대에게 개선될 기회를 부정하고 다음 카드를 볼 권리로부터 이득을 얻는 드로우와 중간 강도 핸드들입니다. 리버는 이 모든 것을 제거합니다. 더 이상 카드는 없습니다. 핸드는 '개선'될 수 없으며, 부정할 것도 없습니다.

따라서 리버는 모든 홀딩 핸드를 다음 두 가지 범주 중 하나로 축소시킵니다:

Value: 더 안 좋은 핸드에게 콜 받고 싶어하는 핸드.
Bluffs: 빌런의 콜 Range에서 아무것도 이기지 못하며, 빌런이 폴드해야만 이기는 핸드.

그 중간의 모든 것 — 세컨드 페어, 버스트 드로우, 약한 메이드 핸드 — 은 혼합된 의미의 '베팅 핸드'가 아닙니다. 그것은 밸류 베팅하기에 충분히 강하거나 (더 안 좋은 핸드에게 콜 받음), 블러프 후보이거나 (콜 받으면 지므로, 더 좋은 핸드를 폴드시키기 위해 베팅함), 아니면 체크합니다. 리버에는 세 번째 것은 없습니다. 이것이 바로 폴러리제이션이며, 스타일적인 선택이 아니라 스트릿의 구조에 의해 강제됩니다.

실질적인 결과: 당신의 리버 베팅 Range는 폴러(강한 밸류 + 선택된 블러프)여야 하며, 중간 강도 핸드는 체크하여 블러프 캐처가 됩니다. 그렇다면 흥미로운 질문은 순전히 양적인 것입니다: 밸류에 비해 몇 개의 블러프를 해야 하는가, 그리고 어떤 특정 콤보가 각 역할을 채우는가. 이 두 가지 질문에 대해 이 기사의 나머지 부분에서 답합니다.

알파 공식: 블러프는 몇 개?

\(s\)를 팟의 비율로 표현한 베팅 사이즈라고 합시다 (하프 팟 베팅은 \(s = 0.5\), 팟 사이즈 베팅은 \(s = 1\), 팟 2배 오버벳은 \(s = 2\)).

당신이 베팅할 때, 상대방에게 콜에 대한 가격을 제시하는 것입니다. 상대방은 \(s\)를 걸고 \(1 + s\) (기존 팟 1에 당신의 베팅 \(s\)를 더한 값)를 얻기 위해 위험을 감수합니다. 당신이 충분히 드물게 블러프하지 않는 한, 상대방의 콜은 수익성이 있습니다. 순수한 블러프 캐처로 콜과 폴드 사이에서 정확히 무관심하게 만드는 빈도는 다음과 같습니다:

\[\alpha = \dfrac{s}{1 + s}\]

이 \(\alpha\)는 당신의 베팅 Range 중 블러프가 차지해야 하는 비율입니다. 주의 깊게 읽으세요 — 이것은 베팅 중 블러프의 비중이지, 밸류 대 블러프 비율이 아닙니다. 이 두 가지를 혼동하는 것은 리버 이론에서 가장 흔한 오류이므로, 우리는 이들을 엄격하게 분리할 것입니다.

만약 블러프가 베팅 Range의 \(\alpha\)라면, 밸류는 \(1 - \alpha\)이고, 밸류 대 블러프 비율은 \((1 - \alpha) : \alpha\)입니다. 표준적인 사이즈로 계산해 봅시다:

하프 팟, \(s = 0.5\): \(\alpha = 0.5 / 1.5 = 1/3\). 블러프는 당신 베팅의 3분의 1입니다. 밸류는 3분의 2입니다. 밸류:블러프 = 2:1 — 대략 두 개의 밸류 콤보마다 하나의 블러프입니다.
팟, \(s = 1\): \(\alpha = 1 / 2 = 1/2\). 블러프는 당신 베팅의 절반입니다. 밸류:블러프 = 1:1.
팟 2배 오버벳, \(s = 2\): \(\alpha = 2 / 3\). 블러프는 당신 베팅의 3분의 2입니다. 밸류:블러프 = 1:2 — 이 사이즈에서는 밸류 베팅보다 블러프를 두 배 더 자주 합니다.

"더 큰 베팅, 더 많은 블러프" 뒤에 숨겨진 직관은 위험 가격 책정입니다. 더 큰 베팅은 각 블러프에 당신 칩의 더 많은 부분을 위험에 빠뜨리므로, 본전을 뽑기 위해 더 자주 성공해야 합니다 — 이는 당신이 더 많은 블러프를 수익성 있게 실행할 수 있다는 의미입니다. 왜냐하면 더 큰 사이즈는 빌런의 Range 중 더 많은 부분을 폴드시키기 때문입니다. 오버벳은 블러프 중심의 무기이며, 이것이 바로 당신이 그것을 뒷받침할 넛 콤보가 필요한 이유입니다; 그것이 없다면, 당신은 단순히 허용되지 않는 가격에 오버-블러핑하고 있는 것입니다.

반대편: 콜러를 위한 MDF

베터의 \(\alpha\)는 수비자에게 거울상처럼 적용됩니다. 베터가 모든 정크 핸드로 블러프하여 자동으로 이득을 취하는 것을 막으려면, 콜러는 충분히 자주 계속해야 합니다. 최소 방어 빈도 (MDF)는 다음과 같습니다:

\[\text{MDF} = \dfrac{\text{pot}}{\text{pot} + \text{bet}} = \dfrac{1}{1 + s} = 1 - \alpha\]

마지막 동일성은 우아한 부분입니다: MDF = 1 - alpha. 콜러는 그럴듯하게 계속할 수 있는 핸드의 \(1 - \alpha\)를 방어하고, 최대 \(\alpha\)만큼 폴드합니다. 만약 그가 \(\alpha\)보다 더 많이 폴드한다면, 순수한 블러프는 돈을 찍어내고 베터는 모든 정크 콤보로 블러프해야 합니다. 만약 그가 과도하게 방어한다면, 얇은 밸류 베팅은 공짜가 됩니다.

MDF에 대한 두 가지 주의사항. 첫째, 그것은 익스플로잇 방지 기준점이지 맹목적으로 따라야 할 목표가 아닙니다 — 리버에서 블러프를 덜 하는 빌런(솔직히 말해 미드-스테이크 풀 전체)에 대해서는 MDF가 허용하는 것보다 더 많이 폴드해야 합니다. 왜냐하면 무관심 수학은 베터가 실제로 \(\alpha\)로 블러프하고 있다고 가정하기 때문입니다. 둘째, MDF는 블러프를 이길 수 있는 Range로 리버에 도달하는 핸드에 대해 정의됩니다; 그것은 '시작 핸드 Range의 X%를 방어하라'가 아닙니다. 그것은 실제 리버 도달 Range에 대한 빈도입니다.

마스터 테이블

위의 모든 내용은 하나의 테이블로 요약됩니다. 관계는 정확합니다: \(\alpha = s/(1+s)\), \(\text{MDF} = 1/(1+s) = 1 - \alpha\), 그리고 밸류:블러프는 \((1 - \alpha) : \alpha\)입니다.

| 베팅 사이즈 (s, 팟 대비) | alpha = 베팅 중 블러프 비율 | 밸류 : 블러프 | 콜러 MDF (= 1 - alpha) | |---|---|---|---| | 0.33 (팟 1/3) | 0.250 | 3 : 1 | 0.750 | | 0.50 (하프 팟) | 0.333 | 2 : 1 | 0.667 | | 0.75 (팟 3/4) | 0.429 | 4 : 3 | 0.571 | | 1.00 (팟) | 0.500 | 1 : 1 | 0.500 | | 1.50 (팟 1.5배) | 0.600 | 2 : 3 | 0.400 | | 2.00 (2배 오버벳) | 0.667 | 1 : 2 | 0.333 |

기준점을 다시 확인해 봅시다: 하프 팟은 \(\alpha = 0.333\)과 \(\text{MDF} = 0.667\)을 제공합니다; 팟 사이즈는 \(0.5 / 0.5\)를 제공합니다; 2배 오버벳은 \(0.667 / 0.333\)을 제공합니다. 블러프 비율과 콜러의 폴드 허용치는 동일한 숫자 — \(\alpha\) —이며, 이것이 리버의 전체 대칭성입니다.

실제로 이 비율을 세는 것에 대한 참고사항: 이들은 핸드 클래스가 아닌 콤비네이션에 적용됩니다. 하프 팟에서 "밸류 두 개당 블러프 하나"는 이 라인을 타는 밸류 콤보가 12개 있다면, 대략 6개의 블러프 콤보를 원한다는 의미입니다 — "하나의 블러핑 핸드 타입"이 아닙니다. 콤보를 세는 것이 전체 규율입니다; 다음으로 어떤 콤보를 사용할지 살펴보겠습니다.

블로커: 어떤 콤보가 각 역할을 채우는가

예를 들어, 6개의 블러프 콤보를 원한다는 것을 알아도 어떤 6개인지는 알려주지 않습니다. 여기서 블로커가 리버를 빈도 연습에서 카드 제거 연습으로 바꿉니다. 블로커는 빌런의 Range에서 특정 콤보를 제거하는 당신의 핸드에 있는 카드입니다; 언블로커는 그러한 카드가 없어서 해당 콤보들이 빌런의 Range에 살아있게 만드는 것입니다.

논리는 역할에 따라 명확하게 나뉩니다.

블러프 선택하기

블러프할 때, 당신은 빌런이 폴드하기를 원합니다. 따라서 이상적인 블러프는 다음과 같습니다:

빌런의 밸류/콜 콤보를 블록한다 — 당신은 콜할 가능성이 가장 높은 핸드를 제거하는 카드를 가지고 있어, 폴드를 더 가능성 있게 만듭니다.
빌런의 폴드 콤보를 언블록한다 — 당신은 빌런이 폴드할 버스트 드로우와 에어를 구성하는 카드를 가지고 있지 않으므로, 이 콤보들은 그의 Range에 완전히 살아있고 실제로 폴드할 수 있습니다.

고전적인 실수는 단순히 "쇼다운 밸류가 없다"는 이유로 버스트 드로우로 블러프하는 것입니다. 그것은 필요하지만 충분하지는 않습니다. 당신의 버스트 핸드 중 최고의 블러프는 특정 카드가 넛을 블록하고 폴드를 언블록하는 핸드입니다. 예를 들어, 넛 밸류를 블록하는 에이스를 함께 가지고 있는 버스트 플러시 드로우는 그 블로커가 없는 동일한 버스트 드로우보다 훨씬 더 나은 블러프입니다 — 왜냐하면 빌런의 가장 강한 콜을 덜 가능성 있게 만들기 때문입니다.

밸류 베팅 선택 (그리고 얇게 베팅 사이즈 조절)

밸류 베팅할 때, 당신은 빌런이 콜하기를 원합니다. 따라서 블로커 논리는 반대가 됩니다:

빌런의 콜을 언블록한다 — 당신은 그의 콜 Range를 구성하는 카드가 당신의 핸드에 있지 않고, 그의 Range에 가능하도록 만들기를 원합니다. 만약 당신이 그가 콜하는 데 필요한 바로 그 카드들을 가지고 있다면, 당신은 자신의 액션을 블록한 것입니다.

이것이 얇은 밸류 베팅이 무엇을 블록하지 않는지에 따라 사이즈가 정해지고 선택되는 이유입니다. 빌런의 모든 더 안 좋은 콜 핸드를 블록하는 핸드로 베팅하는 것은 자멸 행위입니다; 당신이 베팅하면, 그는 당신이 이기는 모든 것을 폴드할 것입니다. 최고의 얇은 밸류는 그가 실제로 가지고 있을 수 있는 더 안 좋은 핸드를 목표로 합니다.

히어로 콜링

수비자의 블로커 논리는 블러퍼의 거울상입니다. 폴러라이즈된 리버 베팅에 직면하여 블러프 캐치를 할지 말지 결정할 때, 콜하기에 적합한 핸드는 빌런의 밸류를 블록하고 그의 블러프를 언블록하는 핸드입니다:

빌런의 예상되는 넛/밸류 콤보를 제거하는 카드를 가지고 있다는 것은, 소거법으로, 그의 베팅 Range의 더 큰 비중이 블러프라는 의미입니다 — 따라서 당신의 블러프 캐처는 더 자주 좋을 것입니다.
반대로, 당신의 블러프 캐처가 그가 블러프했을 버스트 드로우를 블록한다면, 당신은 방정식에서 그의 블러프를 제거하고 그에게 더 많은 밸류를 남기는 것입니다 — 더 나쁜 콜이 됩니다.

따라서 동일한 순수 강도를 가진 두 개의 블러프 캐처는 동일한 콜이 아닙니다. 빌런의 밸류에 대한 블로커를 가진 핸드가 콜이며; 그의 블러프를 블록하는 핸드는 폴드입니다. 이것이 "나는 블러프 캐처를 가지고 있었다"가 결코 콜의 완전한 이유가 될 수 없는 이유입니다 — 어떤 블러프 캐처인가가 전체 질문입니다.

리버 스팟 예시

스팟 1 — 폴러 오버벳, 그리고 어떤 버스트 드로우로 블러프할 것인가

싱글 레이즈 팟, 당신이 버튼에서 레이즈했고, 빅 블라인드가 콜했습니다. 보드는 K♠ 9♠ 4♦ 7♠ 2♥로 나왔습니다. 리버는 백도어 플러시를 망쳤고; 스페이드 드로우는 미스했습니다.

당신은 여기서 폴러 Range로 베팅하려고 하며 오버벳 (\(s \approx 1.5\))을 선택합니다. 이는 테이블에서 밸류:블러프 ≈ 2:3을 의미합니다 — 블러프가 많고, 넛 콤보(셋, 투 페어, 개선된 소수의 Kx)를 백본으로 요구합니다. 이제, 어떤 버스트 핸드로 블러프해야 할까요?

두 후보를 비교해 봅시다: A♠Q♠ (버스트 넛 플러시 드로우) 대 J♠T♠ (버스트 세컨드 플러시/스트레이트 드로우).

A♠Q♠는 A♠를 가지고 있습니다. 이것은 넛 플러시를 블록하지만 — 이 브릭 리버에서는 넛 플러시도 미스했으므로, 플러시는 밸류 클래스가 아닙니다. 더 유용하게는, A♠는 빌런이 블러프로 전환했을 수 있는 Ax 스페이드 콤보를 블록하며, Q는 그의 Kx 콜을 많이 블록하지 않습니다. 괜찮지만 완벽하지는 않은 블러프입니다.
J♠T♠는 밸류를 블록하지 않으며 빌런의 Kx 및 9x 콜 Range를 완전히 언블록합니다. 반면 자신의 버스트 드로우 카드는 빌런이 또한 폴드할 유형입니다. 더 좋은 점은 J와 T를 가지고 있으면 빌런 자신의 미스된 스트레이트 드로우 중 일부를 제거한다는 것입니다 — 이는 혼합된 신호입니다.

적용되는 원칙: 당신이 폴드시키려는 콜을 블록하고 폴드를 살아있게 두는 버스트 콤보를 선호하세요. 실제로는 솔버들이 여기서 혼합하여 블러프하겠지만, 선택은 "어떤 드로우가 가장 슬프게 미스했는가"가 아니라 정확히 이러한 제거 계산에 의해 좌우됩니다. shadepoker의 알파/MDF 헬퍼에 사이즈를 입력하면 오버벳이 대략 두 개의 밸류 콤보마다 세 개의 블러프 콤보를 원한다는 것을 알 수 있습니다; 당신의 임무는 그 세 개의 슬롯을 최고의 블록킹 버스트 핸드로 채우는 것입니다.

스팟 2 — 한 장의 카드로 결정되는 히어로 콜

당신은 빅 블라인드를 방어하고 Q♥ J♥ 5♣ 8♦ 3♠ 보드에서 체크-콜 다운합니다. 빌런은 리버에서 폴러 쓰리쿼터 팟을 베팅합니다 (\(s = 0.75\)). 따라서 테이블에 따르면, 그가 균형 잡혔다면 대략 43%가 블러프인 Range를 나타냅니다 (밸류:블러프 = 4:3, 당신의 MDF = 0.571). 하트는 미스했고, 스트레이트 드로우(T9, T7, 97)는 미스했습니다.

당신은 비슷한 강도의 두 가지 블러프 캐처 후보를 가지고 있습니다: Q♥9♥ (탑 페어, 하트 두 장 보유) 대 Q♠9♣ (탑 페어, 하트 없음).

Q♥9♥는 빌런의 미스된 플러시 블러프를 블록합니다 — 그가 블러프로 배럴했을 X♥X♥ 콤보들이 부분적으로 당신의 핸드에 있습니다. 그의 블러프를 제거함으로써, 당신은 그의 베팅 Range를 더 밸류 지향적으로 만듭니다. 이것은 더 나쁜 블러프 캐처입니다: 당신은 폴드 쪽으로 기울어야 합니다.
Q♠9♣는 모든 버스트 하트 드로우를 언블록하여, 그의 블러프 콤보들을 완전히 살아있게 두고, 반면에 9는 그의 Q9/98 밸류 중 일부를 블록합니다. 이 핸드는 블러프 캐치를 더 잘합니다 — 밸류를 블록하고 블러프를 언블록합니다. 이것이 콜입니다.

같은 페어, 같은 키커 클래스, 반대되는 결정 — 각 핸드가 빌런의 Range에서 어떤 콤보를 제거하는지에 따라 전적으로 결정됩니다. 이것이 한 가지 예시로 본 리버입니다: 순수한 강도는 시작점이고, 카드 제거가 최종 판결입니다.

적용하기

리버는 특정 규율에 보상합니다: "내 핸드가 좋은가?"라고 묻는 것을 멈추고 세 가지 정확한 질문을 시작하세요.

나는 밸류인가 블러프인가? 리버에는 중간이 없습니다; 베팅한다면 한쪽을 선택하세요.
선택한 사이즈에서 블러프 비율 (alpha)과 밸류:블러프 비율은 얼마인가? \(\alpha = s/(1+s)\)를 사용하세요. 사이즈가 커질수록 블러프가 많아지고, 밸류-블러프 비율이 블러프 쪽으로 더 기울어집니다.
정확히 어떤 콤보를 사용해야 하는가? 빌런의 콜을 블록하고 그의 폴드를 언블록하는 버스트 핸드로 블러프하세요; 그의 콜을 언블록하는 핸드로 밸류 베팅하세요; 빌런의 밸류를 블록하고 그의 블러프를 언블록하는 블러프 캐처로만 히어로 콜하세요.

그리고 방어할 때는: \(\text{MDF} = 1 - \alpha\)를 익스플로잇 방지 최저점으로 삼고, 리버에서 블러프를 덜 하는 풀(대부분의 풀에서 대부분의 시간 동안)에 대해서는 더 타이트하게 벗어나세요. 수학은 기준선을 제공하고; 리딩은 그 기준선에서 얼마나 벗어날지 알려줍니다.

이것들은 작은 계산이지만, 압박감 속에서 테이블에서 실수하기 쉽습니다. shadepoker의 팟 사이즈 계산기를 사용하여 몇 백 번 반복 연습하고 — 베팅 사이즈를 입력하고 알파, MDF, 그리고 당신이 제시받는 가격을 읽어내는 — 실시간으로 그것들을 수행하는 본능을 길러줍니다. 목표는 매 핸드마다 라이브로 계산하는 것이 아닙니다; 올바른 콤보 수와 올바른 블로커가 단순히 올바르게 보이도록 충분히 자주 산술을 수행하는 것입니다.

리버는 더 이상 드로우할 것이 없고 잃을 것만 남았기 때문에 직관이 가장 많이 실패하는 곳입니다. 직관을 콤보 카운팅과 블로커 논리로 대체하면, 가장 어려운 스트릿이 가장 해결 가능한 스트릿이 됩니다. 이곳에서의 규율은 게임의 다른 어떤 곳보다 더 많은 보상을 줍니다 — 정확히는 그렇게 세는 것을 귀찮아하는 플레이어가 너무 적기 때문입니다.