ICM от первых принципов: Как Малмут-Харвилл превращает фишки в доллары

Фишки на финальном столе — это не деньги, а лотерейные билеты с уменьшающейся отдачей. Вот точный алгоритм, который превращает Stack в долларовое выражение, выведенный с нуля и продемонстрированный на реальных числах.

Каждый турнирный игрок слышал лозунг: «Ваши фишки не стоят своей номинальной стоимости». Его повторяют на финальных столах, как священное писание, обычно прямо перед тем, как кто-то делает плохой Call и винит Variance. Но этот лозунг не фольклор — это теорема. Существует точный, вычислимый алгоритм, который принимает вектор Stacks и структуру Payout и возвращает долларовое значение для каждого места. Этот алгоритм — Independent Chip Model, и его наиболее широко используемая версия — это Malmuth-Harville.

Если вы понимаете ICM как «черный ящик» — «калькулятор говорит Fold» — вы будете принимать правильные решения в простых ситуациях и ошибаться в сложных. Если же вы понимаете его как алгоритм, вы сможете восстановить его за столом, предвидеть, когда он перестанет работать, и точно знать, почему Chip Leader за финальным столом «беднее», чем предполагает его Stack, а Short Stack «богаче», чем свой. Эта статья чисто выводит модель, демонстрирует конкретный пример с четырьмя игроками с явными числами, сравнивает Malmuth-Harville с его менее известным «кузеном» Malmuth-Weitzman, а затем показывает, где заканчивается статический ICM и начинается Future Game Simulation.

Основная проблема: Фишки нелинейны по отношению к деньгам

В Cash Game фишка — это доллар. Stack EV и Money EV — это один и тот же объект, поэтому Cash стратегия сводится к максимизации выигранных фишек за руку. Турниры разрывают эту связь. Вы не можете обналичить фишки; вы можете только конвертировать свою финишную позицию в Payout. И структура Payout вогнута — за первое место платят гораздо меньше пропорциональной стоимости всех фишек в игре.

Конкретно: в типичной структуре первое место может составлять 50% призового фонда при удержании 100% фишек в конце. Эти 50 процентных пунктов «недостающей» Equity не исчезли — они были распределены между всеми остальными по ходу игры, пропорционально их шансам пересидеть других игроков. Вся задача ICM состоит в том, чтобы выяснить, как разделить фиксированный призовой фонд между оставшимися игроками, основываясь только на их текущих Chip Counts.

Слово «Independent» (независимый) в названии указывает на центральное упрощающее допущение: ICM рассматривает вероятности финиша так, как будто они зависят только от Chip Counts, игнорируя Position, Skill, Blind Level и будущую игру. Это допущение ошибочно в деталях, но полезно в совокупности — подробнее об этом, когда мы доберемся до FGS.

Модель Малмута-Харвилла

Малмут-Харвилл основывается на одной четкой аксиоме:

Вероятность того, что данный игрок финиширует первым, равна его доле от общего количества фишек в игре.

Если игрок i держит Stack $s_i$, а общее количество фишек в игре равно $T$, то:

\[P(i \text{ finishes 1st}) = \dfrac{s_i}{T}\]

Это и есть весь механизм. Все остальное — это учет.

Элегантная часть заключается в том, как он обрабатывает более низкие финишные позиции. Как только вы определили, кто финиширует первым, этот игрок и его фишки исключаются из рассмотрения, и вы задаете тот же вопрос оставшемуся полю с оставшимися фишками. Вероятность того, что игрок j финиширует вторым, — это вероятность того, что кто-то другой финиширует первым, умноженная на вероятность того, что j «выигрывает» суб-турнир среди выживших.

Формально, вероятность того, что j финиширует вторым, — это сумма по каждому возможному финишировавшему первым k (где k ≠ j):

\[P(j \text{ is 2nd}) = \sum_{k \neq j} P(k \text{ is 1st}) \cdot \dfrac{s_j}{T - s_k}\]

Прочитайте это внимательно. При условии, что k финиширует первым, фишки k выходят из пула, новый общий Stack составляет $T - s_k$, и в этом уменьшенном поле игрок j финиширует «первым» (то есть вторым в целом) с вероятностью $s_j / (T - s_k)$. Суммируйте по каждому способу, которым может быть занято первое место, и вы получите точную вероятность второго места для j.

Третье место рекурсивно углубляется на один уровень: суммируйте по всем упорядоченным парам (1-е, 2-е) финишировавших игроков, удалите оба Stacks и вычислите долю j от оставшихся-оставшихся фишек. В общем, вы перечисляете порядки финиша, взвешиваете каждый порядок его вероятностью по Malmuth-Harville и аккумулируете. Для n оставшихся игроков существует n! порядков — это тривиально для финального стола из девяти (362 880 порядков, миллисекунды вычислений), поэтому ICM на реальном финальном столе является точным, а не приблизительным.

Ваша долларовая Equity

Как только вы получили полное распределение финишей — для каждого игрока, вероятность финиша 1-м, 2-м, 3-м и т.д. — конвертация в деньги является скалярным произведением. Пусть $\text{pay}[r]$ будет Payout за финиш на позиции r. Тогда:

\[\text{EV}(i) = \sum_r P(i \text{ finishes in position } r) \cdot \text{pay}[r]\]

Эта единственная строка — главный результат модели: ваша турнирная Equity в долларах — это сумма по каждой финишной позиции вероятности того, что вы займете эту позицию, умноженная на выплату за эту позицию. ICM — это не что иное, как принципиальный способ вычисления этих вероятностей.

Конкретный пример с четырьмя оставшимися игроками

Теория лучше усваивается на числах. Осталось четыре игрока. Stacks и призовой фонд в $10,000 с выплатами 50 / 30 / 15 / 5:

| Игрок | Stack | Доля фишек | Payout за этот финиш | |---|---|---|---| | A | 5,000 | 50% | 1-е место = $5,000 | | B | 3,000 | 30% | 2-е место = $3,000 | | C | 1,500 | 15% | 3-е место = $1,500 | | D | 500 | 5% | 4-е место = $500 | | Итого | 10,000 | 100% | Pool = $10,000 |

Обратите внимание на намеренную ловушку в этой настройке: Payout (50/30/15/5) точно отражают доли фишек (50/30/15/5). Если бы фишки были линейны по отношению к деньгам, $EV каждого игрока равнялся бы его доле фишек в долларах: A = $5,000, B = $3,000, C = $1,500, D = $500. ICM покажет, что ни одно из этих утверждений неверно.

Шаг 1 — P(1st) — это просто доля фишек

Прямо из аксиомы, и сумма точно равна 1:

P(A 1st) = 5000/10000 = 0.5000
P(B 1st) = 3000/10000 = 0.3000
P(C 1st) = 1500/10000 = 0.1500
P(D 1st) = 500/10000 = 0.0500

(0.5000 + 0.3000 + 0.1500 + 0.0500 = 1.0000.) ✓

Шаг 2 — Одна рабочая ветвь P(2nd)

Давайте вручную вычислим P(D финиширует 2-м), суммируя по тем, кто мог финишировать первым:

A 1st (вероятность 0.5), затем D выигрывает остаток: доля D от $T - 5000 = 5000$ составляет $500/5000 = 0.1$. Вклад: 0.5 × 0.1 = 0.05000
B 1st (вероятность 0.3), затем доля D от $10000 - 3000 = 7000$ составляет $500/7000 \approx 0.0714$. Вклад: 0.3 × 0.0714 = 0.02143
C 1st (вероятность 0.15), затем доля D от $10000 - 1500 = 8500$ составляет $500/8500 \approx 0.0588$. Вклад: 0.15 × 0.0588 = 0.00882

Сумма: 0.05000 + 0.02143 + 0.00882 = 0.08025. Таким образом, D, имея 5% фишек, финиширует вторым примерно в 8% случаев. Та же рекурсия, примененная к каждому игроку (здесь вычислено полным перечислением всех 24 порядков), дает полную таблицу распределения финишей ниже. Колонка 1-го места точна по аксиоме; колонки 2-го/3-го/4-го места — это правильная рекурсия Малмута-Харвилла, округленная:

| Игрок | P(1-е место) | P(2-е место) | P(3-е место) | P(4-е место) | |---|---|---|---|---| | A | 0.5000 | 0.3288 | 0.1456 | 0.0255 | | B | 0.3000 | 0.3687 | 0.2613 | 0.0699 | | C | 0.1500 | 0.2222 | 0.4197 | 0.2081 | | D | 0.0500 | 0.0803 | 0.1733 | 0.6965 |

Каждая строка суммируется до 1.0, и каждый столбец суммируется до 1.0 — оба являются проверками на адекватность, которые модель должна пройти. Обратите внимание, как Short Stack D с подавляющей вероятностью выбывает первым (69.65%), но это больше не гарантировано: выживание является вероятностным до самого конца.

Шаг 3 — Конвертация в доллары

Умножьте распределение финишей каждого игрока на вектор Payout [5000, 3000, 1500, 500]:

| Игрок | Доля фишек | «Фишечная Equity» $ (линейная) | ICM $EV | Разница с фишками | |---|---|---|---|---| | A | 50% | $5,000 | $3,717.74 | −$1,282.26 | | B | 30% | $3,000 | $3,033.17 | +$33.17 | | C | 15% | $1,500 | $2,150.19 | +$650.19 | | D | 5% | $500 | $1,098.89 | +$598.89 | | Итого | 100% | $10,000 | $10,000.00 | 0 |

Доллары суммируются обратно к полному призовому фонду в $10,000 — Equity сохраняется, никогда не создается и не уничтожается. В этом суть всей модели, выраженная в простых числах:

Chip Leader A стоит $3,718, а не $5,000. Имея половину фишек, A получает лишь 37% призового фонда в ожидании. Примерно $1,282 «стоимости фишек» перетекли к более мелким Stacks.
Short Stack D стоит $1,099, а не $500 — более чем в два раза больше своей доли фишек. Имея 5% фишек, D распоряжается почти 11% денег.

Это не особенность этих конкретных Stacks; это структурная особенность. Вогнутость структуры Payout плюс тот факт, что даже Stack из одной фишки гарантирует какую-то финишную позицию, означает, что Short Stacks систематически переоценены в долларах относительно фишек, а Big Stacks систематически недооценены. Все «притягиваются к середине» шкалы выплат.

Почему это меняет вашу игру

Практическое следствие выражается одной фразой: risk premium. Поскольку ваши последние проигранные фишки стоят больше (в $) , чем следующие выигранные фишки, безубыточная Equity для Stack-off поднимается выше наивной Chip-EV безубыточности. Ситуация, которая является очевидным Call по Chip-EV, может быть очевидным Fold по ICM.

Рассмотрим ситуацию Chip Leader A через призму вышесказанного: A, рискуя фишками против среднего Stack, ставит доллары по невыгодному курсу — A платит полную стоимость маржинальных фишек при проигрышах, но получает дисконтированную стоимость маржинальных фишек при выигрышах, потому что удвоение не удваивает деньги A (A уже находится близко к вершине кривой). Short Stack D, напротив, имеет низкий risk premium против больших Stacks: фишками D дешево рисковать, потому что его даунсайд мал и хорошо компенсируется Laddering Equity. Это математическая основа для утверждений «Big Stacks должны давить, но не против другого Big Stack» и «ICM pressure сильнее всего давит на средние Stacks» — средние Stacks имеют наибольшую Ladder Equity для потери и наименьшую для получения.

Вам не нужно гадать. Введите Stacks и Payouts в Калькулятор ICM shadepoker, считайте $EV каждого места, и risk premium для любого данного противостояния будет виден при сравнении долларовой Equity до/после выигрыша против выбывания. Этот долларовый Swing до/после — а не фишечный Swing — это число, с которым должно соотноситься ваше решение на River.

Малмут-Харвилл против Малмута-Вайцмана

Малмут-Харвилл является стандартным во всех коммерческих ICM-инструментах, но это не единственная модель порядка финиша. Малмут-Вайцман отвечает на тот же вопрос — учитывая Chip Counts, каково распределение финишей — с другим правилом обусловливания.

Различие заключается в том, как выводятся более низкие места. Харвилл строит распределение вперед: фиксирует, кто финиширует первым (вероятность = доля фишек), удаляет их, рекурсивно обрабатывает выживших. Вайцман же рассуждает снизу вверх — моделируя вероятность финиша последним как обратно пропорциональную Stack фишек, а затем рекурсивно поднимаясь вверх по порядку выбывания. Две модели полностью совпадают по P(1st) и в случае двух игроков, но они присваивают немного разные вероятности средним финишным позициям в более крупных полях и, следовательно, немного разные долларовые Equity.

Что «правильно»? Ни одна из них не является эмпирически совершенной — обе являются упрощениями реального процесса выбывания, который зависит от Blinds, Position и Skill. Харвилл выиграл конкурс популярности, потому что его прямая рекурсия интуитивна, быстра и приемлемо хорошо соответствует наблюдаемым турнирным данным. Вайцман, как правило, немного более пессимистичен для Big Stacks и немного более добр к Short Stacks, чем Харвилл. Разногласия реальны, но обычно невелики по сравнению с ошибкой моделирования, которую обе модели разделяют относительно реальности. Для практических целей: знайте, что «ICM» почти всегда означает Малмута-Харвилла, знайте, что Вайцман существует как принципиальная альтернатива, и не мучайтесь из-за различий во втором знаке после запятой между ними — они ничтожны по сравнению с допущениями, которые делают обе модели.

За пределами статического ICM: Future Game Simulation

Вот честное ограничение. Статический ICM предполагает, что турнир завершается без дальнейшей игры — как будто распределение финишей кристаллизуется в тот момент, когда вы замораживаете Stacks. Он содержит две фикции:

Нет будущих рук. Blinds не увеличиваются, Antes не истощают Stacks, никто не Open-Shove в кого-либо. Фишки рассматриваются как фиксированная лотерея.
Нет Skill. Каждый игрок идентичен. Регуляр мирового класса и рекреационный игрок с одним и тем же Stack получают одинаковую Equity. Position относительно Button — огромное преимущество Short Stack — невидима для модели.

Эти фикции наиболее важны, когда остается много будущей игры: более глубокие Stacks, большие Blinds относительно Stacks и Button, который обойдет несколько раз, прежде чем кто-либо Bust. Статический ICM систематически неправильно оценивает эти ситуации, потому что он игнорирует позиционные преимущества и преимущества инициативы, которые накапливаются в течение следующего Orbit.

Future Game Simulation (FGS) — это уточнение. Вместо замораживания Stacks, FGS симулирует следующие k рук игры — обычно небольшой Lookahead от одной до четырех рук — используя упрощенную стратегию (часто Push/Fold или модель, полученную Solvers) для того, как будут разыгрываться Blinds, и только затем применяет статический ICM к полученному распределению Stacks. По сути, FGS позволяет фишкам «играть вперед» немного, прежде чем конвертировать их в доллары, захватывая ценность Position и стоимость скорой постановки Blinds.

Выгода: FGS вознаграждает за наличие Position на Short Stack, наказывает за скорую постановку Big Blinds с маргинальным Holding и в целом смягчает некоторые из самых жестких Fold статического ICM в ситуациях, где вы сможете использовать свой Skill и Position до того, как кто-либо будет устранен. Стоимость — это вычисления и сложность моделирования: симуляция так же хороша, как и стратегия, которую вы предполагаете для этих будущих рук, а пространство состояний быстро взрывается с глубиной Lookahead, поэтому глубины FGS остаются неглубокими. Думайте о FGS как о статическом ICM плюс короткий, принципиальный взгляд на следующий Orbit. Для решений на финальном столе и Bubble, где будущая игра ограничена, статический Малмут-Харвилл уже превосходен; для более глубоких Pay-Jump ситуаций средней стадии, FGS значительно корректирует его.

Вывод

ICM — это не ощущение. Это конкретный алгоритм: P(1st) равно доле фишек, более низкие места следуют путем удаления более высоких финишировавших и рекурсии, а ваша долларовая Equity — это распределение финишей, умноженное на Payout Ladder. Запустите его на любой ситуации с четырьмя игроками, и каждый раз будет проявляться та же структурная истина — Chip Leader стоит меньше своего Stack, Short Stack стоит больше, а средние Stacks — это те, кого модель сжимает сильнее всего.

Игроки, которые это усваивают, не просто «играют Tight на Bubble». Они оценивают каждый All-in относительно долларового Swing, а не фишечного Swing, они знают, когда их risk premium позволяет им Gamble, а когда сковывает, и они точно понимают, какие допущения модели вот-вот нарушатся — это тот момент, когда нужно опираться на FGS или чистое суждение. Этот разрыв между отношением к фишкам как к деньгам и знанием точного обменного курса — это разрыв между Min-Cash и результатами финального стола. Введите реальную ситуацию в ICM-калькулятор shadepoker, прочитайте долларовые Equity и начните делать это преобразование своей второй натурой.