ICM от первых принципов: Как Малмут-Харвилл превращает фишки в доллары
Фишки на финальном столе — это не деньги, а лотерейные билеты с уменьшающейся отдачей. Вот точный алгоритм, который превращает Stack в долларовое выражение, выведенный с нуля и продемонстрированный на реальных числах.
Каждый турнирный игрок слышал лозунг: «Ваши фишки не стоят своей номинальной стоимости». Его повторяют на финальных столах, как священное писание, обычно прямо перед тем, как кто-то делает плохой Call и винит Variance. Но этот лозунг не фольклор — это теорема. Существует точный, вычислимый алгоритм, который принимает вектор Stacks и структуру Payout и возвращает долларовое значение для каждого места. Этот алгоритм — Independent Chip Model, и его наиболее широко используемая версия — это Malmuth-Harville.
Если вы понимаете ICM как «черный ящик» — «калькулятор говорит Fold» — вы будете принимать правильные решения в простых ситуациях и ошибаться в сложных. Если же вы понимаете его как алгоритм, вы сможете восстановить его за столом, предвидеть, когда он перестанет работать, и точно знать, почему Chip Leader за финальным столом «беднее», чем предполагает его Stack, а Short Stack «богаче», чем свой. Эта статья чисто выводит модель, демонстрирует конкретный пример с четырьмя игроками с явными числами, сравнивает Malmuth-Harville с его менее известным «кузеном» Malmuth-Weitzman, а затем показывает, где заканчивается статический ICM и начинается Future Game Simulation.
Основная проблема: Фишки нелинейны по отношению к деньгам
В Cash Game фишка — это доллар. Stack EV и Money EV — это один и тот же объект, поэтому Cash стратегия сводится к максимизации выигранных фишек за руку. Турниры разрывают эту связь. Вы не можете обналичить фишки; вы можете только конвертировать свою финишную позицию в Payout. И структура Payout вогнута — за первое место платят гораздо меньше пропорциональной стоимости всех фишек в игре.
Конкретно: в типичной структуре первое место может составлять 50% призового фонда при удержании 100% фишек в конце. Эти 50 процентных пунктов «недостающей» Equity не исчезли — они были распределены между всеми остальными по ходу игры, пропорционально их шансам пересидеть других игроков. Вся задача ICM состоит в том, чтобы выяснить, как разделить фиксированный призовой фонд между оставшимися игроками, основываясь только на их текущих Chip Counts.
Слово «Independent» (независимый) в названии указывает на центральное упрощающее допущение: ICM рассматривает вероятности финиша так, как будто они зависят только от Chip Counts, игнорируя Position, Skill, Blind Level и будущую игру. Это допущение ошибочно в деталях, но полезно в совокупности — подробнее об этом, когда мы доберемся до FGS.
Модель Малмута-Харвилла
Малмут-Харвилл основывается на одной четкой аксиоме:
Вероятность того, что данный игрок финиширует первым, равна его доле от общего количества фишек в игре.
Если игрок i держит Stack \(s_i\), а общее количество фишек в игре равно \(T\), то:
\[P(i \text{ finishes 1st}) = \dfrac{s_i}{T}\]
Это и есть весь механизм. Все остальное — это учет.
Элегантная часть заключается в том, как он обрабатывает более низкие финишные позиции. Как только вы определили, кто финиширует первым, этот игрок и его фишки исключаются из рассмотрения, и вы задаете тот же вопрос оставшемуся полю с оставшимися фишками. Вероятность того, что игрок j финиширует вторым, — это вероятность того, что кто-то другой финиширует первым, умноженная на вероятность того, что j «выигрывает» суб-турнир среди выживших.
Формально, вероятность того, что j финиширует вторым, — это сумма по каждому возможному финишировавшему первым k (где k ≠ j):
\[P(j \text{ is 2nd}) = \sum_{k \neq j} P(k \text{ is 1st}) \cdot \dfrac{s_j}{T - s_k}\]
Прочитайте это внимательно. При условии, что k финиширует первым, фишки k выходят из пула, новый общий Stack составляет \(T - s_k\), и в этом уменьшенном поле игрок j финиширует «первым» (то есть вторым в целом) с вероятностью \(s_j / (T - s_k)\). Суммируйте по каждому способу, которым может быть занято первое место, и вы получите точную вероятность второго места для j.
Третье место рекурсивно углубляется на один уровень: суммируйте по всем упорядоченным парам (1-е, 2-е) финишировавших игроков, удалите оба Stacks и вычислите долю j от оставшихся-оставшихся фишек. В общем, вы перечисляете порядки финиша, взвешиваете каждый порядок его вероятностью по Malmuth-Harville и аккумулируете. Для n оставшихся игроков существует n! порядков — это тривиально для финального стола из девяти (362 880 порядков, миллисекунды вычислений), поэтому ICM на реальном финальном столе является точным, а не приблизительным.
Ваша долларовая Equity
Как только вы получили полное распределение финишей — для каждого игрока, вероятность финиша 1-м, 2-м, 3-м и т.д. — конвертация в деньги является скалярным произведением. Пусть \(\text{pay}[r]\) будет Payout за финиш на позиции r. Тогда:
\[\text{EV}(i) = \sum_r P(i \text{ finishes in position } r) \cdot \text{pay}[r]\]
Эта единственная строка — главный результат модели: ваша турнирная Equity в долларах — это сумма по каждой финишной позиции вероятности того, что вы займете эту позицию, умноженная на выплату за эту позицию. ICM — это не что иное, как принципиальный способ вычисления этих вероятностей.
Конкретный пример с четырьмя оставшимися игроками
Теория лучше усваивается на числах. Осталось четыре игрока. Stacks и призовой фонд в $10,000 с выплатами 50 / 30 / 15 / 5:
| Игрок | Stack | Доля фишек | Payout за этот финиш | |---|---|---|---| | A | 5,000 | 50% | 1-е место = $5,000 | | B | 3,000 | 30% | 2-е место = $3,000 | | C | 1,500 | 15% | 3-е место = $1,500 | | D | 500 | 5% | 4-е место = $500 | | Итого | 10,000 | 100% | Pool = $10,000 |
Обратите внимание на намеренную ловушку в этой настройке: Payout (50/30/15/5) точно отражают доли фишек (50/30/15/5). Если бы фишки были линейны по отношению к деньгам, $EV каждого игрока равнялся бы его доле фишек в долларах: A = $5,000, B = $3,000, C = $1,500, D = $500. ICM покажет, что ни одно из этих утверждений неверно.
Шаг 1 — P(1st) — это просто доля фишек
Прямо из аксиомы, и сумма точно равна 1:
- P(A 1st) = 5000/10000 = 0.5000
- P(B 1st) = 3000/10000 = 0.3000
- P(C 1st) = 1500/10000 = 0.1500
- P(D 1st) = 500/10000 = 0.0500
(0.5000 + 0.3000 + 0.1500 + 0.0500 = 1.0000.) ✓
Шаг 2 — Одна рабочая ветвь P(2nd)
Давайте вручную вычислим P(D финиширует 2-м), суммируя по тем, кто мог финишировать первым:
- A 1st (вероятность 0.5), затем D выигрывает остаток: доля D от \(T - 5000 = 5000\) составляет \(500/5000 = 0.1\). Вклад: 0.5 × 0.1 = 0.05000
- B 1st (вероятность 0.3), затем доля D от \(10000 - 3000 = 7000\) составляет \(500/7000 \approx 0.0714\). Вклад: 0.3 × 0.0714 = 0.02143
- C 1st (вероятность 0.15), затем доля D от \(10000 - 1500 = 8500\) составляет \(500/8500 \approx 0.0588\). Вклад: 0.15 × 0.0588 = 0.00882
Сумма: 0.05000 + 0.02143 + 0.00882 = 0.08025. Таким образом, D, имея 5% фишек, финиширует вторым примерно в 8% случаев. Та же рекурсия, примененная к каждому игроку (здесь вычислено полным перечислением всех 24 порядков), дает полную таблицу распределения финишей ниже. Колонка 1-го места точна по аксиоме; колонки 2-го/3-го/4-го места — это правильная рекурсия Малмута-Харвилла, округленная:
| Игрок | P(1-е место) | P(2-е место) | P(3-е место) | P(4-е место) | |---|---|---|---|---| | A | 0.5000 | 0.3288 | 0.1456 | 0.0255 | | B | 0.3000 | 0.3687 | 0.2613 | 0.0699 | | C | 0.1500 | 0.2222 | 0.4197 | 0.2081 | | D | 0.0500 | 0.0803 | 0.1733 | 0.6965 |
Каждая строка суммируется до 1.0, и каждый столбец суммируется до 1.0 — оба являются проверками на адекватность, которые модель должна пройти. Обратите внимание, как Short Stack D с подавляющей вероятностью выбывает первым (69.65%), но это больше не гарантировано: выживание является вероятностным до самого конца.
Шаг 3 — Конвертация в доллары
Умножьте распределение финишей каждого игрока на вектор Payout [5000, 3000, 1500, 500]:
| Игрок | Доля фишек | «Фишечная Equity» $ (линейная) | ICM $EV | Разница с фишками | |---|---|---|---|---| | A | 50% | $5,000 | $3,717.74 | −$1,282.26 | | B | 30% | $3,000 | $3,033.17 | +$33.17 | | C | 15% | $1,500 | $2,150.19 | +$650.19 | | D | 5% | $500 | $1,098.89 | +$598.89 | | Итого | 100% | $10,000 | $10,000.00 | 0 |
Доллары суммируются обратно к полному призовому фонду в $10,000 — Equity сохраняется, никогда не создается и не уничтожается. В этом суть всей модели, выраженная в простых числах:
- Chip Leader A стоит $3,718, а не $5,000. Имея половину фишек, A получает лишь 37% призового фонда в ожидании. Примерно $1,282 «стоимости фишек» перетекли к более мелким Stacks.
- Short Stack D стоит $1,099, а не $500 — более чем в два раза больше своей доли фишек. Имея 5% фишек, D распоряжается почти 11% денег.
Это не особенность этих конкретных Stacks; это структурная особенность. Вогнутость структуры Payout плюс тот факт, что даже Stack из одной фишки гарантирует какую-то финишную позицию, означает, что Short Stacks систематически переоценены в долларах относительно фишек, а Big Stacks систематически недооценены. Все «притягиваются к середине» шкалы выплат.
Почему это меняет вашу игру
Практическое следствие выражается одной фразой: risk premium. Поскольку ваши последние проигранные фишки стоят больше (в $) , чем следующие выигранные фишки, безубыточная Equity для Stack-off поднимается выше наивной Chip-EV безубыточности. Ситуация, которая является очевидным Call по Chip-EV, может быть очевидным Fold по ICM.
Рассмотрим ситуацию Chip Leader A через призму вышесказанного: A, рискуя фишками против среднего Stack, ставит доллары по невыгодному курсу — A платит полную стоимость маржинальных фишек при проигрышах, но получает дисконтированную стоимость маржинальных фишек при выигрышах, потому что удвоение не удваивает деньги A (A уже находится близко к вершине кривой). Short Stack D, напротив, имеет низкий risk premium против больших Stacks: фишками D дешево рисковать, потому что его даунсайд мал и хорошо компенсируется Laddering Equity. Это математическая основа для утверждений «Big Stacks должны давить, но не против другого Big Stack» и «ICM pressure сильнее всего давит на средние Stacks» — средние Stacks имеют наибольшую Ladder Equity для потери и наименьшую для получения.
Вам не нужно гадать. Введите Stacks и Payouts в Калькулятор ICM shadepoker, считайте $EV каждого места, и risk premium для любого данного противостояния будет виден при сравнении долларовой Equity до/после выигрыша против выбывания. Этот долларовый Swing до/после — а не фишечный Swing — это число, с которым должно соотноситься ваше решение на River.
Малмут-Харвилл против Малмута-Вайцмана
Малмут-Харвилл является стандартным во всех коммерческих ICM-инструментах, но это не единственная модель порядка финиша. Малмут-Вайцман отвечает на тот же вопрос — учитывая Chip Counts, каково распределение финишей — с другим правилом обусловливания.
Различие заключается в том, как выводятся более низкие места. Харвилл строит распределение вперед: фиксирует, кто финиширует первым (вероятность = доля фишек), удаляет их, рекурсивно обрабатывает выживших. Вайцман же рассуждает снизу вверх — моделируя вероятность финиша последним как обратно пропорциональную Stack фишек, а затем рекурсивно поднимаясь вверх по порядку выбывания. Две модели полностью совпадают по P(1st) и в случае двух игроков, но они присваивают немного разные вероятности средним финишным позициям в более крупных полях и, следовательно, немного разные долларовые Equity.
Что «правильно»? Ни одна из них не является эмпирически совершенной — обе являются упрощениями реального процесса выбывания, который зависит от Blinds, Position и Skill. Харвилл выиграл конкурс популярности, потому что его прямая рекурсия интуитивна, быстра и приемлемо хорошо соответствует наблюдаемым турнирным данным. Вайцман, как правило, немного более пессимистичен для Big Stacks и немного более добр к Short Stacks, чем Харвилл. Разногласия реальны, но обычно невелики по сравнению с ошибкой моделирования, которую обе модели разделяют относительно реальности. Для практических целей: знайте, что «ICM» почти всегда означает Малмута-Харвилла, знайте, что Вайцман существует как принципиальная альтернатива, и не мучайтесь из-за различий во втором знаке после запятой между ними — они ничтожны по сравнению с допущениями, которые делают обе модели.
За пределами статического ICM: Future Game Simulation
Вот честное ограничение. Статический ICM предполагает, что турнир завершается без дальнейшей игры — как будто распределение финишей кристаллизуется в тот момент, когда вы замораживаете Stacks. Он содержит две фикции:
- Нет будущих рук. Blinds не увеличиваются, Antes не истощают Stacks, никто не Open-Shove в кого-либо. Фишки рассматриваются как фиксированная лотерея.
- Нет Skill. Каждый игрок идентичен. Регуляр мирового класса и рекреационный игрок с одним и тем же Stack получают одинаковую Equity. Position относительно Button — огромное преимущество Short Stack — невидима для модели.
Эти фикции наиболее важны, когда остается много будущей игры: более глубокие Stacks, большие Blinds относительно Stacks и Button, который обойдет несколько раз, прежде чем кто-либо Bust. Статический ICM систематически неправильно оценивает эти ситуации, потому что он игнорирует позиционные преимущества и преимущества инициативы, которые накапливаются в течение следующего Orbit.
Future Game Simulation (FGS) — это уточнение. Вместо замораживания Stacks, FGS симулирует следующие k рук игры — обычно небольшой Lookahead от одной до четырех рук — используя упрощенную стратегию (часто Push/Fold или модель, полученную Solvers) для того, как будут разыгрываться Blinds, и только затем применяет статический ICM к полученному распределению Stacks. По сути, FGS позволяет фишкам «играть вперед» немного, прежде чем конвертировать их в доллары, захватывая ценность Position и стоимость скорой постановки Blinds.
Выгода: FGS вознаграждает за наличие Position на Short Stack, наказывает за скорую постановку Big Blinds с маргинальным Holding и в целом смягчает некоторые из самых жестких Fold статического ICM в ситуациях, где вы сможете использовать свой Skill и Position до того, как кто-либо будет устранен. Стоимость — это вычисления и сложность моделирования: симуляция так же хороша, как и стратегия, которую вы предполагаете для этих будущих рук, а пространство состояний быстро взрывается с глубиной Lookahead, поэтому глубины FGS остаются неглубокими. Думайте о FGS как о статическом ICM плюс короткий, принципиальный взгляд на следующий Orbit. Для решений на финальном столе и Bubble, где будущая игра ограничена, статический Малмут-Харвилл уже превосходен; для более глубоких Pay-Jump ситуаций средней стадии, FGS значительно корректирует его.
Вывод
ICM — это не ощущение. Это конкретный алгоритм: P(1st) равно доле фишек, более низкие места следуют путем удаления более высоких финишировавших и рекурсии, а ваша долларовая Equity — это распределение финишей, умноженное на Payout Ladder. Запустите его на любой ситуации с четырьмя игроками, и каждый раз будет проявляться та же структурная истина — Chip Leader стоит меньше своего Stack, Short Stack стоит больше, а средние Stacks — это те, кого модель сжимает сильнее всего.
Игроки, которые это усваивают, не просто «играют Tight на Bubble». Они оценивают каждый All-in относительно долларового Swing, а не фишечного Swing, они знают, когда их risk premium позволяет им Gamble, а когда сковывает, и они точно понимают, какие допущения модели вот-вот нарушатся — это тот момент, когда нужно опираться на FGS или чистое суждение. Этот разрыв между отношением к фишкам как к деньгам и знанием точного обменного курса — это разрыв между Min-Cash и результатами финального стола. Введите реальную ситуацию в ICM-калькулятор shadepoker, прочитайте долларовые Equity и начните делать это преобразование своей второй натурой.