ICM od Podstaw: Jak Malmuth-Harville Zamienia Chipy w Dolary

Chipy przy stole finałowym to nie pieniądze — to losy na loterii o malejących zyskach. Oto dokładny algorytm, który przekształca Stack w kwotę pieniężną, wyprowadzony od podstaw i opracowany na rzeczywistych liczbach.

Każdy gracz turniejowy słyszał hasło: „twoje Chipy nie są warte swojej wartości nominalnej”. Powtarza się je przy stołach finałowych niczym pismo święte, zazwyczaj tuż przed tym, jak ktoś wykona zły Call i obwini za to Variance. Ale to hasło to nie folklor – to twierdzenie. Istnieje dokładny, obliczalny algorytm, który przyjmuje wektor Stacków i strukturę Payoutów, a następnie zwraca wartość dolara dla każdego miejsca. Ten algorytm to Independent Chip Model, a jego najszerzej używana wersja to Malmuth-Harville.

Jeśli rozumiesz ICM jako czarną skrzynkę — „kalkulator mówi Fold” — to łatwe miejsca rozegrasz prawidłowo, a trudne błędnie. Jeśli rozumiesz to jako algorytm, możesz go odtworzyć przy stole, przewidzieć, kiedy się załamie, i dokładnie wiedzieć, dlaczego Chip leader przy stole finałowym jest biedniejszy niż sugeruje jego Stack, podczas gdy Short stack jest bogatszy niż jego. Ten artykuł wyprowadza model w przejrzysty sposób, przedstawia konkretny przykład dla czterech graczy z wyraźnymi liczbami, porównuje Malmuth-Harville z jego mniej znanym kuzynem Malmuth-Weitzman, a następnie pokazuje, gdzie kończy się Static ICM, a zaczyna Future Game Simulation.

Kluczowy Problem: Chipy Nie Są Liniowe w Odniesieniu do Pieniędzy

W cash game Chip to dolar. Stack EV i money EV to ten sam obiekt, dlatego strategia cash sprowadza się do maksymalizacji Chipów wygranych na rękę. Turnieje zrywają to powiązanie. Nie możesz spieniężyć Chipów; możesz jedynie zamienić swoją pozycję końcową na Payout. A struktura Payoutów jest wklęsła — pierwsze miejsce płaci znacznie mniej niż proporcjonalna wartość wszystkich Chipów w grze.

Konkretnie: w typowej strukturze, pierwsze miejsce może stanowić 50% Prize pool, podczas gdy na koniec gracz posiada 100% Chipów. Te 50 punktów procentowych „brakującego” equity nie zniknęło — zostały one rozdystrybuowane wszystkim innym po drodze, proporcjonalnie do ich szans na przetrwanie innych graczy. Całe zadanie ICM polega na ustaleniu, jak podzielić stałą pulę nagród między pozostałych graczy, bazując wyłącznie na ich aktualnych Chip countach.

Słowo „Independent” w nazwie wskazuje na główne upraszczające założenie: ICM traktuje prawdopodobieństwa ukończenia turnieju tak, jakby zależały one wyłącznie od Chip countów, ignorując Position, Skill, Blind level i przyszłą grę. To założenie jest błędne w szczegółach, ale użyteczne w ogólnym rozrachunku — więcej na ten temat, gdy dojdziemy do FGS.

Model Malmuth-Harville

Malmuth-Harville opiera się na jednym, przejrzystym aksjomacie:

Prawdopodobieństwo, że dany gracz zakończy na pierwszym miejscu, jest równe jego udziałowi w łącznej liczbie Chipów w grze.

Jeśli gracz i posiada Stack $s_i$, a łączna liczba Chipów w grze wynosi $T$, to:

\[P(i \text{ finishes 1st}) = \dfrac{s_i}{T}\]

To jest cały silnik. Reszta to tylko księgowość.

Elegancka część polega na tym, jak model radzi sobie z niższymi pozycjami końcowymi. Gdy już ustalisz, kto kończy na pierwszym miejscu, ten gracz i jego Chipy są usuwani z rozważań, a ty zadajesz to samo pytanie pozostałemu polu z pozostałymi Chipami. Prawdopodobieństwo, że gracz j zakończy na drugim miejscu, to prawdopodobieństwo, że ktoś inny zakończy na pierwszym, pomnożone przez prawdopodobieństwo, że j „wygra” sub-turniej wśród ocalałych.

Formalnie, prawdopodobieństwo, że j zakończy na drugim miejscu, jest sumą po każdym możliwym graczu k, który zająłby pierwsze miejsce (przy czym k ≠ j):

\[P(j \text{ is 2nd}) = \sum_{k \neq j} P(k \text{ is 1st}) \cdot \dfrac{s_j}{T - s_k}\]

Przeczytaj to uważnie. Warunkowo na to, że k kończy na pierwszym miejscu, Chipy k opuszczają pulę, nowa suma wynosi $T - s_k$, a w tym zmniejszonym polu gracz j kończy „pierwszy” (tj. drugi ogólnie) z prawdopodobieństwem $s_j / (T - s_k)$. Zsumuj wszystkie sposoby, w jakie pierwsze miejsce mogłoby zostać obsadzone, a otrzymasz dokładne prawdopodobieństwo j na zajęcie drugiego miejsca.

Trzecie miejsce rekurencyjnie schodzi o jeden poziom głębiej: sumuj po wszystkich uporządkowanych parach (1. miejsce, 2. miejsce) graczy, usuń oba Stacki i oblicz udział j w pozostałych Chipach. Ogólnie, wyliczasz kolejność ukończenia, ważysz każdą kolejność jej prawdopodobieństwem Malmuth-Harville i akumulujesz. Dla n pozostałych graczy istnieje n! kolejności — co jest trywialne dla stołu finałowego z dziewięcioma graczami (362 880 kolejności, milisekundy obliczeń), dlatego ICM przy prawdziwym stole finałowym jest dokładne, a nie przybliżone.

Twoje Dollar Equity

Gdy już masz pełną dystrybucję pozycji końcowych — dla każdego gracza, prawdopodobieństwo zajęcia 1., 2., 3. miejsca itd. — konwersja na pieniądze to iloczyn skalarny. Niech $\text{pay}[r]$ będzie Payoutem za zajęcie pozycji r. Wtedy:

\[\text{EV}(i) = \sum_r P(i \text{ finishes in position } r) \cdot \text{pay}[r]\]

Ta pojedyncza linia to główny wynik modelu: Twoje turniejowe equity w dolarach to suma, dla każdej pozycji końcowej, prawdopodobieństwa zajęcia tej pozycji pomnożonego przez Payout dla tej pozycji. ICM to nic więcej niż zasady obliczania tych prawdopodobieństw.

Konkretny Przykład dla Czterech Graczy

Teoria lepiej przyswaja się poprzez liczby. Pozostało czterech graczy. Stacki i Prize pool w wysokości 10 000 USD wypłacone 50 / 30 / 15 / 5:

| Gracz | Stack | Udział Chipów | Payout za tę pozycję | |---|---|---|---| | A | 5,000 | 50% | 1. miejsce = 5 000 USD | | B | 3,000 | 30% | 2. miejsce = 3 000 USD | | C | 1,500 | 15% | 3. miejsce = 1 500 USD | | D | 500 | 5% | 4. miejsce = 500 USD | | Suma | 10,000 | 100% | Pool = 10 000 USD |

Zwróć uwagę na celową pułapkę w tym ustawieniu: Payouty (50/30/15/5) dokładnie odzwierciedlają udziały Chipów (50/30/15/5). Gdyby Chipy były liniowe w stosunku do pieniędzy, $EV każdego gracza byłoby równe ich wartości Chipów: A = 5 000 USD, B = 3 000 USD, C = 1 500 USD, D = 500 USD. ICM pokaże, że żadne z tych twierdzeń nie jest prawdziwe.

Krok 1 — P(1. miejsce) to tylko udział Chipów

Bezpośrednio z aksjomatu, suma wynosi dokładnie 1:

P(A 1. miejsce) = 5000/10000 = 0.5000
P(B 1. miejsce) = 3000/10000 = 0.3000
P(C 1. miejsce) = 1500/10000 = 0.1500
P(D 1. miejsce) = 500/10000 = 0.0500

(0.5000 + 0.3000 + 0.1500 + 0.0500 = 1.0000.) ✓

Krok 2 — Obliczona gałąź P(2. miejsce)

Obliczmy ręcznie P(D kończy na 2. miejscu), sumując po tym, kto mógłby zająć pierwsze miejsce:

A 1. miejsce (prawd. 0.5), wtedy D wygrywa resztę: udział D w $T - 5000 = 5000$ to $500/5000 = 0.1$. Udział: 0.5 × 0.1 = 0.05000
B 1. miejsce (prawd. 0.3), wtedy udział D w $10000 - 3000 = 7000$ to $500/7000 \approx 0.0714$. Udział: 0.3 × 0.0714 = 0.02143
C 1. miejsce (prawd. 0.15), wtedy udział D w $10000 - 1500 = 8500$ to $500/8500 \approx 0.0588$. Udział: 0.15 × 0.0588 = 0.00882

Suma: 0.05000 + 0.02143 + 0.00882 = 0.08025. Zatem D, posiadając 5% Chipów, kończy drugi około 8% czasu. Ta sama rekurencja zastosowana do każdego gracza (tutaj obliczona poprzez pełne wyliczenie wszystkich 24 kolejności) daje kompletną dystrybucję pozycji końcowych poniżej. Kolumna 1. miejsca jest dokładna z aksjomatu; kolumny 2./3./4. miejsca są prawidłową rekurencją Malmuth-Harville, zaokrągloną:

| Gracz | P(1. miejsce) | P(2. miejsce) | P(3. miejsce) | P(4. miejsce) | |---|---|---|---|---| | A | 0.5000 | 0.3288 | 0.1456 | 0.0255 | | B | 0.3000 | 0.3687 | 0.2613 | 0.0699 | | C | 0.1500 | 0.2222 | 0.4197 | 0.2081 | | D | 0.0500 | 0.0803 | 0.1733 | 0.6965 |

Każdy wiersz sumuje się do 1.0, a każda kolumna sumuje się do 1.0 — oba to sprawdzenia poprawności, które model musi przejść. Zauważ, jak Short stack D ma przytłaczająco wysokie prawdopodobieństwo Bustowania jako pierwszy (69.65%), ale nie jest to już zagwarantowane: przetrwanie jest probabilistyczne aż do samego końca.

Krok 3 — Konwersja na dolary

Pomnóż rozkład pozycji końcowych każdego gracza przez wektor Payoutów [5000, 3000, 1500, 500]:

| Gracz | Udział Chipów | „Chip-equity” $ (liniowo) | ICM $EV | Różnica vs Chipy | |---|---|---|---|---| | A | 50% | 5 000 USD | 3 717,74 USD | −1 282,26 USD | | B | 30% | 3 000 USD | 3 033,17 USD | +33,17 USD | | C | 15% | 1 500 USD | 2 150,19 USD | +650,19 USD | | D | 5% | 500 USD | 1 098,89 USD | +598,89 USD | | Suma | 100% | 10 000 USD | 10 000,00 USD | 0 |

Sumy dolarów wracają do pełnej puli nagród 10 000 USD — equity jest zachowane, nigdy nie jest tworzone ani niszczone. To jest sedno całego modelu, przedstawione w prostych liczbach:

Chip leader A jest wart 3 718 USD, a nie 5 000 USD. Posiadając połowę Chipów, A zgarnia jedynie 37% Prize pool w oczekiwaniu. Około 1 282 USD „wartości Chipów” wyciekło do mniejszych Stacków.
Short stack D jest wart 1 099 USD, a nie 500 USD — ponad dwukrotnie więcej niż jego udział w Chipach. Posiadając 5% Chipów, D kontroluje prawie 11% pieniędzy.

To nie jest dziwactwo tych konkretnych Stacków; jest to strukturalne. Wklęsłość drabinki Payoutów oraz fakt, że nawet 1-Chip Stack ma zagwarantowane jakieś miejsce końcowe, oznacza, że Short stacki są systematycznie przewartościowane w dolarach względem Chipów, a Big stacki systematycznie niedowartościowane. Wszyscy są „ciągnięci w kierunku środka” skali płac.

Dlaczego To Zmienia Sposób Twojej Gry

Praktyczna konsekwencja mieści się w jednym wyrażeniu: risk premium. Ponieważ twoje ostatnie stracone Chipy są warte więcej (w USD) niż twoje następne wygrane Chipy, breakeven equity dla stack-offu rośnie powyżej naiwnego breakevenu Chip-EV. Sytuacja, która jest jasnym Chip-EV Call, może być jasnym ICM Fold.

Przeprowadź sytuację leadera A przez powyższy pryzmat: A ryzykujący Chipy przeciwko średniemu Stackowi obstawia dolary po niekorzystnym kursie wymiany — A płaci pełny koszt marginalnych Chipów przy stratach, ale otrzymuje zdyskontowaną wartość marginalnych Chipów przy wygranych, ponieważ podwojenie nie podwaja pieniędzy A (A jest już blisko szczytu krzywej). Short stack D, przeciwnie, ma niskie risk premium w stosunku do większych Stacków: Chipy D są tanie do zaryzykowania, ponieważ potencjalne straty D są małe i dobrze rekompensowane przez laddering equity. To jest matematyczne podłoże stwierdzeń „Big Stacki powinny Blindsować, ale nie przeciwko innym Big Stackom” oraz „ICM pressure najmocniej uderza w średnie Stacki” — średnie Stacki mają najwięcej ladder equity do stracenia i najmniej do zyskania.

Nie musisz tego zgadywać. Wprowadź Stacki i Payouty do shadepoker’s Kalkulator ICM, odczytaj $EV dla każdego miejsca, a risk premium dla dowolnego starcia wyniknie z porównania dolarowego equity przed/po wygranej lub Bustowaniu. Ten dolarowy swing przed i po — a nie Chip swing — to liczba, którą powinieneś brać pod uwagę przy decyzji na Riverze.

Malmuth-Harville kontra Malmuth-Weitzman

Malmuth-Harville jest domyślnym modelem w zasadzie każdym komercyjnym narzędziu ICM, ale nie jest to jedyny model kolejności końcowej. Malmuth-Weitzman odpowiada na to samo pytanie — biorąc pod uwagę Chip county, jaki jest rozkład pozycji końcowych — stosując inną zasadę warunkowania.

Różnica polega na tym, jak wyprowadzane są niższe miejsca. Harville buduje dystrybucję do przodu: ustala, kto kończy pierwszy (prawdopodobieństwo = udział Chipów), usuwa go, a następnie rekursywnie stosuje to do pozostałych. Weitzman natomiast rozumuje od dołu do góry — modeluje prawdopodobieństwo zajęcia ostatniego miejsca jako odwrotnie proporcjonalne do Stacku Chipów, a następnie rekursywnie w górę przez kolejność eliminacji. Oba modele zgadzają się dokładnie co do P(1. miejsce) i w przypadku dwóch graczy, ale przypisują nieco inne prawdopodobieństwa środkowym pozycjom końcowym w większych polach, a zatem nieco inne dolarowe equities.

Który jest „właściwy”? Żaden nie jest empirycznie doskonały — oba są uproszczeniami rzeczywistego procesu eliminacji, który zależy od Blinds, Position i Skill. Harville wygrał konkurs popularności, ponieważ jego rekursja do przodu jest intuicyjna, szybka i akceptowalnie dobrze pasuje do obserwowanych danych turniejowych. Weitzman ma tendencję do bycia marginalnie bardziej pesymistycznym dla Big Stacków i marginalnie łaskawszym dla Short Stacków niż Harville. Rozbieżność jest realna, ale zazwyczaj niewielka w stosunku do błędu modelowania, który oba dzielą w porównaniu z rzeczywistością. Do celów praktycznych: wiedz, że „ICM” prawie zawsze oznacza Malmuth-Harville, wiedz, że Weitzman istnieje jako zasadnicza alternatywa, i nie przejmuj się różnicami na drugim miejscu po przecinku — są one znikome w porównaniu z założeniami, które oba modele przyjmują.

Poza Statycznym ICM: Symulacja Przyszłej Gry

Oto szczere ograniczenie. Static ICM zakłada, że turniej rozstrzyga się bez dalszej gry — tak jakby rozkład pozycji końcowych krystalizował się w momencie zamrożenia Stacków. Zawiera dwa fikcyjne założenia:

Brak przyszłych rozdań. Blinds nie rosną, Antes nie drenują Stacków, nikt nie robi Open-shove na nikogo. Chipy są traktowane jako stała loteria.
Brak Skill. Każdy gracz jest identyczny. Światowej klasy reg i gracz rekreacyjny z tym samym Stackiem otrzymują to samo equity. Position względem Buttona — ogromna przewaga Short Stacka — jest niewidoczna dla modelu.

Te fikcyjne założenia mają największe znaczenie, gdy pozostało dużo przyszłej gry: głębsze Stacki, duże Blinds w stosunku do Stacków i Button, który obróci się kilka razy, zanim ktokolwiek Bustuje. Static ICM systematycznie błędnie wycenia te spoty, ponieważ ignoruje przewagi pozycyjne i inicjatywne, które narastają w ciągu następnego Orbitu.

Future Game Simulation (FGS) to udoskonalenie. Zamiast zamrażać Stacki, FGS symuluje następne k rozdań — zazwyczaj krótki horyzont, jak od jednego do czterech rozdań — używając uproszczonej strategii (często modelu push/fold lub opartego na Solverze) dotyczącej tego, jak Blinds będą rozgrywane, a dopiero potem stosuje Static ICM do wynikowego rozkładu Stacków. W efekcie, FGS pozwala Chipom „grać do przodu” trochę, zanim zostaną zamienione na dolary, wychwytując wartość Position i koszt wkrótce wejścia na Blinds.

Korzyści: FGS nagradza posiadanie Position na Short Stacku, karze za zbliżające się wpłacenie Big Blinds z marginalnym Stackiem i generalnie łagodzi niektóre z najostrzejszych Foldów Static ICM w miejscach, gdzie będziesz mógł wykorzystać swój Skill i Position, zanim ktokolwiek zostanie wyeliminowany. Koszt to złożoność obliczeniowa i modelowania — symulacja jest tak dobra, jak strategia, którą zakładasz dla tych przyszłych rozdań, a przestrzeń stanów eksploduje szybko wraz z głębokością przewidywania, dlatego głębokości FGS są utrzymywane na niskim poziomie. Myśl o FGS jako o Static ICM plus krótkim, zasadniczym wglądzie w następny Orbit. W przypadku decyzji na stole finałowym i na Bubble, gdzie przyszła gra jest ograniczona, Static Malmuth-Harville jest już doskonały; w przypadku głębszych miejsc z przeskokami Payoutów na średnim etapie, FGS znacząco to koryguje.

Podsumowanie

ICM to nie tylko wrażenie. To konkretny algorytm: P(1. miejsce) równa się udziałowi Chipów, niższe miejsca następują poprzez usunięcie wyżej sklasyfikowanych graczy i rekurencję, a twoje dolarowe equity to rozkład pozycji końcowych pomnożony przez drabinkę Payoutów. Zastosuj go do dowolnego spotu z czterema graczami, a za każdym razem pojawi się ta sama strukturalna prawda — Chip leader jest wart mniej niż jego Stack, Short stack jest wart więcej, a średnie Stacki to te, które model najmocniej ściska.

Gracze, którzy to internalizują, nie tylko „grają Tight na Bubble”. Wyceniają każde All-in w stosunku do dolarowego swingu, a nie swingu Chipów, wiedzą, kiedy ich risk premium pozwala im na ryzyko, a kiedy ich krępuje, i dokładnie rozumieją, które założenia modelu zaraz się załamią — co jest momentem, by zamiast tego polegać na FGS lub czystej ocenie. Ta luka, między traktowaniem Chipów jako pieniędzy a znajomością dokładnego kursu wymiany, to luka między Min-cashingiem a punktowaniem na stole finałowym. Wprowadź prawdziwy spot do kalkulatora ICM shadepoker, odczytaj dolarowe equities i zacznij sprawiać, by konwersja stała się drugą naturą.