Teoria zakładów Część 1

W fizyce "teoria wszystkiego" jest próbą konceptualizacji wszystkich aspektów znanego wszechświata w pojedynczej ramie teoretycznej. Mój cel jest tu o wiele mniej imponujący, ale w tym samym kierunku. W ciągu ostatnich kilku tygodni brałem udział w kilku dyskusjach (a czasami w gorących debatach) na Twitterze na tematy, które mają więcej wspólnego niż ludzie mogą zdawać sobie sprawę:

- Jaka próbka wielkości wyników jest wystarczająca, aby przekonać modelarza, że jego krawędź jest lub nie jest rzeczywista?

- Co to jest "regresja na rynek" i jak to zrobić?

- Jak ważna jest wartość zamknięcia linii (CLV)?

- Co jest lepsze, pełne Kelly lub ułamkowe Kelly? Jeśli ułamek, jaki jest najlepszy sposób na określenie ułamka?

W tym artykule połączę wszystkie te pomysły w wersję teorii wszystkiego.


Generator

Zacznijmy od zdefiniowania "generatora" jako procesu, który tworzy sekwencję losowych wyników. Możemy podzielić generatory na dwie kategorie:

Sztuczne generatory, takie jak kości, karty lub koła ruletki, są dokładnie kontrolowane, dzięki czemu wszystko, co trzeba wiedzieć o ich rozkładzie prawdopodobieństwa, jest już znane. (Ze względu na tę dyskusję zignorujemy takie rzeczy, jak załadowane kości, oznaczone karty i stronnicze koła!)

Naturalne generatory, takie jak imprezy sportowe, wybory i pogoda wynikają ze złożonych interakcji wielu czynników. Oni również mają rozkład prawdopodobieństwa, ale jest on nieznany i niepoznawalny - najlepsze, co możemy zrobić, to zbudować modele do jego oszacowania. Zakłady sportowe istnieją wyłącznie w dziedzinie naturalnych generatorów.

Dla modelu używanego do oszacowania zachowania naturalnego generatora, zdefiniujmy "prawdziwe prawdopodobieństwo" jako rzecz nieznaną i niepoznawalną, "prawdopodobieństwo modelu" jako najlepsze oszacowanie modelarza i "błąd modelu" jako różnicę między nimi .

Prawdopodobieństwo modelu =

Prawdopodobieństwo prawdziwe + błąd modelu

Ponieważ różnica między znaną ilością a nieznaną ilością, błąd modelu jest również nieznany i niepoznawalny.

Niepewność procesu i niepewność parametrów

Następnie użyjmy tego pomysłu generatorów, aby omówić niepewność. Kwantyfikacja niepewności jest centrum wszystkich matematyki hazardowej. Ludzie często zaniedbują, że niepewność pochodzi z dwóch różnych źródeł, a natura każdego z nich jest zupełnie inna.

"Niepewność procesu" pochodzi z przypadkowości wbudowanej w sam generator. Dlatego powtarzające się obroty tego samego koła niekoniecznie dają ten sam rezultat, dlatego też ci sami dwaj gracze w tenisa mogą grać ze sobą wielokrotnie w identycznych warunkach i jeden gracz wygrać część, a drugi wygrać.

"Niepewność parametru" wynika z niepełnego zrozumienia działania generatora. W niektórych bardziej zaawansowanych publikacjach można ją nazwać "epistemiczną niepewnością", zakorzenioną w epistemologii - filozofii wiedzy.

Załóżmy na przykład, że dajesz drużynie piłkarskiej 60% prawdopodobieństwa wygranej, obstawiasz je nawet za pieniądze i przegrywają. Dlaczego straciłeś swój zakład? Być może miałeś rację w ocenie, ale miałeś pecha - wydarzyło się 40% wydarzenie i przegrałeś zakład. To niepewność procesu - dobry zakład, pechowy wynik.

Dobre i dobre szczęście: cienka linia oczekiwań

Z drugiej strony, być może nie miałeś racji w swojej ocenie - prawdziwe prawdopodobieństwo mogło wynosić 50% lub 30%, a nawet 1%. Postawiłeś zakład, który uważałeś za dobry zakład, ale w rzeczywistości był to zły zakład. Jest to niepewność parametrów. Ponieważ prawdziwe prawdopodobieństwo jest nieznane, bardzo trudno jest ustalić, ile z twoich wyników - zarówno dobrych, jak i złych - wynika z niepewności procesu, a nie z niepewności parametrów.

Zatrzymajmy się tutaj i zróbmy kilka stwierdzeń, które okażą się przydatne, gdy będziemy kontynuować tę eksplorację w generatory i niepewność:

1. Sztuczne generatory obejmują tylko niepewność procesu. Naturalne generatory obejmują zarówno niepewność procesu, jak i niepewność parametrów.

2. Przypomnij sobie, że zdefiniowaliśmy błąd modelu jako różnicę między rzeczywistym prawdopodobieństwem a prawdopodobieństwem modelu. Dlatego błąd modelu jest odzwierciedleniem niepewności parametru.

3. Niepewność procesu wpływa na każdy wynik w serii niezależnie od innych. Dlatego tablice wyników ruletki dostarczają bezużytecznych informacji.

4. Niepewność parametru wpływa na każdy wynik w serii w sposób skorelowany. Jeśli użyjesz tego samego modelu do stworzenia prawdopodobieństwa dla 100 różnych gier, wszelkie błędy w modelu prawdopodobnie rozprzestrzenią się w podobny sposób na niektórych lub wszystkich 100.

5. Wniosek z # 3: W przypadku dużej wielkości próby wpływ niepewności procesu zmniejszy się do zera. Odsetek oczu węża w powtarzanych rzutach dwóch kości zbliża się do teoretycznego prawdopodobieństwa 1/36. Jest to znane jako "prawo wielkich liczb".

6. Wniosek z # 4 i # 5: Wielokrotne obserwowanie wyników naturalnego generatora pozwala na ciągłe uczenie się na podstawie obserwacji w celu lepszego zrozumienia działania generatora. To jest podstawa modelowania bayesowskiego.

Regresja na rynek

Błąd modelu jest, jak pokazano, dość śliskim stworzeniem. Wiemy, że istnieje, ale nie można go określić ilościowo. Istnieje jednak jedna ważna właściwość niepewności parametru, którą możemy wywnioskować z teorii efektywności rynku:

Na rynku, który jest przynajmniej w pewnym stopniu wydajny, niepewność parametru będzie dążyć do "popychania" w kierunku prawdopodobieństw, które wynikają z ceny rynkowej. Im bardziej wydajny rynek, tym silniejszy nacisk.

We wszystkich poniższych przykładach liczbowych użyjemy zakładu z spreadem punktowym o kursie rynkowym -105 / -105 ze względu na prostotę. Matematyka działa równie dobrze dla wszelkich szans, ale obliczenia stają się trudniejsze.

W tym przypadku cena rynkowa oznacza prawdopodobieństwo wygranej w wysokości 50% dla każdej strony. Załóżmy, że twój model przewiduje prawdopodobieństwo wygranej na poziomie 55% dla jednej strony. Efektywność rynkowa wskazuje, że błąd modelu jest o wiele bardziej prawdopodobny + 2% (co oznacza prawdziwe prawdopodobieństwo 53%) niż -2% (co oznacza prawdziwe prawdopodobieństwo 57%). Aby powtórzyć ten sam przykład pod względem oczekiwanych wartości - jeśli twój model przewiduje teoretyczną wartość oczekiwaną + 7,4%, twoja prawdziwa oczekiwana wartość jest o wiele bardziej prawdopodobna + 3,5% niż + 11,3%.
Ta asymetria oznacza, że ​​użycie kryterium Kelly'ego z założoną krawędzią + 7,4% prawdopodobnie spowoduje przekroczenie prawdziwej krawędzi, co jest niezwykle niebezpieczną rzeczą z perspektywy zarządzania bankrollem.
Gracze zazwyczaj mają dwie strategie, aby się przed tym bronić - albo używają ułamkowego podejścia Kelly'ego, albo biorą przewidywane prawdopodobieństwa modelu i "regresują je do rynku", używając średniej ważonej prawdopodobieństw modelu i rynkowych prawdopodobieństw implikowanych. Wagi można wybrać subiektywnie lub można je oszacować za pomocą metody takiej jak maksymalne prawdopodobieństwo.
Czytaj: Pinnacle vs. FiveThirtyEightZauważ, że ponieważ rozmiar zakładu pod Kelly jest wprost proporcjonalny do rozmiaru krawędzi, dwie powyższe metody są równoważne matematycznie. Formuła konwersji między nimi to
Waga regresji =
(Wielokrotność Kelly * model prob + (1 - wielokrotność Kelly'ego) * próba rynkowa * (1 + marża bukmachera) - prawdopodobieństwo rynkowe / (model prob - rynkowy prob)
W naszym przykładzie marża bukmachera wynosi 1 - 0,5 * (205/105) = 2,4%. Zatem zakład o wartości 1/4 Kelly'a byłby równoważny wadze regresji (0,25 * 0,55 + (0,75 * 0,50 * 1,024) - 0,50) / (0,55 - 0,50) = 0,429, co oznacza, że ​​równoważna regresja wynosiłaby 0,429 x prawdopodobieństwo modelu + 0,571 x prawdopodobieństwo rynkowe.Podejście "regresja do rynku" ma wyraźne zalety, ale ma również pewne wady. Właściwe wagi mogą zmieniać się z upływem czasu wraz z rozwojem rynku - dotyczy to zarówno poziomu mikro (od linii otwierającej do czasu, w którym oceniasz swój zakład do linii końcowej) i na poziomie makro (w miarę wchodzenia i wychodzenia z rynku) .
Poza tym logika jest trochę chwiejna - opiera się na założeniu, że rynek jest wydajny, ale na w pełni sprawnym rynku niemożliwe jest nawet posiadanie przewagi na początku. Tę dokładną krytykę można zastosować do pomysłu mierzenia własnej krawędzi za pomocą "wartości linii zamykającej" (CLV) - to znaczy mierzenia sukcesu modelu poprzez skorelowanie go z ruchem z linii w momencie umieszczenia zakładu w Linia zamknięcia.
Jest to dobra miara sukcesu, jeśli i tylko wtedy, gdy rynek reaguje na ten sam "sygnał", co twój model, w późniejszym czasie. Jeśli znajdziesz kąt zakładów, którego nikt inny na świecie nie ma, nie ma powodu, dla którego rynek miałby cię dogonić - możesz mieć dużo dodatniej wartości oczekiwanej, ale twój CLV będzie oscylował wokół zera.Send feedbackHistorySavedCommunity

strategie-obstawiania | 2019 | 
Powered by Webnode
Create your website for free! This website was made with Webnode. Create your own for free today! Get started