Kretz krönika

What´s in it for me?

Kan man lita på Verktygets utdelningsberäkningar?

Tänk dig att du vaknar en morgon och ser att SvS har gjort om reglerna för Oddset. Det nya är att SvS bara kommer att ange sannolikheten för ett resultat, men inte hur hög återbetalningen blir vid vinst.
Du får veta att Man U har 43% chans att vinna, men det betyder inte att oddset är 2,32.
Det kan lika väl vara 2,65 eller 1,97.

”Men vaddå, jag måste väl få veta vad jag kan vinna?”, säger du upprört till snubben i kundtjänst.
”Naah … tror du på United eller inte? Det blir väl ungefäringa 2-3 gånger degen”, svarar han.

Absurt? Jo, men egentligen inte så himla långt ifrån poolspelsverkligheten. Där förser oddsmarknaden oss med imponerande korrekta sannolikheter för de möjliga utfallen, men det andra ledet i ekvationen – ”reward-delen” – får vi bara en suddig bild av.

Det märkliga är att de flesta av oss poolspelare inte verkar bry oss nämnvärt. Vi nöjer oss med mindre än ”ungefäringa” och räknar som min son när han var 3 år: ”Ett, två … många”.
Eller översatt till en gamblers språkbruk: ”Den här skrällen ger nog bra”.
Ändå är en föreställning av vad en given enkelrad kommer att resultera i för utdelning en absolut förutsättning för att kunna spela lönsamt.

Från utfallsanalyser på gigantiska mängder data vet vi att när oddsmarknaden skattar Uniteds vinstchanser till 43% så är felmarginalen bara några decimaler. Den typen av exakthet kan vi aldrig vänta oss när det handlar om utdelningar. Det är för komplext, beror på för många människors beslut.

Men två saker kan vi göra:
1. Använda den information som finns.
2. Undersöka hur pålitlig den är.

Fast i dag ska vi vända på det. För visar det sig att infon är så svajig att den inte ens slår vår intuition så finns det naturligtvis ingen anledning att bygga system på den. Då kan vi kasta matematiken åt sidan och konsultera någon guru i stället.

Min ständiga hovleverantör av data och statistik, Mårten Erlandsson, har försett mig med de faktiska utdelningarna från 2 700  omgångar av Topptipset, och därtill de utdelningar som Verktyget beräknat för samma omgångar.

Hur väl stämmer dessa överens? Ser det likadant ut i alla utdelningsintervall, eller finns det tendenser till över/underskattningar någonstans?

Här får ni svaren. Grönt är gött, rött är jobbigt.

En lite utförligare förklaring:
Utdeln. interv utgår från de beräknade utdelningarna för 8 rätt, baserat på streckprocenten, omsättningen och eventuella added money.
Antal omgångar är antalet omgångar då Verktyget beräknade en utdelning i intervallet.
Överskatt. ant. är antalet omgångar då Verktyget beräknade en högre utdelning än vad som blev.
Överskatt. % är andelen av omgångarna då Verktyget överskattade utdelningen.
Underskatt. ant se ovan fast tvärtom.
Underskatt. ant se ovan fast tvärtom.
Snitt diff % är hur mycket hela intervallets verkliga utdelning skiljde sig från den beräknade.

Datamängden är så omfattande att jag tror jag vågar dra en del slutsatser utifrån det.

  • De allra lägsta utdelningarna överskattas av Verktyget. I tidigare krönikor har jag skrivit om att de rader som ger de lägsta utdelningarna i stort sett undantagslöst är rejält -EV. Det här visar att de raderna är ännu sämre än vad jag redan påvisat.
  • I spannet 1 000 kr – 5 000 kronor tenderar Verktyget att underskatta utdelningen, och det ganska rejält. Rader i det intervallet är oftast bra, även om man räknar på Verktygets utdelning. I verkligheten förefaller de alltså vara ännu bättre. Se till att ha många rader där!
  • Någonstans kring 10 000 kr vänder det och Verktyget börjar överskatta utdelningarna. Vid 30 000 kr börjar avvikelserna bli riktigt allvarliga. Det kan finnas skäl att cappa systemen någonstans mellan 30 000 och 50 000 kr.

kan man lita på Verktygets profetior?
Ja, jag anser det. Om man har i bakhuvudet att det underskattar medelhöga utdelningar och överskattar höga.
Och så länge det inte finns några bättre algoritmer att luta sig mot så har vi inget val. Det slår min intuition alla dar i veckan. Antagligen din också.

Jag tänker avsluta den här krönikan med de separata graferna för de olika intervallen. Det kan tyckas överflödigt, men till skillnad från matrisen ovan visar de hur stora de individuella avvikelserna är.
Men först några ord om vad jag tror är orsaken till att den rena streckprocent/omsättningsekvationen hamnar fel vid höga utdelningar. Jag har inget belägg för det och jag är inte matematiker, men jag tror det kan vara så här:

Strecken är inte jämnt fördelade över spelarkollektivet. Låt oss anta att en omgång har tre skrällar: en 25-procentare, en 20-procentare och en 15-procentare. Om skrällstrecken hade varit slumpvis fördelade över 10 000 rader så hade 10 000 x 0,25 x 0,20 x 0,15 = 75 rader haft med alla tre skrällarna. Det är så Verktyget arbetar.

Men det är inte så det ser ut i verkligheten, för vi väljer inte tecken slumpvis. En inte försumbar mängd spelare ser till att få med många skrällar – särskilt om de har spelvärde – på sina kuponger. De som har med 15-procentarn har också med de två andra skrällarna betydligt oftare än resten av spelarkollektivet.
Det är fullt möjligt att hela 2% av spelarkollektivet har med alla tre skrällarna på sina kuponger. Det blir 200 rader, och då blir utdelningen mycket lägre än vad Verktyget beräknat.

I andra änden av utdelningsintervallet beter vi oss däremot ungefär likadant, kioskspelare som spelproffs. När ett överstreckat Leicester möter West Bromwich har vi alla med 1:an lika ofta – det som skiljer oss åt är i vilken utsträckning vi garderar den.

Avslutningsvis några ord om Stryktipset och Europatipset. Jag har inte analyserat data därifrån än, men jag är ganska övertygad om att de mönstren går igen där. Om min förklaringsmodell är korrekt så gäller den även för 13-rättsspelen.

Dock förväntar jag mig att variansen är större för de allra högsta utdelningarna där. Slumpen har ju betydligt större inverkan på om det ska bli 3 vinnare eller 6 på Stryket, än om det ska bli 50 vinnare eller 100 på Topptipset.

På återseende!
Johan Kretz