MM#8 Regrese k průměru
Věci se vracejí k průměru.
Pokud lidská mysl něco nezvládá, pak je to vypořádání se s jednoduchou statistikou. Jednou z běžných chyb, které podléhá, je neschopnost intuitivně chápat regresi k průměru.
Co to je regrese k průměru?
Regrese k průměru je jev, který nastává v situacích, u kterých naměřené hodnoty závisejí na mnoha proměnných a náhodě. U takových jevů naměříte po extrémní hodnotě hodnoty, které se více blíží průměru. Vezměte si například průměrnou úspěšnost brankářů NHL v sezóně 2017–2018. Ta byla 91,3 % a 100% úspěšnosti (tedy vychytané nuly) gólmani dosáhli zhruba 130x za sezónu. Nikdo z nich ale neměl dvě nuly za sebou. To znamená, že po vychytané nule nastala regrese k průměru, úspěšnost v dalším zápase byla nižší než 100% a tedy blíže k oněm 91,3%.
To samé se dá říct o negativních výkonech, které mají tendenci se zlepšovat. Henrik Lundquist dostal 1.2.2018 čtyři branky ze 13 střel a s procentuální úspěšností 69,2 % jej po 23 minutách střídal Ondřej Pavelec. V dalším zápase už byla jeho úspěšnost 85,2 %, což opět není žádná sláva, ale přesto je to výrazně blíže k průměru a v zápase poté už 95,1 %, což je naopak nadprůměrný výkon.
Proč se regrese k průměru děje?
Průměr není nějaké magické číslo, které se objeví mávnutím kouzelné hůlky. Je střední hodnotou všech hodnot, které do něj započítáme. Tedy těch výjimečných i těch běžných. A pokud těch hodnot do průměru započítáme dostatečně velké množství, vyjde nám poměrně reprezentativní vzorek toho, co je pro danou sadu hodnot běžné.
Dlouhodobý průměr je navíc velmi odolné číslo, které se v daném systému mění jen velmi málo a velmi pomalu. Pro výraznější změnu průměru je potřeba spíše změnit systém než čekat, že se hodnoty v něm postupem času změní. Například pokud chceme, aby padalo v hokeji více gólů, spíše než trénink útočníků bude efektivnější zmenšit brankářům výstroj nebo zvětšit branky. Proto pokud se v systému nějaká hodnota od spočítaného průměru výrazně odkloní, znamená to na základě minulých hodnot to, že se objeví taky jedna nebo několik dalších hodnot, které tento odklon vyváží tak, aby průměr zůstal plus mínus stejný.
Kde kvůli regresi k průměru vznikají chyby v úsudku?
Chyby v úsudku kvůli regresi k průměru vznikají především tam, kde předpokládáme, že spolu souvisí činnost, která by měla zlepšit výsledek a samotné zlepšení výsledku. jenže tato souvislost může být pouze zdánlivá a zlepšení může být pouze zásluhou regrese k průměru.
Například je prokázáno, že pozitivní motivace je výrazně účinnější než negativní motivace. Běžný trenér se Vám ale nejspíš vysměje. Ten má zkušenost, že když jeho svěřenci podají nadprůměrný výkon a on je pochválí, příště už jejich výkon není tak dobrý. A naopak, když podají výrazně podprůměrný výkon a on je za to “pořádně seřve”, jejich výkon se zlepší a on má tím pádem pocit, že je jeho negativní motivace naopak velice účinná. Jak už jste ale mohli vidět, pokud někdo podá výrazně podprůměrný výkon, šance, že jej zopakuje, je velice malá a ke zlepšení by nejspíš došlo i bez zásahu trenéra.
Jak využít regresi k průměru ve svůj prospěch?
Jde o pesimistický jev, který slouží jako kontakt s realitou. A právě to je jeho prospěšné, i když trochu bolestivé využití.
Regrese k průměru se opírá o minulé hodnoty, a díky ní můžeme zjistit, v jakém stavu je systém, na který se díváme. Pokud je například v kategorii denního obchodování do 10.000 Kč dlouhodobý průměr -8 %, víme, že bychom měli být hodně opatrní, protože každý takový obchodník v průměru prodělá 8 % denně. Většina lidí si myslí, že jsou nadprůměrně dobří, ale být dlouhodobě lepší než průměr je extrémně těžké, protože průměr je založený na reálných minulých hodnotách a tedy na tom, jak je nastavený systém. Takže pokud nemáme obrovské množství zkušeností nebo nějakou jinou výhodu, pak není důvod, abychom si mysleli, že budeme lepší než průměr.
I když budeme s větší pravděpodobností spíše horší. Jak je to možné? Mohli bychom si myslet, že je podprůměrných i nadprůměrných hodnot stejně. 50 % a 50 %. To je pravda, jenže je často jednodušší být podprůměrný než nadprůměrný kvůli tomu, že má průměr jednu zásadní vadu na kráse. Extrémní hodnoty jej velmi výrazně vychylují. A v některých systémech těch extrémních hodnot dosahují především vítězové, kteří průměrnou hodnotu vychylují směrem vzhůru. Například v případě bohatství.
Představme si společnost lidí pod vedením diktátora. Devět lidí bere tisíc korun měsíčně a jeden bere milion korun měsíčně, průměr je 100.900 Kč. Jenže když odstraníme horních 10 %, tak dojdeme k tomu, že je průměrná mzda 1.000 Kč. Mysleli jsme si, že máme šanci brát 100.900 Kč měsíčně, jenže realita je taková, že to spíše vypadá na 1.000 Kč měsíčně. To je dost extrémní příklad a většinou průměr není vychýlený až o tolik, ale vychýlený přesto je.
Proto je důležité brát dosažení průměrné hodnoty jako úspěch, ne jako něco, co jednoduše překonáme, protože jsme nadprůměrní.
Jak systém dosáhne lepších než průměrných hodnot?
Pokud chceme dosahovat lepší průměrné hodnoty, máme dvě možnosti. Buď se musíme stát velmi dobrými v tom, co děláme, nebo musíme změnit systém tak, abychom zvýšili průměr dosahovaných výsledků.
V případě půjček bychom mohli apelovat na osobní odpovědnost jednotlivců, což by jim mělo pomoct se zlepšit, ale asi by to nevedlo k nijak velkým výsledkům. Pokud ale systémově zpřísníme podmínky půjček, zvýší se jejich návratnost.
Závěr
Sledujte průměr, protože díky tomuto jednoduchému číslu můžete zjistit to, co se v systému zhruba děje. Je pravda, že Vám průměr neřekne nic o tom, jak jsou v systému jednotlivé hodnoty rozloženy, pořád je to ale velmi užitečný údaj, díky kterému se dozvíte optimistický obrázek, jak to v systému vypadá a co od něj zhruba můžete čekat. A moc Vás prosím, abyste si nemysleli, že jste proti regresi k průměru ve všech ohledech imunní. Pokud skutečně jste, pak je to jen velmi malá oblast toho, co znáte a co děláte a gratuluju Vám k tomu. V průměru ale buďte spíše na straně průměru. I když je těžké se s tím smířit, drtivá většina lidí je v drtivé většině ohledů spíše průměrná než nadprůměrná.