Åtte av ti har latt seg villede av statistikk. Og folk vil fortsette å la seg villede av statistikk, så lenge de fortsetter å tro at statistikken handler om dem som enkeltindivid. Det gjør den per definisjon ikke. Vi liker derimot å tro det, fordi hvis statistikk handler om oss som enkeltindivid, kan den være både være saliggjørende og en dødsengel. En lykkefølelse eller en fryktelig framtid.
Statistikken, slik vi ofte feiltolker den, forteller en historie om nettopp oss. Et framtidsscenario. Ja, nærmest som en profeti eller en erklæring ovenfra for hvordan verden en dag kommer til å bli. For nettopp oss. Historien vi fletter sammen fra mistolkningen av talla, kan fange oppmerksomheten vår og virke så overbevisende på oss, at vi bare føler at det hele blir mer sannsynlig.
Dette fenomenet kaller psykologer for en tilgjengelighetsheuristikk. Det er en type tankefeil hvor vi feilvurderer noe for å være mer sannsynlig enn det egentlig er, dersom forestillingene vi har er enklere å se for seg enn de forestillingene med reelt sett langt dårligere odds er.
Noe av trikset for å ikke gå i denne fella, ligger i å forstå noe helt grunnleggende om statistikk.
Statistikk handler ikke om individet!
Statistikk forteller ikke historien om deg. Tallene du blir presentert for, er ikke din historie. Statistikk handler om historien til den generelle befolkninga eller en kategori (et utvalg) innenfor den generelle befolkninga. I (nesten) alle tilfeller kan vi ikke bruke statistikk for å si noe sikkert om et enkeltindivid. Dersom så hadde vært tilfellet, hadde det ikke vært statistikk. Det hadde vært en personbeskrivelse – og da hadde det vært en del av din historie.
Jeg tror alle intuitivt forstår dette når det kommer til individuelle karakteristikker. For eksempel høyde eller kjønn. Det er enkelt å skjønne at gjennomsnittshøyden din ikke er 1,75 meter eller at det ikke er 50 % sannsynlighet for at du er kvinne. Du er hvor høy du faktisk er og er det kjønnet du faktisk er. Dette er faktum om deg som person, og den forandrer seg ikke om gjennomsnittshøyden i landet går opp eller det fødes flere jentebarn. Du blir ikke plutselig 1,78 meter i morgen, øker sjansene dine for å bli kvinne eller våkner opp med én testikkel.
Eller for å ta noe litt mer vittig: Gjennomsnittsnordmannen har én testikkel. Hvis vi tar utgangspunktet i både menn og kvinner, altså. Imidlertid tror jeg du vil finne langt flere med enten to eller ingen testikler, enn én testikkel. I dette tilfellet er gjennomsnittet ikke beskrivende for knapt noen av individene den består av. Statistikken sier ikke noe om noen individer! Enda den er aldri så treffende for gruppen individene består av.
Som sagt, hvis et aggregert tall – en beregnet totalsum – hadde gjaldt deg som enkeltindivid, hadde vi ikke kalt det statistikk, men en personbeskrivelse. Derimot tror jeg folk har en tendens til å glemme dette og fortape seg i høyst hypotetiske historiescenarioer når det er snakk om statistikk som unektelig høres skummel ut å bli en del av.
La meg illustrere hva jeg mener med et eksempel.
Skummel statistikk og helserisiko
Se for deg at du drar til legen. Der gjør du en standard helsesjekk. Legen din oppdager at du har en sykdom, som gitt ubehandlet, tar livet av 10 prosent prosent av alle med sykdommen. Altså en dødelighet på 10 prosent uten behandling. For de som overlever, er det ingen komplikasjoner med sykdommen.
Her er det fort gjort å tenke at risikoen din for å dø, hvis du ikke mottar behandling, er 10 prosent. Men: En dødelighet på 10 prosent for en sykdom, betyr ikke at sykdommen har en dødelighet på 10 prosent for deg. Det er tross alt ikke din personlige risiko for å dø risikoen er beregnet ut i fra.
Risikoen er beregnet ut i fra informasjon om gruppen av personer med sykdommen. I denne sammenhengen relaterer risikoen seg til antall personer (med samme sykdom) blant gruppen som enten oppnåde eller ikke oppnådde et gitt helseutfall (død eller ikke-død, enten så døde de eller så gjorde de det ikke).
Heldigvis har du flaks. Legen din informerer deg om at finnes en medisin mot denne sykdommen, som kan redusere sjansene for å dø med 50 prosent. Du gjør litt rask hoderegning, og finner ut at den absolutte risikoen for å dø faller fra 10 prosent ned til 5 prosent dødelighet.
Igjen sniker tanken inn om at er din risiko som reduseres. Ideen om at det er du personlig som har 5 % risiko for å dø og 95 % risiko for å ikke dø, er tiltalende, men likevel feil. Det er bare to alternativer: Enten dør du av sykdommen, eller så gjør du det ikke. Risikoen for at akkurat du/kroppen din dør, er ukjent.
Husk at det som faktisk blir formidlet til deg av statistisk risiko, er basert på data fra studier på grupper av mennesker sammenlignet med andre grupper av mennesker. Mennesker som ikke er deg. Risikotallene du presenteres for relaterer seg til andelen (av 100 %) personer som får sykdommen og mottar en behandling, sammenlignet med de som får den og ikke mottar en behandling.
I vårt eksempel er andelen personer som dør av sykdommen på 10 prosent, hvis de ikke mottar behandling for den. Dette er det samme som å si følgende: For hver 100 av disse menneskene, er det 10 av dem som dør. Men det er ingen individuell vurdering av risiko her. Du/kroppen din har ikke 10 % risiko for å dø og 90 % for å ikke dø. Det samme gjelder når vi snakker om at “din” risiko reduseres eller at “du” beskyttes av en behandling: Du/kroppen din har ikke 5 % for å dø og 95 % for å ikke dø.
Statistikken gjelder gruppa, ikke deg. En behandling/medisin/intervensjon som reduserer risiko med 50 prosent, betyr at i en gruppe mennesker der 10 av 100 vil dø av en sykdom (10 % risiko), er det 5 som bli skånet, og 5 som likevel dør. Det vi ikke kan gjøre, er å vite om akkurat du er en av de 5 som blir skånet eller om du er en av de 5 som dør, eller om du uansett hadde vært en av de 90 som uansett aldri hadde fått noen komplikasjoner.
Litt synd for individet at statistikk aldri kan si noe sikkert om oss selv, men slik er statistikkens natur.