Tänä keväänä koronatilastojen seuraaminen on usein herättänyt kysymyksen, voiko niihin luottaa? Vanha vitsi vale, emävale ja tilasto on aiheellinen, mutta aika usein tilastot ovat myös oikeaan osuneita. Tilastoja lukiessa onkin hyvä olla kriittinen, mutta kriittisyys vaatii tilastojen lukutaitoa.
Emävale-vitsi liittyy osin siihen, että tilastoja voidaan esittää harhaanjohtavasti, tässä Ylen jutussa on hyvin kuvattu esimerkkitapauksia.
Tilastojen alkuperä on tärkeää tuntea. Koronan maailmanlaajuisten lukujen vertailussa se pakosti jää hämäräksi. Tilastojen keruu on jossain kehittyneempää ja jossain vajavaista. Maailmanlaajuisia tilastoja on seurattu esimerkiksi Worldometer-palvelusta
Hesarin juttu hyvin avasi palvelun taustoja ja luotettavuutta. Palvelussa olevat tiedot lienevät oikeansuuntaisia, mutta paljon on myös ongelmia.
On hyvä muistaa, ettei Suomessakaan koronatilastot ole aina pysyneet ajan tasalla, vaikka Suomi on tilastojen keruunkin suhteen hyvin järjestäytynyt yhteiskunta ja meillä on korona-tapauksia ollut kohtalaisen vähän.
Kriittisyys tilastojen alkuperää kohtaan on tärkeää aina. Hyvin tehdyissä kyselytutkimuksissa alkuperä tunnetaan ja varsinkin tunnetaan datan keruuseen liittyvät rajoitukset. Ns. itsevalikoituvien nettikyselyiden suhteen on oltava tarkkana. Vastaajia voi olla paljon, mutta otoksen edustavuudesta ei ole mitään takeita.
Tilastojen luotettavuuden kannalta on kiinnostava psykologissa, sosiaalipsykologiassa ja biolääketieteessä laajaa keskustelua herättänyt toistettavuuskriisi. Uusimmassa Psykologia-lehdessä on asiasta hyvä katsaus (valitettavasti vain tilaajille).
Kyse on siitä, että klassisten psykologian kokeiden tuloksia ei ole onnistuttu toistamaan. Syitä tähän on monia: liian pieniä ja epäedustavia otoksia, vain onnistunut osa tuloksista raportoitu, aineistoa on käsitelty eri tavoin, jotta tulokset ovat parempia. Taustalla on myös tutkimusmaailman kova kilpailu ja julkaisupaine.
Kyse ei ole pelkästään tilastotieteellisistä ongelmista, mutta usein taustalla on tutkimusasetelmaan ja tilastolliseen testaukseen liittyviä ongelmia ja joskus suoranaisia virheitä – harvemmin onneksi huijauksia. Hätkähdyttävin lienee hollantilaisen Diederik Stapelin vilppi, kun hän oli sepittänyt aineistoja, joista saatuja tuloksia oli raportoitu arvovaltaisissa julkaisuissa.
Toistettavuuskriisi ei suinkaan tarkoita, että kaikki tutkimustulokset tulisi hylätä. Aika usein tulokset ovat oikeita tai ainakin oikean suuntaisia. Tilastollisen lukutaidon kannalta opetus on, ettei yksittäisen tutkimuksen tuloksiin ylipäätään pitäisi liikaa nojata, vaan laajempaan tutkimusten joukkoon.
Tilastojen lukutaito vaatii kriittisyyden lisäksi tilastotieteen tuntemusta. Esimerkiksi uutisissa mainittu virhemarginaali ymmärretään usein väärin. Virhemarginaali ±3 prosenttia ei tarkoita, että todellinen tulos on mitä tahansa tuon kuuden prosentin sisällä. Se tarkoittaa sitä, että todellinen tulos on sovitun 95 % todennäköisyydellä tämän kuuden prosentin sisällä ja kaikkein todennäköisemmin se on keskellä ja epätodennäköisimmin laidoilla.
Sama esimerkin kera. Jos jonkun puolueen kannatus on 20 % ja virhemarginaali ±3, niin kannatus on kaikkein todennäköisimmin tuon 20 % ja todennäköisyys sille, että se olisi 17 % tai 23 % on melko pieni ja vain 5 % todennäköisyys sille, että todellinen kannatus on 17-23 % ulkopuolella.
Tilastojen lukeminen vaatii siis lukutaitoa. Tilastojen taustalla ei yleensä ole mitään hämärää, eikä niillä yritetä huijata, mutta erilaisia rajoituksia niihin liittyy. Näiden rajoitusten ymmärtäminen vaatii syvällisempää paneutumista ja tilastotieteen ymmärtämistä.
Loppuun vielä täsmennys kirjoittajasta: en edes yritä olla tilastotieteilijä, vaan haluan herätellä tilastojen lukutaitoa, jota tarvitaan esimerkiksi uutisten seuraamiseen ja varsinkin tekemiseen!