Siirry suoraan sisältöön

Unohdetaan data, on aika keskittyä informaatioon

Aapeli Nevala

Aapeli Nevala

Seuraavat kaksi asiaa ovat kylmiä tilastofaktoja Suomesta, dataa.

Syöpäkuolemat ovat lisääntyneet 30 prosenttia viimeisen 30 vuoden aikana.

Syöpäkuolleisuus on vähentynyt 25 prosenttia viimeisen 30 vuoden aikana.

Näennäisestä paradoksaalisuudesta huolimatta Erwin Schrödinger ei ole ryhtynyt syöpäepidemiologiksi, vaan selitys löytyy raportointitavasta. Syöpätapausten ja syöpäkuolemien absoluuttinen määrä kasvaa jatkuvasti. Suomen ikäpyramidi painottuu nyt ja tulevaisuudessa yhä vahvemmin vanhoihin ikäluokkiin, joissa syövät ovat selvästi yleisempiä.

Sen sijaan ikävakioitu syöpäkuolleisuus laskee. Ikävakioinnissa muokataan keinotekoisesti eri vuosien Suomen väestöä muistuttamaan ikärakenteeltaan toisiaan. Tällöin voidaan huomata syöpäkuolleisuuden laskevan, jos väestön ikärakenne pysyisi samana. Tähän vaikuttaa esimerkiksi tupakoinnin aiheuttamien huonoennusteisten syöpien vähentyminen tupakoinnin vähentyessä ja syöpähoitojen kehittyminen.

Numeroita voidaan käyttää väärinkin

Yksinkertaisuudestaan huolimatta syöpäkuolleisuuden kehityksestä annettu esimerkki antaa viitteitä, mitä ongelmia tulee vastaan pelkässä datan tai numeroiden tuijottamisessa. Kumpikaan luvuista ei ole väärin, ja molemmilla on käyttötarkoituksensa. Absoluuttisten lukujen käyttöä tarvitaan esimerkiksi arvioitaessa tulevaisuuden tarvetta terveydenhuoltotoimille. Ikävakioitu kuolleisuus voi taas paljastaa, onko syövän syissä tai hoidoissa – tai jossain, mitä emme tunne – muutosta. Nykyisellä väestörakenteen muutoksella kaiken muun pysyessä entisellään kuolemat tulevat nousemaan.

Vastaavasti molempia lukuja voidaan käyttää väärin, jos luvuilla yritetään vastata väärään kysymykseen.

Datan katsomisen sijaan olennaista datan käyttöä onkin pystyä kuvaamaan ja hahmottamaan sitä prosessia, jonka lopputuloksena data kerätään. Olennainen osa tätä kysymystä on se, että mikä data jää havaitsematta – tai onko data havaittu samalla tavalla myös ennen?

Ennen syövän ilmestymistä syöpätilastoon tarvitaan ainakin kaksi asiaa: syövän pitää olla olemassa ja se pitää pystyä toteamaan. Todettujen syöpien suhteelliset määrät voivat muuttua, jos kummassa tahansa näistä prosesseista tapahtuu muutoksia. Tilastoissa näkyvä syöpien lisääntyminen voi selittyä osin sillä, että syöpiä on joskus jäänyt enemmän toteamatta.

Tällaisista prosesseista tehtävä päättely on hankalaa, ja usein sitä tehdään erilaisilla tilastollisilla tai matemaattisilla malleilla. Data asettaa toki mallinnukselle aina jotkin reunaehdot, mutta mitä enemmän on havaitsematonta dataa, sitä enemmän malleilla on liikkumatilaa. Syöpätilastoon tulevat vain ne syövät, jotka havaitaan jossain vaiheessa terveydenhuoltoa.

Usein päätöksenteolta vaaditaan vankempaa pohjautumista näyttöön ja dataan. Tämä on tietysti hyvä lähtökohta, mutta synnyttää jälleen erään ongelman. Näytön muodostumisessa on syytä miettiä, millainen on näytön muodostumisprosessi.

Mitä on dataan perustuva näyttö?

Jos poliittinen päätöksenteko perustetaan aukottomaan evidenssiin, saavat sellaiset toimenpiteet enemmän painoarvoa, joista evidenssin muodostaminen nykykäytännöillä on helpompaa.

Lääkehoidon vaikuttavuus voidaan osoittaa luotettavasti satunnaistetussa kokeessa, mutta erilaiset elintapoihin liittyvät interventiot ovat hankalampia. Esimerkiksi elintapojen ja syövän yhteydestä on paljon erilaista tutkimusnäyttöä, mutta satunnaistetun kokeen järjestäminen vuosia jatkuvasta karrelle palaneen makkaran syömisestä on mahdotonta.

Tällöin on hyvä miettiä, mikä olisi onnistuneen toimenpiteen potentiaali, kustannus ja mahdollinen haitta.

Tämä voi kuulostaa triviaalilta, mutta pienen riskin, suurten mahdollisuuksien ja haittavaikutuksiltaan pienen toimenpiteen toteuttaminen kannattaa – vaikka näyttö ei olisi aukotonta.

Tällöin datan sijaan voisimme puhua jo informaatiosta.