Kohti tuntematonta

“…as we know, there are known knowns; there are things we know we know. We also know there are known unknowns; that is to say we know there are some things we do not know. But there are also unknown unknowns—the ones we don’t know we don’t know.”                                                                              – Donald Rumsfeld (2002)

Yllä olevissa ajatuksissa tunnettujen ja tuntemattomien luokittelusta on järkeä, olipa Yhdysvaltain ex-puolustusministerin aikaansaannoksista tai persoonasta mitä mieltä tahansa. Rumsfeld viittasi maailmanpolitiikan koukeroihin, mutta lorun lokerointi sopii myös tutkimusmaailmaan. Itse asiassa koko ajatusrakennelma on lähtöisin juuri sieltä, Rumsfeld lainasi jo 1950-luvulla kehitettyä psykologian työkalua, nk. Joharin nelikenttää.

Tieteessäkin usein lähdetään selvittämään tunnetusti tuntematonta asiaa (known unknown) ponnistaen tunnetuista asioista (known knowns). Ja aina törmätään uusiin kysymyksiin tai ongelmiin, joita ei ensi alkuun tunnettu lainkaan (unknown unknowns). Asiat ovat kuin ketjuilla kiinni toisissaan: tutkiessaan tunnettuja tuntemattomia tiede hilaa ei-tunnettuja tuntemattomia kysymyksiä tutkimuksen näkökenttään. Rumsfeld totesi kuuluisan sitaattinsa yhteydessä myös, että jälkimmäisen ”unknown unknowns” -laarin asiat ovat niitä vaikeimpia.

Tutkijoiden kannattaisi tähän tuntemattomaan tuntemattomaan kuitenkin panostaa. Tämä ja Rumsfeldin aivoitukset tulivat mieleeni, kun elokuussa vahingossa törmäsin PLOS Biologyssa João J. Rochan ja kumppaneiden tutkimukseen ”Functional unknomics”. Se keskittyi geeneihin, joiden toimintaa ei tunneta. Vaikka ihmisen ja monien muiden lajien genomidataa on tuotettu jo yli kaksikymmentä vuotta, paljon perimästä on vielä hämärän peitossa. Vasta paljastumassa olevien epigeneettisten mekanismien ja geenien yhteispelin lisäksi on yksin ihmisen perimässä edelleen lukuisia tuntemattomia yksittäisiä geenejä. DNA-sekvenssi kertoo, että geeni käy ja kukkuu, mutta sen tuottaman proteiinin toiminnasta ei kenelläkään ole oikein mitään hajua. Rochan ja kumppanien artikkelissa tuota (ei-vihoviimeistä) käymätöntä korpimaata kutsutaan yhteisesti termillä ”unknome”, mikä tietysti juontuu sanoista unknown genome, tuntematon perimä.  Tästä artikkelin otsikkoon oli vielä leipoutunut oikein tieteenala, ”unknomics”.

Keskeinen työkalu tutkimuksessa oli tutkijoiden kehittämä avoin Unknome-tietokanta. Siihen on koottu 13 000 geeniperhettä ja liki kaksi miljoonaa geeniä ihmiseltä ja yhdeltätoista genetiikan mallilajilta kanasta kolibakteeriin. Juju on siinä, että geenit ja geeniperheet voidaan asettaa järjestykseen sen perusteella, miten hyvin ne tunnetaan. ”Tuntemisen” määrittely on tietysti vaikeaa ja osin subjektiivista, mutta tähän oli kehitetty järkevän oloinen ratkaisu. Pohjana on Gene Ontology -tietokannasta löytyvät tiedot siitä miten paljon geenin toimintaa on tutkittu. Geenin ”tuntemisarvosanan” (knownness score, KS) laskemiseen voi Gene Ontologyn 26 kriteeristä valita haluamansa ja vieläpä painottaa niitä omien mieltymyksiensä mukaan. Tietokannassa geenien tuntemisen voi määritellä  eri lajeille, ja todella tuntemattomia geenejä ovat ne, jotka saavat heikoimman KS-arvon useammalla lajilla. (Unknomen kaltaisia genomin tuntematonta kartoittavia projekteja on toki muitakin, esim. Understudied Proteins Initiative.)

Unknome-tietokannasta saatavat tienviitat helpottavat tutustumista genomin ”unknown unknowns”-laariin. Ihan pikkukapasta ei ole kyse: tietokannan kaikista geeniperheistä noin 3 000 sai KS-arvoksi nollan, niitä ei siis tunneta lainkaan, ja näistä 805:een kuuluu myös ihmisgeenejä. Ihmisen noin 20 000 geenistä heikoimmin tutkittujen kategoriaan (KS <2) päätyi 1606 geeniä, melkein joka kymmenes. Itse (tämän alan maallikkona) olin luullut, että perustasolla perimä tunnettaisiin paremmin tai ainakin, että tärkeiden geenien toiminta olisi jotenkin tiedossa. Rochan ja kumppanien artikkeli antoi tiedeoptimismilleni niin sanotusti vastapalloon.

Aivan silppua nämä tuntemattomat geenit eivät nimittäin ole. Yleisellä tasolla tärkeyden puolesta puhui niiden löytyminen useilta lajeilta – ihmisen heikoimmin tunnetuista geeneistä 68 % löytyi myös muilta kuin selkärankaisilta, ja 45 % löytyy myös eläinkunnan ulkopuolelta. Tämä antaa osviittaa siitä, että toistaiseksi tuntemattomilla geeneillä voi olla hyvinkin tärkeitä rooleja elimistön toiminnassa. Evoluutio tuntee pyörän uudelleenkeksimisen hinnan ja säilyttää usein yksilön pärjäämisen kannalta tärkeimmät rakenteet samankaltaisina läpi aikojen (ja lajien).

Näyttö tuntemattomien geenien tärkeydestä ei rajoittunut pelkästään tuohon konservoituneisuusargumenttiin, se osoitettiin myös suoraan funktionaalisin kokein. Analyyseihin valittiin 260 ihmisen genomin heikosti tunnettua (KS < 1) geeniä, joille löytyi vastine myös banaanikärpäseltä. Merkitystä selvitettiin estämällä geenin toiminta (RNA-interferenssi ja/tai poisto CRISPR-geenisaksilla) ja seuraamalla sen vaikutusta banaanikärpäsyksilöihin erilaisissa oloissa.

Vaikutuksia geeneille totta vie löydettiin. Kuudenkymmenenkahden geenin (24 %) hiljentämisellä oli kohtalokkaat seuraukset banaanikärpästen jälkeläisille, niiden kehitys ei jatkunut koteloitumista pidemmälle. Lopuista 198 geenistä mm. viisi aiheutti koiraiden lähes täydellisen steriiliyden ja 7 vaikutti jälkeläismäärään merkittävästi alentavasti. Lisäksi kokeissa havaittiin kymmeniä geenejä, joiden hiljentäminen haittasi kudosten kasvua, proteiinisynteesin laatua, yksilöiden stressinsieto- tai liikkumiskykyä. Siiven kokoon vaikuttava geeni CG11103 hääräsi jopa Notch-signaloinnissa, yksilönkehitykselle tärkeässä solujenvälisessä viestinnässä.

Nämä kokeelliset tutkimukset osoittivat selvästi, että emme ole tienneet, ettemme tiedä tärkeitä asioita. Terveisiä Rumsfeldille.

Artikkeli antoi ajattelemisen aihetta myös muille kuin geenien toimintaa tutkiville. Tulokset nimittäin kertoivat myös siitä, miten tiedettä tehdään: sillä on taipumus urautua jo tunnetun liepeille. Unknome-tietokannasta paljastui, että geenin toiminnan selviäminen viime vuosikymmenellä riippui siitä, kuinka hyvin perheen muita geenejä tunnettiin lähtöhetkellä. Samanhenkiseen tulokseen päädyttiin myös aiemmin julkaistussa tutkimuksessa (Stoeger et al. PLOS Biology 2018). Tässä meta-analyysissä osoitettiin muun muassa, että kaikista vuonna 2015 julkaistuista geenien toimintaa käsittelevistä artikkeleista 49 % keskittyi geeneihin, jotka tunnettiin jo vuonna 1991 – ja tähän sakkiin mahtuu vain 16 % kaikista geeneistä. Stoeger et al. kutsuvat ilmiötä nimellä ”aikaisempien tutkimuskohteiden luutuminen” (ossification of past research topics). Sehän on lähes pelottavaa: se mitä geenejä/proteiineja 1990-alkupuolella tutkittiin on riippunut paljon tuolloisista teknisistä mahdollisuuksista, ja se on ohjannut tutkimusta edelleen ainakin 25 vuotta. Toki tutkimusaiheita ohjaavat muutkin asiat, erityisesti rahoitus, mutta mitä 1990-luvun alussa olisi tutkittu, jos käytössä olisi ollut uuden sukupolven sekvensointi- ja/tai CRISPR/Cas9-tekniikat? Ja se olennaisin kysymys: mitä tutkisimme tänään, jos käytössämme olisi 2050-luvun tekniikka X? Tässä valossa Rocha et al. -artikkelin mielestäni tärkeä yleinen viesti on, että kaikilla aloilla ei-tutkittujen asioiden systemaattinen kartoitus voisi  johtaa parempaan tutkimukseen. Tuntemattomalla on itseisarvoa.

Tuntemattoman merkityksestä tieteessä on saarnannut erityisesti Columbia Universityn neurobiologian professori Stuart Firestein. Hän itse asiassa puhuu tietämättömyydestä (ignorance), ja korostaa, ettei tarkoita laiskaa tyhmyyttä, vaan hyvää käsitystä siitä, että tiedon rajojen ulkopuolella on paljon tietämisen arvoisia asioita. Firestein on kirjoittanut aiheesta kirjan Ignorance: How It Drives Science (tunnustetaan, en ole vielä lukenut) ja pitänyt yleisöluentoja (vaikkapa TEDtalk 2013), joissa ravistellaan tieteenteon ja ”tieteellisen metodin” peruskäsitystä. Firesteinin mukaan tiede ei ole aikaisemman tietokasan korottamista, sitä vie ponnekkaimmin eteenpäin se mitä emme tiedä. Tässä on viesti erityisesti opetukseen: eritoten tutkijoiksi aikoville opiskelijoille tulisi luennoida paljon enemmän siitä, mitä kullakin alalla ei tiedetä. Tiedon määrä ei tee ihmisestä tutkijaa, vaan se miten ihminen tietojensa avulla hahmottaa tuntematonta – loppujen lopuksi tuntematon on se, joka saa tutkijan tekemään pitkää päivää. Firesteinin mukaan tieteessä olennaisinta on siis tietoa seuraava tietämättömyys, ei tietämättömyyttä seuraava tieto. Ollaan lähellä Ilkka Niiniluodon ajatusta ”mitä suurempi on tiedon meri, sitä pidempi on tietämättömyyden rantaviiva”. Meidän pitää vain arvostaa enemmän sitä mitä emme tiedä.

Myös Rochan ja kumppaneiden tutkimustulokset tuntemattomien geenien tärkeydestä ovat osoitus tuntemattoman merkityksestä ja korostavat samalla rohkeaa perustutkimusta. Ounastelen kuitenkin, ettei kopin otto tästä ole varsinaisesti tutkijoista kiinni, ajatus tuntemattoman tuntemattoman tutkimusprojektista olisi varmaankin usealle tieteentekijälle kiehtova ja innostava. Rahoituksen saaminen tämmöiselle projektille on todennäköisesti kuitenkin uhkapeliä, johon on vaikea lähteä.

Tätä kirjoittaessa keskustellaan tutkimusrahoituksesta valtion ensi vuoden budjetissa. Raha näyttäisi olevan lisääntymässä, mutta paino on tunnettujen tunnettujen soveltamisessa käytäntöön, parhaimmillaankin tunnetuissa tuntemattomissa. Valtioneuvostossa ei ilmeisesti lueta PLOS Biologya.

Jukka Palo, oikeusgenetiikan dosentti
HY/THL