Ihmisen genomitieto täyttää 20 vuotta

Viiden viikon ikäinen Jimmy (ei oikea nimi) tuotiin sairaalaan vaikeiden aivo-oireiden vuoksi. 10 vuotta aiemmin hänen vanhempi sisaruksensa oli kuollut alle vuoden ikäisenä samankaltaisesti alkaneeseen enkefalopatia-aivosairauteen, joten vanhemmat olivat ymmärrettävästi hyvin peloissaan. Pikkuvauvan enkefalopatian taustalla voi olla monia eri syitä, muun muassa 1 500 eri geneettistä sairautta, joita voidaan hoitaa eri tavoin. Niin kauan kun syy ei ole tiedossa, mahdollisia tarkempia ja kohdennettuja lääkityksiä ei voida kokeilla arvailemalla, vaan hoito keskittyy oireiden, kuten epilepsian hallintaan.

Jimmyn onneksi ihmisen koko genomin sekvensoinnin eli Human Genome Projectin (HGP) valmistuminen täytti tänä vuonna jo 20 vuotta (1). 1990-luvulla alkanut projekti oli valtava monien keskuksien yhteinen saavutus. Toisaalta se oli vasta uuden kehityksen alkusoittoa. Ensimmäisten sekvensoitavien (DNA-rakenteen selvittäjä James Watsonin ja sekvensointiyritys Celeran johtaja Craig Venterin) genomien läpilukeminen maksoi arviolta miljardin. Nykyään se on noin miljoona kertaa halvempaa, ja samanlainen kehitys on tapahtunut menetelmien nopeudessa.

Epävirallinen ennätys voitiin ehkä nähdä Jimmyn hoidossa, kun hänestä sekä molemmista vanhemmista iltapäivällä kello 15.52 otetusta verinäytteestä oli sekvensoitu kaikkien genomit seuraavan aamun kello 06.30 mennessä. Tulos käsiteltiin potilaskokouksessa kello 08.23 ja onneksi sen tulkinta oli melko selvä, joten sekvensoinnin perusteella tilattu hoito aloitettiin kello 12.13 – siis verinäytteen oton jälkeisenä päivänä! Tarkat kellonajat löytyvät NEJM:n artikkelista (2), jossa kuvataan tapahtuma uuden genomilääketieteen saavutuksena, jota se toki onkin.

Jimmyn vaikea aivosairaus johtui B1-vitamiinin eli tiamiinin puutteesta, jonka taustalla olleet harvinaiset perinnölliset geenivirheet löytyivät perheen DNA:ta tutkimalla. Diagnoosiin johtivat Jimmyltä löytyneet tunnetun tautigeenin kaksi muutosta, joista toinen periytyi äidiltä ja toinen isältä. Selvitettyyn tautiin oli onneksi olemassa täsmälääke, ja pikkupotilas oli oireeton jo samana iltana. Vain kymmenen vuotta aiemmin saman syyn takia lapsensa menettänyt perhe sai nyt Jimmyn terveenä kotiin parin päivän päästä. Edistyksen ja tiedon lisääntymisen taustalla on valtava tekninen kehitys DNA-sekvensoinnissa, jossa suurena osana on massiivisen rinnakkaissekvensoinnin menetelmä. Brittiläiset Shankar Balasubramanian ja David Klenerman pokkasivat tämän metodin luomisesta vuoden 2020 Millennium -teknologiapalkinnon (3).

HGP-projektilla ja edelleen koko ajan tarkentuvalla ihmisen koko genomin selvityksen tuloksilla on useita merkityksiä. Perustavanlaatuisin niistä lienee ihmislajin oman ja erityisen DNA-sekvenssin selvittäminen osana biologian tutkimusta ja lajien välisten erojen tai samankaltaisuuksien kuvausta. DNA-tieto kertoo eri eliöiden sukulaisuuksista, evoluutiosta ja ajan myötä kehittyneistä uusista biologisista piirteistä. Samalla se antaa tietoa esimerkiksi ympäristön muutoksien aiheuttamasta valintapaineesta elonkirjon kehityksessä.

Toinen tärkeä asia on ihmiskunnan referenssisekvenssin kokoaminen. Kun ihmisen DNA-koodiksi valitaan jokin yhteinen, noin 3 miljardin kirjaimen kaanon, se antaa meille mahdollisuuden vertailla yksilöitä tähän kuvitteelliseen keskivertoiseen Malli Meikäläiseen. Kahden sekvenssin erot on kohtuullisen helppo huomata DNA-tasolla, mutta sen sijaan löydöksen merkityksen ymmärtäminen voi olla työn ja tuskan takana eikä ole aina ollenkaan yksiselitteistä. Kun tiedämme lisäksi, että vain noin 1,5 prosenttia genomistamme koodaa jotain proteiinia ja valtaosan merkitys on vielä tuntematonta, tulkinnan vaikeus on helppo ymmärtää.

Kliinisen genetiikan alalla painimme joka päivä ihmisen sekvenssi-informaation kysymyksen parissa. Vaikka nykyään tiedämme, mitä suurimmalla osalla ihmisiä pitäisi lukea genomin tietyssä kohdassa, silti on usein vaikea tulkita mikä merkitys siitä paikasta mahdollisesti löytyvällä muutoksella olisi. Erään arvion mukaan kaikilla meillä esimerkiksi on noin joka tuhannes DNA-emäs erilainen ilman, että siitä on mitään näkyvää seurausta. Pelkkien pistemäisten varianttien määrä olisi siis jo kolmen miljoonan luokkaa – jokaisella ihmisellä. Tämän päälle tulevat rakenteelliset muutokset, kuten kahdentumat tai genomin osien häviämät, joita löytyy myös yllättävän usein. Tiede ja sairaanhoito on mennyt useita kertoja vipuun, kun olemme kuvitelleet jonkun DNA-variantin virheellisesti tarkoittavan jotain, vaikka todellisuudessa asia ei olekaan ollut näin.

Mikäli henkilöllä epäillään olevan geneettinen sairaus ja hänelle tehdään DNA-tutkimus, kliinistä sekvensointia suorittavat laboratoriot luokittelevat löydetyt muutokset viiteen eri kategoriaan sen mukaan, kuinka todennäköistä on, että DNA-muutos on taudin syy. Melko usein vielä eteen tulee vastaus, että kyseessä oleva muutos on merkitykseltään tuntematon. Voi esimerkiksi olla, että sitä ei ole aiemmin nähty tai se on jossain geenissä, jonka merkitystä ei ymmärretä. Tiedämme lisäksi, että eri ihmisillä olevat samatkin yksittäiset muutokset voivat aiheuttaa eri seuraamuksia ja usein tauti voi olla monen geneettisen tekijän ja ympäristön yhteisvaikutusta.

HGP osui siihen kohtaan kehitystä, jolloin massiivisia tietomääriä käyttävät ja yhteistyössä tehtävät tutkimukset alkoivat yleistyä biotieteissä. Tutkimustuloksien jakaminen julkisiin tietovarantoihin on nykyään normaalia, mutta sekin on ollut mahdollista vasta melko vähän aikaa. Julkisia geenitietokantoja on nyt kymmeniä, ja datan määrä ylittää sen merkityksen ymmärtämisen monella kertaluokalla. Esimerkkejä laaja-alaisen datan käytön hyödyistä on jo nähtävissä: lääkekehitys on tehokkaampaa, kun mukaan otetaan tutkittavien laaja-alainen geneettinen profiili (4), ja ihmisten sairastumisriskejä voidaan käyttää ennustamaan ja suuntaamaan esimerkiksi seurantaa tai kannustintoimia (5). Ihmiskunnan DNA-tieto on toistaiseksi pahasti länsimaiden populaatioihin painottunutta, mutta tähän on herätty ja asia on korjaantumassa (6).

HGP:n täyttäessä vuosia voidaan olla tyytyväisiä siihen, että ihmisen koko genomin kirjainten järjestys on onnistuneesti selvitetty ja olemme teknisesti valtavan paljon edistyneempiä kuin muutama vuosikymmen sitten. Joskus sekvensointituloksia ja DNA-tietoa voidaan käyttää suoraan hyödyksi, kuten Jimmyn pelastuminen osoittaa, mutta silti: DNA-biologian ymmärryksemme on edelleen vasta alussa.

Kirmo Wartiovaara
dosentti, Helsingin yliopisto, perinnöllisyyslääkäri, HUS

 

Viitteet:

  1. Jennifer E. Rood, Aviv Regev (2021). The legacy of the Human Genome Project. SCIENCE 373:1442-1443
  2. Owen M ym. (2021) Rapid Sequencing-Based Diagnosis of Thiamine Metabolism Dysfunction Syndrome. New England Medical Journal 384: 22
  3. https://millenniumprize.org/winners/next-generation-dna-sequencing/
  4. Nelson, M., Tipney, H., Painter, J. et al.The support of human genetic evidence for approved drug indications. Nat Genet 47, 856–860 (2015)
  5. Khera, A.V., Chaffin, M., Aragam, K.G. et al.Genome-wide polygenic scores for common diseases identify individuals with risk equivalent to monogenic mutations. Nat Genet 50, 1219–1224 (2018)
  6. Martin, A.R., Kanai, M., Kamatani, Y. et al.Clinical use of current polygenic risk scores may exacerbate health disparities. Nat Genet 51, 584–591 (2019)