Geenitutkijat eivät yllättyneet: suomalaiset poikkeavat geneettisesti muista eurooppalaisista

Uusi Suomi -verkkolehti uutisoi torstaina 18.8. näyttävästi suomalaisten geeneistä. Uutinen liittyi arvostetussa Nature-tiedelehdessä 17.8. julkaistuun juttuun, jossa oli tutkittu proteiineja koodaavaa perimän osaa yli 60.000 ihmiseltä eri mantereilta.

Alkuperäinen Nature-juttu on huikean hieno – eihän se toki muuten olisi Natureen päässytkään – ja siinä esitelty maailmanlaajuinen ExAC-vertailuaineisto on korvaamaton työkalu tautigeenitutkimuksille. Suomalaisista (joita on mukana noin 3300 yksilöä) ja suomalaisten geneettisestä historiasta Naturen jutussa ei kuitenkaan juurikaan puhuta. Itse asiassa suomalaiset esiintyvät kaikkiaan kahdessa lauseessa ja yhdessä jutun viidestä kuvasta.

Silti Uusi Suomi nosti suomalaisten omaleimaiset geenit juttunsa pääaiheeksi, ja sitä ja/tai Itä-Suomen yliopiston lehdistötiedotetta siteerattiin laajasti sekä muissa tiedotusvälineissä (esim. Helsingin Sanomat, Tekniikka&Talous, Finland Today) että pitkin poikin sosiaalisessa mediassa. Osa toimittajien otsikoinneista – saati sitten somessa vedetyistä johtopäätöksistä – oli vähintäänkin erikoisia.

Siltä varalta että jotakin olisi vielä pelastettavissa, vaikka ensimmäisistä jutuista on some-skaalalla jo pieni ikuisuus, haluan oikaista muutaman pääasian. Tiivistettynä: Suomalaiset toki eroavat muista eurooppalaisista geneettisesti – se ei ole edes uutinen. Siitä ei kuitenkaan seuraa, että suomalaisten geenit eivät olisi eurooppalaista alkuperää (ne ovat, paitsi muutama). Ja siitä ei varsinkaan seuraa, että suomalaiset eivät olisi eurooppalaisia, se kun ei ole vähimmässäkään määrin geneettinen asia.

Suomalaiset poikkeavat geneettisesti muista eurooppalaisista – eikä geneetikko hämmästynyt yhtään

Eurooppalaisia tarkasteltaessa suomalaiset erottuvat geneettisesti omaleimaisina. Tämä on ollut tiedossa jo kauan yksittäisten perimänkohtien osalta. Perimänlaajuisesti ja kattavalla eurooppalaisotoksella asiaa päästiin ensi kertaa tarkastelemaan vuonna 2008, ja ero oli silloinkin päivänselvä:

Geneettiset etäisyydet EuroopassaGeneettiset etäisyydet Euroopassa. Kuvan lähde: Lao ym. Correlation between genetic and geographic structure in Europe. Current Biology 18:1241-1248 (2008). doi: 10.1016/j.cub.2008.07.049.

Niinpä ei ole yllättävää, että ero näkyi nyt myös Naturen jutussa ja johti siihen, että suomalaisia päädyttiin käsittelemään jutussa omana ryhmänään. Juuri saman eron vuoksi on tuikitärkeää, että jutussa esitellyssä ExAC-tietokannassa ja vastaavissa vertailuaineistoissa on mukana riittävän monta suomalaista, sillä tautigeenitutkimuksissa ei riitä suomalaispotilaiden vertailu pelkkiin eurooppalaisiin.

Suomalaisten geenit ovat pääosin eurooppalaista alkuperää

Suomalaiset siis eroavat geneettisesti muista eurooppalaisista. Kyse ei kuitenkaan ole siitä, että suomalaisten geenit olisivat aivan erityyppisiä kuin muualla Euroopassa. Päinvastoin: suomalaisten geenit ovat enimmäkseen peräisin Euroopasta. Omaleimaisuutemme johtuu lähinnä siitä, että monien geenimuotojen yleisyydet ovat Suomessa erilaiset kuin muualla Euroopassa. Siihen puolestaan ovat johtaneet paikalliset väestöhistorialliset tekijät kuten väestön pieni koko ja suhteellinen eristyneisyys.

Suomalaisten geenien eurooppalainen alkuperä näkyy selvästi sellaisissa tarkasteluissa, joissa vertaillaan yksilöitä useammalta mantereelta. Niissä suomalaiset ryhmittyvät yksiselitteisesti eurooppalaisten joukkoon:

PLoS1_SFig3

Geneettiset etäisyydet Euroopan, Afrikan ja itäisen Aasian välillä. Kukin piste on yksi yksilö. Oikealla alhaalla nigerialaisia (yoruboja Ibadanista); ylhäällä kiinalaisia (Pekingistä) ja japanilaisia (Tokiosta); keskellä vasemmalla eurooppalaisia: Itä-Suomi (punainen), Länsi-Suomi (vihreä), Ruotsi (musta), Saksa (tummansininen), Iso-Britannia (aniliininpunainen). Kuvan lähde: Salmela ym. Genome-wide analysis of single nucleotide polymorphisms uncovers population structure in Northern Europe. PLoS One 3: e3519 (2008). doi:10.1371/journal.pone.0003519.

(Mannertenvälisissä vertailuissa, kuten yllä, suomalaisten perimässä näkyy usein myös pieni itäinen vaikutus. Siitä – ja Suomen-sisäisestä itä-länsierosta jota Uuden Suomen juttu myös sivusi – lisää ehkä tuonnempana. Joka tapauksessa valtaosa nykysuomalaisten geeneistä, sekä Itä- että Länsi-Suomessa, on eurooppalaista alkuperää; vain hyvin pieni osa näyttää saapuneen jostain idempää, todennäköisesti varsin kauan sitten.)

Eurooppalaisuus ei riipu geeneistä

Suomalaisten ja muiden eurooppalaisten geneettisen eron suuruus tai syy eivät vaikuta siihen, ovatko suomalaiset eurooppalaisia. Geenit eivät tuota eivätkä määrää ihmisen kulttuurista tai etnistä identiteettiä. Eurooppalaisuus on maantieteellinen, (geo)poliittinen ja/tai kulttuurinen käsite, ei geneettinen.

————————————————————-

Huomautus 1:
Naturen jutussa suomalaiset mainitaan kahdessa lauseessa. Ensimmäinen maininta on jutun toisella sivulla (s. 286), jossa kuvataan miten aineiston yksilöt jaoteltiin maantieteellisesti analyyseja varten ja sanotaan:
"We further separated Europeans into individuals of Finnish and non-Finnish ancestry given the enrichment of this bottlenecked population; the term European hereafter refers to non-Finnish European individuals."
Erottelussa on siis kyseessä analyysitekninen valinta, koska suomalaiset tiedetään (ja havaitaan) geneettisesti sen verran erilaisiksi. Samalla mainitaan huolellisesti, että ei-suomalaisten eurooppalaisten kutsuminen pelkästään ‘eurooppalaisiksi’ on silkka tekstin lyhennysmerkintä, ei kannanotto.

Toisen kerran suomalaiset mainitaan erikseen, kun jutun viidennellä sivulla (s. 289) selostettavissa tuloksissa todetaan:
"ExAC recapitulates known aspects of population demographic models, including an increase in intermediate-frequency (1–5%) PTVs [protein-truncating variants] in Finland [32] and relatively common (>1%) PTVs in Africans (Fig. 5b)."
Hakasuluissa mainittu referenssi numero 32 on PLoS Geneticsissä vuonna 2014 ilmestynyt juttu Distribution and medical impact of loss-of-function variants in the Finnish founder population (ensimmäisenä kirjoittajana E. T. Lim), jossa kyseinen ilmiö on siis aiemmin havaittu.

Huomautus 2:
Suomalaisten geenejä ovat muokanneet monet väestöhistorialliset tekijät, esimerkiksi suhteellisen vähäinen tulomuutto, alhainen väentiheys ja niihin liittyneet geneettiset pullonkaulat. Samat tekijät ovat voineet vaikuttaa jo esihistoriallisista asutusvaiheista lähtien, eikä nykysuomalaisten geneettisten erityispiirteiden muodostumisaikoja tunneta tarkasti. Todennäköisesti kyse on selvästi vanhemmista ilmiöistä kuin vaikkapa Uuden Suomen juttu antoi ymmärtää. Esimerkiksi Pähkinäsaaren rauhan raja ja geneettinen itä-länsi-“raja” suhtautunevat toisiinsa lähinnä kuten jäätelönsyönti ja hukkumiskuolemat: yhteisesiintyminen selittyy yhteisillä taustatekijöillä. Samoin suomalaisten geeneissä havaittu pieni itäinen vaikutus lienee ennemmin tuhansia kuin satoja vuosia vanhaa perua.

6 thoughts on “Geenitutkijat eivät yllättyneet: suomalaiset poikkeavat geneettisesti muista eurooppalaisista

  1. Hanna

    Ihmettelen tuota graafia jossa Suomi näyttää erilliseltä saarelta. Tuohan on karkeasti ottaen Suomen maantieteellinen asema niiden maiden joukossa jotka ovat mukana: välissä olevat maat on jätetty tutkimatta. Näyttäisikö Suomi siis saarelta jos Baltian maat olisivat mukana? Vai liekö baltian omaleimaisuus häiriintynyt enemmän muuttoliikkeiden vuoksi?

    1. Elina Salmela Post author

      Hei Hanna, ja kiitos kommentista!

      Itse asiassa tuossa kuvassa suomalaisnäytteitten geneettinen sijainti vastaa maantiedettä tosiaan vain varsin karkeasti ottaen. Tutkimuksessa useimpien maiden otokset olivat tarkoituksella melko pieneltä maantieteelliseltä alueelta, ja kuvan B kartassa kunkin otoksen pisteet on merkitty nimenomaan näille alueille [paitsi että en ole aivan varma, onko Norjasta onnistuttu merkitsemään oikea Førden alue, vai olisiko kyseessä sittenkin samanniminen, isompi paikkakunta vähän pohjoisempana]. Mukana olevat suomalaiset ovat helsinkiläisiä, joiden vanhemmista ja isovanhemmista osa on kotoisin eri puolilta Suomea; Suomen pisteen (FI) voi siis halutessaan kuvitella myös vähän kauemmas sisämaahan.

      Yhtä kaikki Suomen ja Ruotsin (Uppsalan alueen) otosten maantieteellinen etäisyys on samaa luokkaa tai pienempikin kuin vaikkapa Ruotsin ja Norjan, Ruotsin ja Tanskan (Kööpenhaminan alueen) tai Tanskan ja Hollannin (Rotterdamin alueen) välinen etäisyys kartalla, mutta Suomen ja Ruotsin otosten välinen geneettinen etäisyys on selvästi suurempi kuin Ruotsin, Norjan, Tanskan ja Hollannin väliset. Sama pätee useimpien muidenkin Euroopan maiden vertailuissa. Toisin sanoen suomalaiset ovat geneettisesti kauempana muista eurooppalaisista kuin maantieteellisen sijainnin perusteella olettaisi.

      Olet oikeassa siinä, että suomalaisten geneettinen eroavuus voisi tuossa kuvassa korostua siksi, että Baltian maat eivät ole mukana vertailussa. Eroavuus ei kuitenkaan kokonaan selity pelkällä mukana olevien maiden valikoimalla, vaan suomalaiset näyttäytyvät omaleimaisina myös silloin, kun mukana on virolaisia, baltteja ja venäläisiä (Nelis ym. 2009, kuva S2, joka löytyy myös aiemmasta blogipostauksestani).

  2. B

    Hei,

    Suomi näyttää olevan täysin erillään muista Euroopan maista, mutta missä määrin suomalaisten geeniperimä kokonaisuudessaan eroaa muista? Ts. onko suomalaisten geeniperimä kokonaisuudessaan erilainen, vai vain suhteessa siinä määrin muita enemmän, että suomi ajautuu graafissa muista erilleen? (Eli suomalaisilla olisi vaikka suhteessa muihin 70% erilainen geeniperimä, kun muilla vain 40% tms…). Tähän liittyen mainitsit toisessa kirjoituksessasi, että länsi- ja itä-suomalaiset ovat geeniperimältään etäänpänä toisistaan, kuin esim. britit ja pohjois-saksalaiset toisistaan, mutta tämän jutun yhteydessä olevasta graafista ei ehkä saa tätä käsitystä. Ts. jos mentäisiin puhtaasti geeniperimän pohjalta (ohittaen kansakunnan käsite), voitaisiinko perustellummin esittää itä-suomalaisia ja länsi-suomalaisia omiksi joukoikseen, brittien ja pohjois-saksalaisten sijaan?

    Sama kysymys afrikkalaisten, aasialaisten ja eurooppalaisten osalta? He näyttävät olevan geeniperimältään etäällä toisistaan, ts. erilaisia, mutta missä määrin? Osataanko geenitutkimusessa sanoa mitkä geenit tarkalleen ovat samoja, ja mitkä erilaisia? Ja kuinka suuri osa geeneistä on erilaisia ja kuinka suuri osa samanlaisia?

    Lisänä (tai osittain ensimmäiseen kysymykseen liittyen), olen ollut siinä käsityksessä, että tietyn ryhmän sisällä löytyisi enemmän variaatiota geeneissä, kuin kahden ryhmän välillä? Pitääkö tämä paikkansa / voidaanko näin sanoa, vai löytyykö esim. itä- ja länsisuomalaisten välillä enemmän variaatiota geeneissä, kuin länsi-suomalaisten keskuudessa?

    1. Elina Salmela Post author

      Hei B.,

      kiitos kysymyksistä ja pahoittelut vastauksen viipymisestä.

      Vastaan viimeiseen ensiksi: olet aivan oikeassa siinä, että ihmislajilla suurin osa geneettisestä vaihtelusta on yksilöitten välistä eli että populaation sisälläkin vaihtelu on suurta. Se, kuinka suurta täsmälleen, vaihtelee hieman tutkimuksesta toiseen ja riippuu mm. siitä, mitä perimänkohtia kulloinkin on tutkittu. Suuruusluokka on joka tapauksessa sellainen, että noin 85 % geneettisestä vaihtelusta on populaatioiden sisäistä eli yksilöiden välistä. Lopusta vaihtelusta noin puolet (5-10 %) on mantereiden välistä ja toinen puoli populaatioiden välistä mutta mantereiden sisäistä.

      Seuraa yksinkertaistettu esimerkki. Poimitaan geneettisesti tutkittavaksi satunnaisesti vaikkapa kaksi vapaaehtoista suomalaista, ranskalainen, japanilainen ja mongolialainen. Valitaan tarkasteluun 100.000 sellaista perimän kohtaa, jotka eroavat suomalaisen ja japanilaisen välillä. Kun verrataan keskenään kahta suomalaista, he eroavat toisistaan noin 85.000:ssa näistä kohdista; ranskalainen ja suomalainen puolestaan eroavat toisistaan noin 90.000-95.000 kohdassa, samoin japanilainen ja mongolialainen toisistaan. Tarkkaan ottaen ne laskutoimitukset, joilla geneettisen vaihtelun maantieteellistä jakautumista voidaan selvittää, ovat kyllä jonkin verran monimutkaisempia – kyse on monen yksilöparin vertailujen keskiarvoista jne. – mutta perusilmiö on osapuilleen tämä.

      (Tässä kohtaa sivupolkuna mainittakoon, että tällainen geneettisen vaihtelun jakauma ei ole eläinkunnassa mitenkään yleinen, vaan monilla muilla lajeilla suurin osa geneettisestä vaihtelusta on populaatioiden välistä. Esimerkiksi gorillapopulaatiot, jotka elävät muutaman kymmenen tai sadan kilometrin päässä toisistaan, voivat poiketa yhtä paljon kuin eri mantereilla asuvat ihmispopulaatiot. Syynä on mm. ihmislajin ennätysmäisen laaja esiintymisalue, jolle levittäytyminen on tapahtunut suhteellisen hiljakkoin; myös suuret populaatiokoot ja vuolaahko geenivirta ovat hidastaneet populaatioiden geneettistä etääntymistä toisistaan.)

      Monissa [populaatio]geneetikkoa kiinnostavissa kysymyksenasetteluissa keskeisiä eivät ole niinkään yksilöitten väliset erot vaan populaatioitten ja osapopulaatioitten erot. Niinpä analyysimenetelmät pyritään yleensä valitsemaan sen mukaisesti, että jälkimmäisiä saadaan paremmin näkyviin yksilöitten välisten erojen “alta”. Usein päädytään tarkastelemaan tavalla tai toisella populaatioiden keskiarvoja ja sitä, missä määrin ne eroavat toisistaan, vaikka hyvin tiedetäänkin, että ne eroavat toisistaan vähemmän kuin ne yksilöt, joista ko. populaatiokeskiarvo on laskettu (esim. 10 % vs. 85 %, vrt. yllä). Samoin se menetelmä, jolla yllä olevat geneettisten etäisyyksien kuvaajat on tuotettu (pääkomponenttianalyysi eli PCA), painottaa niitä perimänkohtia jotka aineistossa vaihtelevat eniten eli useimpien yksilöparien välillä. Silloin korostuvat tyypillisesti ne perimänkohdat, jotka eroavat maantieteelliseltä alueelta toiselle; vastaavasti vähiten painoa saavat ne kohdat, jotka erottavat vain yksittäisiä yksilöitä muista. Niinpä geneetikko tuloksissaan puhuu yleensä lähinnä populaatioiden (keskiarvojen) välisistä eroista, vaikka ne ovatkin pienempiä kuin yksilöiden erot populaatioiden sisällä – eikä välttämättä mainitse tätä disclaimeria missään, sillä kollegoille ei tarvitse ja toimittaja taas ei aina kuuntele niin kauas…

      Vastaavanlainen valinta, että keskitytään tutkittavan kysymyksen kannalta kiinnostaviin asioihin, tehdään yleensä jo aineiston keruun tasolla: yleensä ei suinkaan tutkita yksilöiden koko perimää – se ei ole ollut teknisesti mahdollistakaan kuin muutaman vuoden, ja tulee kalliiksi yhä – vaan tarkastellaan vain sellaisia perimän kohtia, joiden ennestään tiedetään vaihtelevan ihmisellä. Osa variaatiosta jää silloin väkisinkin piiloon, mutta kun tarkasteluissa on tyypillisesti kuitenkin joitakin kymmeniä tai satoja tuhansia perimänkohtia, niiden perusteella saadaan kyllä aivan kohtuullisen edustavia tuloksia. Nämä rajaukset voivat kuitenkin toisinaan johtaa hassunkurisen kuuloisiin tuloksiin, jos yksi tutkimus raportoi ihmisen ja simpanssin jakavan yli 98 prosenttia DNA:staan (nimittäin koko sekvenssin tasolla) ja toinen puolestaan kertoo suomalaisten ja ranskalaisten olevan 95-prosenttisesti samanlaisia (kun tarkastelu rajoittuu johonkin joukkoon ihmisellä varioivia perimänkohtia).

      Sitä, mitkä geenit täsmälleen eroavat millä tavalla milläkin yksilöillä tai populaatioilla, on periaatteessa suhteellisen suoraviivaista tutkia – silloin kun DNA-näytteitä on saatavilla, mikä ei toisaalta ole aina laisinkaan yksinkertainen asia – ja siitä myös tiedetään jo varsin paljon. Tässä yhteydessä on kuitenkin hyvä huomata, että vain osa tutkimuksissa nähdyistä eroista on oikeasti ja nimenomaisesti geeneissä, siis DNA:n proteiineja koodaavilla alueilla; suuri osa on geenien välisillä alueilla eikä todennäköisesti vaikuta mihinkään ominaisuuteen. Usein tällaisia neutraaleja merkkiominaisuuksiakin näkee nimitettävän geeneiksi lyhyyden ja selkeyden vuoksi, eikä siinä sinänsä ole mitään vikaa – ehkä lievää hämäävyyttä lukuun ottamatta. Mutta silloinkin kun on kysymys eroista DNA:n koodaavilla alueilla, ei useinkaan tiedetä miten ne tarkalleen vaikuttavat, sillä tietämys geenien toiminnan säätelystä on vielä lapsenkengissä.

      Yhteenvetona vielä muutama vastaus spesifisiin kysymyksiisi itä- ja länsisuomalaisista jne. Vaikka yksilöitten väliset geneettiset erot tosiaan ovat populaatioiden välisiä suuremmat, on esimerkiksi länsisuomalaisten välinen keskimääräinen ero kuitenkin pienempi kuin itä- ja länsisuomalaisten välinen, joka on keskimääräinen yksilöitten välinen suuri ero plus osapopulaatioitten välinen paljon pienempi ero. Suomalaisten geneettinen omaleimaisuus puolestaan on todellinen ilmiö, mutta se voi näyttäytyä geneettisissä vertailuissa tavallaan korostuneena, kun on keskitytty tutkimaan nimenomaan väestöhistorian kannalta mielenkiintoista vaihtelua – suomalaisten DNA:sta on kyllä 99,x % aivan samanlaista kuin muillakin ihmisillä. Ja mitä tulee eurooppalaisten jakamiseen joukkoihin DNA:nsa perusteella, se on kyllä lähtökohtaisesti hankalaa, ensinnäkin koska yksilöllistä vaihtelua tosiaan on niin paljon (samaan joukkoon todennäköisesti päätyisi erimaalaisia ihmisiä) ja toiseksi koska sekin osa vaihtelusta joka korreloi maantieteen kanssa on pääasiassa jatkuvaa; mitä tasaisempi maantieteellinen otanta, sitä mahdottomampaa on päästä vetämään rajaa yhtään mihinkään.

Comments are closed.