Paljon tietoa tyhjästä

LHC-kiihdytin tuottaa paitsi valtavan määrän protonien törmäyksiä, myös käsittämättömän suuren määrän mittaustietoa: saman verran kuin miljardi samanaikaisesti webissä surffailevaa ihmistä kuluttaisi. Tietomäärän oikea-aikainen siirtely ja käsittely vaatii sekin huipputekniikkaa. Tapio oli kahden viikon ajan CERNissä osallistumassa LHC-kokeiden yhteiseen tietojenkäsittelyharjoitukseen.

Kun LHC-kiihdytin käynnistyy, se tuottaa vastakkaisiin suuntiin kiihdytettyjen protonikimppujen törmäyksiä neljässä eri törmäyspisteessä parhaimmillaan 40 miljoonaa kertaa sekunnissa. Yksittäisten protonien törmäyksiä kertyy kaikkiaan 600 miljoonaa kappaletta sekunnissa. Jokaisesta törmäystapahtumasta kertyy talletettavaa tietoa yhden hyvälaatuisen digivalokuvan verran (noin 1 MB), joten LHC-kokeiden tietojenkäsittelyn haasteet ovat samaa suuruusluokkaa kuin miljardin valokuvan käsittely sekunnissa.

Gold-ion collision at STAR experiment
Kulta-atomien törmäyksen tuloksena syntyneiden hiukkasten ratoja yhdysvaltalaisen RHIC-laboratorion STAR-kokeessa. ( (c) STAR collaboration )

Kaikki valokuvat eivät kuitenkaan ole säästämisen arvoisia, eikä myöskään kaikkien törmäysten mittaustuloksia säästetä jatkokäsittelyä varten. Vain noin yksi kymmenesmiljoonasosa mitatusta tiedosta, noin 100 Megatavua sekunnissa, säilytetään jatkokäsittelyä varten. Tästäkin kertyy 15 Petatavua vuosittain, eli siis noin 20 miljoonan CD-levyn verran. Tämä valtava tietomäärä tarvitaan, koska jotkut kiinnostavat ilmiöt ovat hyvin epätodennäköisiä ja tapahtuvat äärimmäisen harvoin. Esimerkiksi Higgsin bosoneja saattaa syntyä parhaimmillaankin vain kymmenkunta vuorokaudessa kussakin törmäyspisteessä. Lisäksi, koska näistä vain osa havaitaan, tieteelliseen löytöön tarvittava määrä havaintoja joudutaan keräämään pitkältä, vähintäänkin vuoden ajalta. Jo suurten tietomäärien siirtäminen on suuri haaste, jota harjoitellaan hyvissä ajoin ennen LHC-kiihdyttimen käynnistymistä. Fysiikan tutkimuslaitos on mukana CMS-kokeessa, joka järjestää yhdessä muiden LHC-kokeiden kanssa paraikaa CSA08-harjoitusta (Computing, Software and Analysis Challenge 2008). Vastaavia, mutta pienimuotoisempia harjoituksia on järjestetty jo kuutena edellisenäkin vuotena. Ensi vuonnahan sitä ei enää järjestetäkään, silloin työskennellään jo oikeilla mittaustuloksilla eikä kyseessä enää ole harjoitus…

CSA08-harjoituksessa siirretyn datan määrä
Kaikkiaan 346 eri datayhteydellä siirretty datamäärä CERNin ja muiden laskentakeskuksien välillä CSA08-harjoituksen 1. vaiheessa helmikuussa 2008 .

CSA08-harjoituksessa tuotaan Monte Carlo -simulaatiolla generoituja mittaustiedostoja, joita siirretään, analysoidaan ja käsitellään muutenkin kuten tulevia LHC-tietojakin. Niistä myös lasketaan CMS-kokeen käyttämistä varten tarvittavat kalibrointivakiot, joiden avulla mittaustietoja voidaan oikaista ennen kuin ne ovat valmiit fysiikan analyysien laskemiseen. Tämä proseduuri on hieman samantapainen kuin ne ohjelmalliset korjaukset, joita Hubble-teleskoopille suoritettiin sen kolmen ensimmäisen käyttövuoden aikana, ennen kuin sen peileissä havaitut vääristymät saatiin korjattua erityisten optisten korjauskomponenttien avulla. On myös muita samankaltaisuuksia LHC:n ja Hubblen välillä: siinä missä Hubble avasi aivan uusia huikaisevia näkymiä maailmankaikkeuteen ja sen alkuhetkiin, LHC kertoo meille vastauksia aineen alkuperän perimmäisiin kysymyksiin sekä siihen, millaista ainetta maailmankaikkeuden alkuhetkillä on voinut olla olemassa.

Hubble
Hubble-avaruusteleskooppi erkanemassa Discovery-sukkulasta STS-82-lennolla vuonna 1997. ((c) NASA)