Keminformatiikan taidoilla kokeellisuutta voidaan vähentää ja mallit ohjaavat tieteellistä ajattelua: asiantuntijoiden näkemyksiä kemiasta

Piirto-ohjelmistot, molekyylimallinnus ja kemiallisen tiedon tietopankit ja tietotyypit perustuvat informatiikkaan kemiasta, eli keminformatiikkaan. Rakennekaavat luetaan merkkien ja numeroiden jonoina, tietotyypit muuttavat matemaattisilla malleilla atomit ja sidokset tietokoneelle luettaviksi verkoiksi ja miljoonat molekyylit on tallennettu tuoreimmista kokeellisista tutkimuksista julkisiin tietokantoihin. Keminformatiikka mahdollistaa nykytutkimuksen, jossa datasta otetaan kaikki irti. Esimerkiksi parhaista lääkeaineista ja niiden rakenteista voidaan keminformatiikalla etsiä uusia lupaavia lääkkeitä mallintamalla samankaltaisia lääkkeitä, tutkia näiden mallien kemiallisia ominaisuuksia ja analysoida laajoja aineistoja laskennallisilla menetelmillä. Tämä mahdollistuu vain tietokoneilla ja datatieteellisellä analyysillä, koska tietoa on lääkeaineista massiivisesti, ja siksi teknologiat kuten tekoäly ja koneoppimisen mallit auttavat tutkijoita ymmärtämään miten tietojenkäsittelytieteellä voidaan mallintaa ja simuloida kemiaa.

Uudet teknologiat ja keminformatiikka asettaa myös painetta koulutukseen ja oppimiselle uusinta teknologian hyödyntämiseen. Siksi tässä tutkielmassa selvitettiin asiantuntijoita, tutkijoita haastattelemalla miten keminformatiikkaa kemiassahyödynnetään ja mitä taitoja siihen tarvitaan. Lopuksi mietittiin miten opetus ja oppiminen voi mahdollisesti hyödyntää keminformatiikkaa. Ohjelmointitaidot ovat keminformatiikan keskiössä. Python-ohjelmointi korostui erityisesti sen laajan käytön myötä ja erityisesti, koska se tekee koneoppimisesta ja eri ohjelmistojen hyödyntämisestä helpompaa. Osaamistavoitteet olivat kuitenkin erilaiset sen suhteen, kuinka paljon koneoppimista ja ohjelmointia kemistit tarvitsevat. Ala muuttuu nopeasti ja on kasvava monitieteellinen tieteenhaaransa, jonka keskiössä on kemia, mutta tämän lisäksi myös biologia ja fysiikka, kun mallintaminen tarkastelee yhä kompleksisempia ilmiöitä. Keminformatiikasta voidaan silti saada yleistettävää ja tavoitteet ovat suuret: kokeellisuutta voidaan vähentää, kun osa tuloksista voidaan simuloida aiempaan kokeellisuuteen pohjautuen. Tämän lisäksi hypoteesien testaaminen ja tutkimuksellisuudessa ajatteluntaidot ja ideointi voivat auttaa ongelmanratkaisussa aivan uudella tavalla: tietokoneen objektiivisia malleja hyödyntäen. Keminformatiikka näyttäytyy lupaavalta, mutta haastavalta monitieteelliseltä tieteeltä, josta tulisi käydä enemmän julkista keskustelua yliopistokoulutuksessa.

Tutustu koko tutkimukseen ja yksikön muihinkin tutkielmiin tästä. 

Teksti: FM Aleksi Takala