Hakukone tunnistaa aineenvaihduntatuotteet aiempaa nopeammin ja tarkemmin
Prosenttiosuus hauista, joissa oikea tunnistus on ensimmäisten osumien (top10) joukossa. Aalto-yliopiston ja Jenan yliopiston menetelmä on kilpailevia menetelmiä selvästi tarkempi.
Aalto-yliopiston ja saksalaisen Jenan yliopiston tutkijat ovat kehittäneet CSI:FingerID-hakukoneen, joka tunnistaa aineenvaihduntatuotteet tandemmassaspektrometrimittauksista yli 150 prosenttia parasta kilpailijaansa tarkemmin ja voi näin helpottaa muun muassa bio- ja lääketieteen tutkijoiden työtä. Tutkimus julkaistiin äskettäin arvostetussa PNAS-lehdessä.
Aineenvaihduntatuotteet ovat pieniä molekyylejä, kuten sokereita, rasvahappoja ja aminohappoja, jotka toimivat soluissa muun muassa energianlähteinä ja soluseinien rakennusaineina. Tutkijoille ne ovat ikään kuin jälkiä solujen toiminnasta ja tilasta.
Rakensimme tutkimuksessa koneoppimismetodeita hyödyntävän mallin, jonka ennustamia molekyylirakenteita voidaan käydä läpi samaan tapaan kuin Googlen hakukoneen hakutuloksia.
– Aineenvaihduntatuotteita on paljon, sadoistatuhansista miljooniin, ja ne kaikki näyttävät vähän samankaltaisilta. Rakensimme tutkimuksessa koneoppimismetodeita hyödyntävän mallin, jonka ennustamia molekyylirakenteita voidaan käydä läpi samaan tapaan kuin Googlen hakukoneen hakutuloksia, Aalto-yliopiston professori Juho Rousu ²õ±ð±ô¾±³Ù³Ùää.
Molekyylin sormenjäljet
Tutkimuksessa käytetty tandemmassaspektrometri on laite, joka pilkkoo molekyylit palasiksi ja mittaa palasten massat ja suhteelliset osuudet eli massaspektrin. Aallon ja Jenan tutkijoiden menetelmässä kustakin opetusaineiston spektristä lasketaan ensin fragmentaatiopuu, joka kuvaa, mistä palasista pilkkoutumalla kukin molekyyliosanen on syntynyt. Tämän jälkeen tutkijat opettavat koneoppimismallia suurella määrällä fragmentaatiopuita ja kutakin puuta vastaavan molekyylin ominaisuuksia eli sormenjälkiä. Kun mallille sitten annetaan uuden molekyylin spektri, se ennustaa sille todennäköiset sormenjäljet, joiden perusteella haetaan molekyylitietokannasta joukko parhaiten vastaavia molekyylejä.
Tällä hetkellä molekyylien tyypistä riippuen jopa 95 prosenttia hauista tuottaa oikean hakutuloksen 10 ensimmäisen osuman joukkoon. Tunnistamisen täsmällisyys paranee aineistoa kasvatettaessa. Tällä hetkellä mallin muodostamiseen on käytetty noin 6000 massaspektriä. Täydellisessä tilanteessa koneoppimiseen perustuva hakukone ehdottaisi aina ensimmäisenä osumana oikeaa molekyyliä, mutta se vaatii aineiston huomattavaa kasvattamista ja menetelmien kehittämistä.
Tutkimuksesta voi olla hyötyä erityisesti bio- ja lääketieteen tutkijoille. Tulevaisuuden mahdollisia sovellusalueita on esimerkiksi anti-dopingtyössä, tullin huumevalvonnassa ja rikospaikkatutkinnassa.
Tutkimus on tehty yhteistyössä Jenan yliopiston professori Sebastian Böckerin tutkimusryhmän kanssa, ja se on hyvä esimerkki Aalto-yliopiston tietotekniikkaan ja digitaalista terveyttä yhdistävästä tutkimuksesta.
³¢¾±²õä³Ù¾±±ð³Ù´ÇÂá²¹:
Professori Juho Rousu
Puh. 050 415 1702
juho.rousu@aalto.fi
Linkki artikkeliin
Lue lisää uutisia
Aalto Inventors juhlii ensimmäistä vuottaan: Rakentamassa siltaa tutkimuksesta vaikuttavuuteen
Aalto Inventors juhlii ensimmäistä vuosipäiväänsä: se on osallistuttanut kuuden kurssin kautta 190 tutkijaa eri aloilta kuten tekoäly, kvanttiteknologia ja biomateriaalit. Uusia kursseja on suunnitteilla seuraavalle lukuvuodelle – pysy kuulolla ja liity postituslistalle.
Kuinka saada työntekijät takaisin toimistolle
Työpaikalle paluuta koskevat ohjeistukset miellyttävät työnantajia. Jotta työntekijät suhtautuisivat niihin myönteisesti, heille tulee tarjota kohtuullinen vastine autonomian rajoittamisesta.
Arkkitehtuuriprojekti Milanossa yhdisti lasten ideat ja huippuarkkitehtien visiot
Aalto-yliopiston arkkitehtuurin laitos oli mukana kansainvälisessä One Earth – House of the Heart -projektissa, joka esiteltiin huhtikuussa Milano Design Weekillä.