Videre til indhold. | Videre til menunavigation

Sekundær menu

Thomas Mailund Jensen

IT-teknikker til analyse af arvelige sygdomme

THOMAS MAILUND JENSEN

Thomas Mailund Jensen, Aarhus Universitet

Fagområde

Bioinformatik og datalogi.

Kort beskrivelse af projektet

Mange alvorlige sygdomme, som f.eks. kræft, er arvelige, dvs. der eksisterer en vis risiko for at udvikle kræft bestemt af vores individuelle gener.  Vi ved bare ikke i præcis hvilke gener, vi finder denne risiko.

Med ny teknologi er vi blevet i stand til at måle individuelle genetiske forskelle i stor stil.  På individniveau er det er muligt at måle hele arvemassen på én gang, og det er også muligt at måle den på tusinde af individer i et enkelt studie. I dette omfattende datamateriale er det et statistisk problem at finde de gener, der disponerer for eller beskytter imod de arvelige sygdomme.

Mit forskningsprojekt går ud på at udvikle datalogiske og statistiske metoder til analyse af disse genetiske data og sygdomsdata samt at udvikle effektivt computersoftware, der stiller disse metoder til rådighed for andre forskningsgrupper, der analyserer denne type data. 

De forskningsmæssige udfordringer og perspektiver

Vores evne til at måle og bestemme de genetiske forskelle mellem mennesker har udviklet sig betydeligt inden for de seneste fem-ti år.  For ti år siden havde vi ikke kortlagt den menneskelige arvemasse. I år tilbyder flere firmaer at kortlægge det meste af ens personlige arvemasse for under 1000 dollars.

De metoder, vi benytter til at analysere de data, vi nu kan generere, halter dog bagefter.  De sofistikerede metoder, vi har, er alt for langsomme til at kunne håndtere store datamængder, og de metoder, der kan håndtere de store datamængder, er ikke fintfølende nok til at udnytte dataenes fulde potentiale. Med de eksisterende sofistikerede metoder, vi i dag råder over, vil det tage hundreder eller tusinder af år at analysere data fra et enkelt studie – med de simplere metoder tager det kun minutter, men de resultater man få er ikke tilstrækkeligt nuancerede til dybere analyser.

Mit projekt går ud på at kombinere de fintfølende metoder med effektivitet. Dette udgør både et statistisk og datalogisk problem: Det er nødvendigt at forenkle de matematiske modeller i de statistiske metoder, og det er nødvendigt at udvikle nye hurtige algoritmer til håndtering af data.

Hvad er de langsigtede perspektiver?

Hvad, jeg udretter i mit projekt, er mindre væsentligt end, hvad folk kan udrette med resultatet. Hvis vi kan identificere hvilke gener, der spiller en rolle i udviklingen af en sygdom, har vi taget det første skridt mod virkelig at forstå denne sygdom, og det er det første skridt til at forstå det biologiske maskineri, der går i stykker, når en sygdom udvikles. Forståelsen af dette maskineri kan så føre til en medicinsk udvikling, der i sidste ende kan hjælpe os med at helbrede, forebygge og bekæmpe sygdommen.

Hvordan forholder projektet sig til områdets internationale udvikling?

Teknologien til at producere de data, som mine metoder kan analysere, er kun få år gammel. Det er blot inden for det seneste år, at de første store studier med denne nye type data er blevet publiceret, og for det meste er de statistiske metoder, der er brugt i disse studier, ganske simple.

Selv med simple metoder er vores viden om mange sygdomme eksploderet.  Den forøgede mængde data har gjort underværker for vores viden om sygdommene og deres underliggende gener.  Men indtil nu har det været den lavthængende frugt, vi har plukket. Den næste bølge af studier har brug for bedre analysemetoder.

De seneste to år har jeg samarbejdet med en af verdens absolut førende grupper inden for denne type genetisk analyse – det islandske firma DeCODE Genetics. Vha. simple metoder har DeCODE haft stor succes med at finde genetiske varianter bag flere sygdomme. Mit samarbejde med DeCODE, en del af EU- projektet PolyGene (www.polygene.eu), fokuserer netop på at udvikle bedre analysemetoder til at hive mere information ud af de data, de har opsamlet. Dette samarbejde giver en unik mulighed for i praksis at afprøve og evaluere nye metoder på vigtige sygdomme. På denne måde vil der være meget kort fra teori til praksis.

Hvordan vil du anvende Det Frie Forskningsråds Ung Eliteforskerpris?

Jeg har et nært samarbejde med forskningsgrupper i England, Island og USA, og pengene vil gøre det lettere for mig at besøge disse grupper. I disse internettider er det nemt at have globale samarbejder, men at mødes fysisk er oftest mere stimulerende.

Da en stor del af mit arbejde omhandler udvikling af software, vil det også være en stor hjælp at kunne ansætte en eller to studerende til at assistere med dette udviklingsarbejde. Meget af arbejdet med at implementere nye metoder er noget, de fleste datalogistuderende vil kunne gøre, og kan jeg ansætte nogen til dette arbejde, vil jeg selv have mere tid til at udvikle metoderne bag softwaren.

Hvordan opstod din interesse for netop dette forskningsfelt?

Da jeg først startede mit arbejde på BiRC inden for bioinformatik, fik jeg kontor ved siden af et lille firma, Bioinformatics ApS, der udviklede software til analyse af sygdomsgener.  Bioinformatics ApS havde et nært samarbejde med BiRC, og i løbet af mit første år på BiRC blev jeg mere og mere involveret i deres arbejde. Det var således nærmest et tilfælde, at jeg begyndte at interessere mig for netop dette problem.

Bioteknologien løb imidlertid fra de teknikker, som Bioinformatics ApS benyttede til deres software. Det blev muligt at samle genetisk materiale i så store mængder, at dataanalysen ikke kunne følge med. Samtidig gjorde den nu meget større datamængde det mindre vigtigt at bruge sofistikerede statistiske metoder til dataanalyse. Med den større datamængde bliver signalet, vi søger i data, mere tydeligt, så simplere teknikker, der er tilstrækkelig hurtige til at analysere meget større datamængder, kan benyttes.

Med en datalogisk baggrund følte jeg, at det måtte være muligt at forbedre algoritmerne fra de mere sofistikerede teknikker, så disse også kan håndtere de større datamængder. Kombinationen af sofistikerede teknikker og større datamængder burde kunne finde signaler, som de simplere, men hurtigere, metoder ikke kan finde.

Fra forskningsrådene FNU og FTP fik jeg finansieret to år til at forske i dette – det første år som post.doc. i Oxford og det andet på BiRC i Århus. Resultatet af denne forskning er en række nye analysemetoder og computerprogrammer, som nu bliver brugt i et større EU-projekt til analyse af prostata- og brystkræft (www.polygene.eu).

Næste skridt, som mine nye bevillinger giver mig mulighed for, er nu at integrere langt større datamængder og langt flere datatyper i analysen.  Frem til nu har man fortrinsvis opdelt folk i syge og raske og så søgt efter genetiske forskelle imellem dem, men i komplekse sygdomme er der er oftest mange grader af både syg og rask. Gennem de seneste fem-ti år er man blevet i stand til at måle menneskers biologiske ’tilstand’ helt ned på celleniveau.  Dette giver et mere komplekst billede, men samtidig et mere korrekt billede af forskellen på syge og raske. Dette datamateriale er imidlertid sjældent eller aldrig brugt i vores søgen efter de gener, der disponerer for sygdommen.

Integrationen af ny data og effektive søgemetoder har stort potentiale for forståelsen – og på sigt bekæmpelsen – af mange arvelige sygdomme.

Lidt om mennesket bag forskeren

Når man nu har et spændende arbejde, er det jo svært at finde en fritidsinteresse, der kan hamle op med det, men for også at få adrenalinen op i weekenden kører jeg på mountainbike i Marselisborg Skoven syd for Århus.

_________________

 

Tildelt af Forskningsrådet for Natur og Univers

Forskningsrådets begrundelse for tildeling af prisen

Thomas Mailund er 32 år og fik sin ph.d.-grad i 2003 ved Aarhus Universitet, og han var i 2006-2007 post.doc. ved University of Oxford. Thomas Mailund har en imponerende videnskabelig publikation med mange citationer bag sig, og han har opbygget et solidt internationalt netværk bl.a. med ledende forskere ved Oxford University.

Thomas Mailund vil – gennem udvikling af analysemetoder og software programmer og med fokus på effektive algoritmer og søgemetoder, samt it-problemstillinger i effektiv håndtering og manipulation af de store datamængder i sådanne studier – skabe muligheder for at besvare følgende centrale spørgsmål vedr. arvelige sygdomme: Kan vi finde genetiske årsager vha. den genetiske variation og målinger af cellers og individers tilstand?

Data for disse spørgsmål er allerede tilgængelige – eller bliver det snart – men metoder til at analysere disse massive datamængder halter bagefter, og Mailunds forskning satser netop på at inddrage og udvikle datalogiske og matematiske teknikker til at lukke dette hul.

Thomas Mailund tildeles prisen som Ung Eliteforsker for sin talentfulde, grundlæggende forskning inden for Bioinformatik – grænseområdet mellem biologi og matematik/datalogi.

 

_________________

 

Yderligere oplysninger om projektet

Thomas Mailund. Telefon:8942 3125 (kontor), 3068 0362 (mobil); e-post:

Yderligere oplysninger om baggrunden for prisen

Formand for Forskningsrådet for Natur og Univers, professor Jes Madsen. Telefon: 8942 3670, e-post:

Forskningsprojektets videnskabelige titel

Computational challenges in disease mapping.

Bevilling fra Forskningsrådet for Natur og Univers

2.240.000 kr.

Ansættelsessted

BiRC - Bioinformatics Research Center, Aarhus Universitet

Forskningsprojektet udføres på

BiRC - Bioinformatics Research Center, Aarhus Universitet