28. oktober 2020

Novo Nordisk Fonden støtter data science på MATH

Forskningslegat

Statistikprofessorerne Susanne Ditlevsen og Niels Richard Hansen fra Institut for Matematiske Fag får tilsammen 16,6 mio. kr. til udforskning af nye metoder til statistisk inferens og til at se årsagssammenhænge i store datamængder fra biologi- og sundhedsområdet.

Susanne Ditlevsen og Niels Richard Hansen - Distinguished Data Science Investigators
Susanne Ditlevsen og Niels Richard Hansen - Distinguished Data Science Investigators

Novo Nordisk Fonden vil med deres nye Data Science Initiativ støtte ”Udvikling af fundamental teknologi og algoritmer til datavidenskab: såsom statistik, anvendt matematik, computer science, kunstig intelligens (…), nye algoritmer til big data analyser, teknologier til at håndtere store datasæt, data mining m.m.”

Det er grundforskning i selve datavidenskaben, der skal i centrum, og fonden har på den baggrund uddelt to Distinguished Data Science Investigator bevillinger til de to forskningsledere fra Institut for Matematiske Fag. De to bevillinger vil finansiere ansættelsen af fem ph.d.-studerende og fire postdocs.

Robuste, statistiske metoder

Susanne Ditlevsen forsker i matematiske modeller for biologiske processer, især modeller, der tager højde for tilfældigheder i systemet, og hun udvikler statistiske metoder for disse modeller. Hendes nye forskningsprojekt kalder hun CUSP: Statistical inference for coupled stochastic processes with multiple timescales and changing environments. Hun beskriver sit projekt således:

”Et stokastisk dynamisk system er en matematisk model for, hvordan en række variable udvikler sig over tid med en vis grad af tilfældighed. Det kan for eksempel være koncentrationen af et bestemt stof i forskellige organer i kroppen, den elektriske aktivitet i et neuron eller interaktionen i et netværk af neuroner.

Hvis man gerne vil forstå et givet dynamisk system kræver det en delikat balance mellem at studere en lang række vigtige detaljer, og evnen til at se igennem alle disse detaljer og forstå de generelle principper. Derudover vil forskellige elementer i systemet ofte operere på forskellige tidsskalaer, som gør det endnu sværere at studere og forstå systemet.

En yderligere komplikation er, at det ofte kun er muligt at måle på en del af systemet, og man derfor skal udlede information om dele af systemet fra indirekte målinger.

Det kan derfor være hensigtsmæssigt at erstatte et høj-dimensionalt dynamisk system med mange tidsskalaer med et lavere-dimensionalt stokastisk system. Projektet handler om at udvikle robuste statistiske metoder til at analysere data fra sådanne systemer. Dette har mange anvendelser, for eksempel i neurovidenskab, biologi, fysiologi, økonometri og socialvidenskab”.

Til Susannes forskningsgruppe skal ansættes to ph.d.-studerende og to postdocs. Videnskabelig assistent Predrag Pilipovic og postdoc Marie Levakova fra Institut for Matematiske Fag arbejder allerede på projektet.

Spor i ustrukturerede begivenheder

Niels Richard Hansens projekt hedder CLUE: Causal Learning with Unstructured Events. Han beskriver projektet således:

”Et menneskeliv består af et astronomisk antal begivenheder, der udfolder sig over tid, og for at organisere vores tanker om denne udvikling bruger vi abstraktioner og modeller. Vi gør det på daglig basis og ubevidst ved hjælp af vores ustrukturerede sprog – og mere bevidst og struktureret i videnskaberne.

I vores sundheds- og velfærdssystemer registrerer vi begivenheder med henblik på diagnose, prognose og behandling, hvis det er nødvendigt. Men passive observationer af, hvordan begivenheder udfolder sig, besvarer desværre ikke det grundlæggende spørgsmål: hvorfor? Hvorfor udvikler f.eks. prostataudvidelse sig til kræft for nogle og ikke andre?

Det statistiske ordsprog "korrelation er ikke kausalitet” udtrykker, at vejen til at besvare hvorfor-spørgsmålet ud fra observationelle data er vanskelig. Vi ved, hvordan vi skal navigere ad den vej, når vi bruger strukturerede data for få og veldefinerede begivenheder, men projektet ønsker at gå længere end det og bruge alle tilgængelige spor fra ustrukturerede begivenhedsdata til at besvare hvorfor-spørgsmålet”.

Niels Richard Hansens forskningsgruppe vil blive udvidet med tre ph.d.-studerende og to postdocs, som alle vil blive en del af Copenhagen Causality Lab. Projektet bidrager til forskningen i AI Centret på SCIENCE.

Emner