31. januar 2018

Han vil prøve det umulige: lære kausalitet fra data

Bevilling

Jonas Peters, lektor i statistik på Institut for Matematiske Fag, Københavns Universitet, har modtaget 8,2 mio. kr. fra VILLUM Fondens Young Investigator Programme. Midlerne gør det muligt for ham at danne en lille forskningsenhed, der de næste de næste 4-5 år skal forske i kausal inferens i praktiske anvendelser.

Jonas Peters modtager sin VILLUM Young Investigator bevilling

Jonas Peters modtog sin bevilling fra VILLUM FONDENs Young Investigator Programme på årsdagen for Villum Kann Rasmussens (1909-93) fødselsdag den 23. januar 2018. Foto: Simon Knudsen.

Jonas ønsker at udvikle redskaber, der gør det muligt for forskere at opstille robuste modeller, hvor forudsigelser bygger på årsagssammenhænge (kausalitet). Hans mål er at lære noget om selve den kausale struktur ud fra data hentet i den virkelige verden.

”Hvorfor er vi interesseret i kausale modeller? Fordi kun kausale modeller kan fortælle, hvad der sker under en påvirkning. På den måde er kausale modeller mere robuste”, forklarer Jonas.

”Der er en direkte sammenhæng mellem pletter på fingrene og rygning. Så du kan lave en forudsigende model, der siger: ’Hvis der er pletter på fingrene er stor risiko for lungekræft’. Men denne model er ikke kausal: Maler du fingrene, fjerner du ikke risikoen for lungekræft. Modellen er heller ikke stabil, den bryder sammen i kolde egne, hvor man går meget med handsker.

”Modellen ’rygning forårsager lungekræft’ er tættere på en kausal model, og derfor mere stabil; den er sand uanset handsker, hudfarve og hvor man kommer fra”, forklarer Jonas.

Skal finde kausale modeller

"Den grundlæggende ide i projekter er at vende dette princip omkring: vi skal lede efter modeller, der er stabile over miljøforandringer. Disse modeller vil i et vist omfang være mere kausale. Vi vil så udvide dette princip til forskellige modelklasser, til forskellige typer variabler, til situationer med skjulte faktorer og også til forskellige anvendelser".

Jonas vil samarbejde med kolleger bl.a. Tyskland og England indenfor forskellige forskningsdiscipliner. F.eks. geovidenskab, biogeografi og bioinformatik. Der bliver desuden tilknyttet to ph.d.-studerende og en postdoc til projektet.

Områder uden grundviden

”Vi har brug for at finde nogle systemer, hvor man har en grundlæggende viden om årsagssammenhænge. En smule grundviden (ground truth). Og derefter anvender vi så vore modeller på situationer, hvor der ikke findes grundviden – og ser hvad vi får ud af det. Vi bliver nødt til at undersøge, om de antagelser vi foreslår, giver mening i den virkelige verden”, siger Jonas.

- Har du et drømme-mål?

”Joh… Der er store spørgsmål om årsagssammenhænge inden for klimavidenskab. Det er derfor jeg arbejder med klimaforskerne i Jena. Vi vil starte med en lille, velkendt model vedrørende stråling, jordfugtighed og planteaktivitet. Det er et meget lille kausalt system. Men i sidste ende, så vil vi jo gerne forstå, hvad der sker med klimaforandringerne, ikke sandt?”

”Vi pumper en masse CO2 ud i atmosfæren, og hvis du virkelig vil forstå, hvad der sker, så må du forstå systemets kausale proces. Vi ved endnu ikke, om vores metoder vil være gode nok til at tackle sådanne komplekse spørgsmål ... men på et tidspunkt bliver vi nødt til at prøve. "

- Vil kausal opdagelse blive et standardværktøj?

"Ja, det håber vi. I øjeblikket oplever vi en stor succes for forudsigende modeller. Det grundlæggende princip var allerede der for 30 år siden; hvad vi har set de sidste år er, at hvis du finjusterer modellerne en lille smule, finder hurtigere algoritmer, har adgang til større og bedre datasæt, så kan du på et tidspunkt løse vanskeligere opgaver."

"Jeg tror, at vi ved ’causal discovery’ kun er ved begyndelsen. Vi har nu et par grundlæggende antagelser, der giver os mulighed for at tænke på årsagsopdagelse. Jeg håber, at disse systemer om 30 år vil være mere pålidelige og vil blive brugt i praksis. Det er en gradvis proces", siger Jonas.

Jonas PetersJonas Peters

Jonas er yngste fastansatte på Institut for Matematiske Fag - født i 1984 i Nordhorn, Tyskland. Han er uddannet på University of Cambridge og University of Heidelberg, og var ph.d.-studerende ved Max Planck Institute for Biological Cybernetics, Tübingen, samt ETH Zürich, hvorfra han fik medalje for enestående ph.d.-afhandling i 2012.

Mellem 2012 og 2015 var han ansat som postdoc (Marie Curie Intra-European-Fellowship) ved ETH Zürich, og gæsteforsker ved Microsoft Research i Redmond (WA), UC Berkeley (CA) og Carnegie Mellon University (PA). Han blev efterfølgende leder af forskningsgruppen Causality ved Max Planck Institute for Intelligent Systems, Tübingen.

I august 2016 blev han ansat som lektor ved Institut for Matematiske Fag, hvor han er tilknyttet forskningsgruppen Statistik og Sandsynlighedsregning. Han har for nyligt, sammen med to kolleger, udgivet bogen ”Elements of Causal Inference - Foundations and Learning Algorithms”.

Villum Fonden - Young Investigators

Hvert år støtter VILLUM FONDEN særligt talentfulde, unge forskere indenfor teknisk og naturvidenskabelig forskning. I år modtager 18 unge forskertalenter fra fire danske universiteter tilsammen mere end 153 mio. kr. fra VILLUM FONDEN. Modtagerne er danske såvel som udenlandske forskere – alle under 40 år.

De 18 forskere modtager hver mellem 5 og 10 mio. kr. til at fordybe sig i matematik, fysik, astronomi, biologi og kemi. Eller nærmere i projekter om sorte huller, keglesnegle, malaria, vand, elektrokatalyse, neutrinoer, metabolitter med mere.


Læs mere

  • Bogen "Elements of Causal Inference: Foundations and Learning Algorithms" kan ownloades gratis fra MIT Press (se efter "This is an open access title" i venstre side).

Emner