Kan AI forstå kultur, biologi og ironi? Fire forskningsprojekter får millionstøtte
Fire nye forskningsprojekter forankret på Datalogisk Institut har modtaget bevillinger fra Danmarks Frie Forskningsfond på i alt 24 millioner kroner. Projekterne spænder fra grundforskning i sprogmodellernes indre mekanismer og kulturelle forståelse til udvikling af pålidelige og anvendelige AI-modeller i biologien.
Kan sprogmodeller lære at forstå kultur og ironi? Hvordan når sprogmodeller egentlig frem til de svar, de giver? Kan det lykkedes at udvikle mere pålidelige AI-modeller inden for biologi? Og kan vi få en computer til at vise, hvordan gener opfører sig i biologiske processer?
Det er emnerne for fire nye forskningsprojekter med kunstig intelligens som fællesnævner fra Datalogisk Institut ved Københavns Universitet, som i 2025 har fået støtte fra Danmarks Frie Forskningsfond (DFF).
- Som et af Danmarks stærkeste fagmiljøer inden for forskning i kunstig intelligens undersøger og skubber vores forskere til grænserne for, hvad kunstig intelligens kan. Det er en stor anerkendelse, at DFF støtter vores ambition om at udvikle AI, der ikke bare er avanceret, men også pålidelig. Samtidig bidrager det til Københavns Universitets ansvar om at præge udviklingen af AI til gavn for samfundet, siger institutleder ved Datalogisk Institut, Ken Friis Larsen.
Tre af projekterne har modtaget en såkaldt tematisk bevilling specifikt til forskning i kunstig intelligens, hvor succesraten kun er 6% målt på antal ansøgninger. DFF har siden 2018 udmøntet forskningsbevillinger inden for politisk fastsatte temaer, som er finansieret ved årlige politiske aftaler om fordeling af forskningsreserven.
Den fjerde bevilling er en af de klassiske bevillinger fra DFF, som støtter den frie, nybrudsskabende forskning. Bevillingerne går til dygtige forskere, som får mulighed for at forfølge deres forskningsidéer.
Læs mere om de fire projekter nedenfor.
CuRe: Cultural Reasoning for Responsible Language Model Development
Hovedinvestigator: Tenure-track adjunkt Daniel Herscovich
Co-investigator: Lektor Jens Bjerring-Hansen (Institut for Nordiske Studier og Sprogvidenskab)
Bevilget beløb: 7.199.998 kr.
Resume:
Kan kunstig intelligens forstå kultur? Sprogmodeller som ChatGPT er gode til at finde fakta, men har svært ved at forstå ironi, kulturelle hentydninger og litterære virkemidler—særligt på mindre udbredte sprog som dansk. Dette projekt undersøger, hvordan vi kan gøre kunstig intelligens bedre til at fortolke og formidle kultur ved at bruge dansk litteratur som testområde. Vi udvikler nye metoder til at evaluere og forbedre AI-modellers evne til kulturel forståelse. I samarbejde med litteraturforskere bygger vi datasæt og opgaver, der efterligner de komplekse fortolkninger, man forventer af studerende i dansk litteratur. Derefter tester vi avancerede AI-systemer og undersøger, hvordan de kan tilpasses dansk kultur og historie. Projektet kombinerer teknisk og humanistisk forskning og inddrager eksperter fra bl.a. Berkeley og McGill. Målet er at skabe mere ansvarlig, nuanceret og retfærdig kunstig intelligens, der kan forstå mennesker—ikke kun sprog.
Human-Centered Explainable Retrieval-Augmented LLMs
Hovedinvestigator: Professor Isabelle Augenstein
Co-investigator: Professor Irina Shklovski
Bevilget beløb: 7.196.132 kr.
Resume:
Store sprogmodeller (LLM’s) udviser på trods af deres høje ydeevne mange faktuelle fejl. Almindeligt hentes yderligere dokumenter for at øge en LLM's viden, men en LLM kan ignorere disse dokumenter, når de genererer tekst. Der er begrænset arbejde med at belyse disse indre funktioner for brugerne og med at fremme interventioner og en mere dybdegående forståelse af disse problemstillinger. Dette projekt vil udvikle forklarbare AI-metoder for at øge faktabaseret læringslæreuddannelse og anvendelighed til informationssøgning ved at sætte læger i stand til at retfærdiggøre genereret output og muliggøre interventioner baseret på anvendt evidens. Det vil generere nye indsigter om strategisk evidensindsamling og vidensstyring, og hvad brugerne anser for at være afgørende faktorer for kritisk evaluering af LLM-output.
TRANSFORMBIO: Tractable Neuro-Symbolic Foundations for Reliable Models in Biology
Hovedinvestigator: Professor Wouter Boomsma
Co-investigator: Dr. Antonio Vergari (University of Edinburgh)
Bevilget beløb: 6.572.380 kr.
Resume:
Store AI-modeller har på kort tid ændret forskning i Biologi radikalt. Sprogmodeller for proteiner og DNA og struktur-til-sekvens modeller har ført til markante fremskridt inden for biologisk sekvensanalyse og proteindesign. Disse fremskridt har dog også en bagside. Modellerne kan hallucinere, og give biologisk usandsynlige eller urealistiske forudsigelser, fordi de ikke tager højde for domænespecifikke begrænsninger – f.eks. kodonstruktur i genannotering eller strukturelle relationer i biologiske vidensgrafer. En lovende tilgang til at imødegå dette er neurosymbolsk (NeSy) maskinlæring, som kombinerer neurale netværks kapacitet for mønstergenkendelse med symbolsk AI’s evne til logisk og struktureret ræsonnering. Traditionelt har symbolske metoder dog haft begrænset skalerbarhed og været vanskelige at integrere med store neurale modeller. Derfor foreslår vi en ny NeSy-ramme, som muliggør effektiv og præcis inferens og dermed biologisk mere troværdige forudsigelser. Ved at udbygge eksisterende beregningseffektive NeSy-modeller, såsom kredsmodeller (circuits), og integrere dem med biomolekylære grundmodeller, sigter vi mod at udvikle systemer, der er både robuste og i overensstemmelse med biologiske principper.
Demystifying Gene Regulatory Networks with Deep Generative Models
Hovedinvestigator: Professor Anders Krogh
Deltager: Videnskabelig assistent Adrián Sousa-Poza ansættes som ph.d.-studerende
Bevilget beløb: 3.024.592 kr.
Resume:
Mennesker har omkring 20.000 gener, som koder for forskellige proteiner. Selvom cellerne i kroppen indeholder de samme gener, er de vidt forskellige. Det skyldes, at gener kun bliver udtrykt når der er brug for dem i en given celletype. Man kan måle hvor meget generne udtrykkes i celleprøver og på den måde få et øjebliksbillede af en celle. Det kan bruges til for eksempel at se forskellen imellem en syg og en rask celle, hvilket kan hjælpe til at forstå hvilke gener, der er involverede i en sygdom og til at finde ud af hvilken behandling, der er bedst. I dette projekt vil vi lave AI modeller, som modellerer en celles udtryk af gener og hvor vi kan se hvad der sker, hvis man ændrer (perturberer) udtrykket af et gen. Geners udtryk bestemmes af et komplekst samspil imellem generne, som påvirker hinanden på kryds og tværs. Det betegnes som er regulatorisk netværk og i vores modeller, vil vi forsøge at beskrive det underliggende regulatoriske netværk, så vi også kan forklare hvorfor generne ændrer udtryk ved en perturbation. På længere sigt håber vi, at man kan bruge modellen til at finde ud af hvilken behandling er bedst for en given patient.
Kontakt
Caroline Wistoft
Kommunikationsrådgiver
Københavns Universitet
cawi@adm.ku.dk