Nyudnævnt lektor undersøger kønsfordomme om politikere via maskinlæring
Den 1. februar 2020 tiltrådte Isabelle Augenstein sin nye stilling som lektor i DIKU's Machine Learning-sektion. Hun har netop modtaget fondsstøtte til at udvide sit meget omtalte projekt om forskelle i beskrivelser af mænd og kvinder i litteratur. Hendes forskningsgruppe vil nu gå i gang med at analysere forholdet mellem kønsfordomme og holdninger til politikere på sociale medier.
Et af de forskningsprojekter på DIKU, der fik størst mediemæssig opmærksomhed i 2019, var Isabelle Augensteins projekt om kønsfordomme i litteratur. Både danske og internationale medier, herunder Forbes, viste stor interesse for de vidtrækkende resultater om, hvordan kvinder og mænd beskrives forskelligt. Nu har Isabelle og hendes forskningsgruppe fået finansiering til at udvide projektet til nye områder. Det nye projekt skal undersøge kønsfordomme om politikere på sociale medier – især Twitter – på flere sprog og i forskellige lande.
- Bliver kvindelige politikere beskrevet med andre ord og karakteristika end mandlige politikere? Ses der større kønsdiskrimination af politikere i konservative lande fremfor liberale lande? Skaber nogle sprog flere kønsfordomme overfor bestemte typer af personer alene på grund af det enkelte sprogs grammatiske opbygning? Og i hvilke holdninger til politiske anliggender ses der generelt flest kønsspecifikke fordrejninger? Dette er nogle af de spørgsmål, som vi er interesseret i at besvare, siger Isabelle.
Maskinlæringsteknikker der gør det muligt at undersøge opfattelser som disse efterspørges af mange virksomheder. Især efter #MeToo-bevægelsen har forskere som Isabelle oplevet stor interesse fra erhvervslivet for at kunne få adgang til en mere dybdegående forståelse af omfanget af kønslige fordomme på sociale medier.
- Teknikkerne som vi udvikler til analysen er relevante for rigtig mange. Selv institutioner som Københavns Universitet er interesseret i at vide, hvordan omverdenen opfatter os. Synes folk, at der kønsdiskrimineres på universitetet? Bliver vi opfattet som et sted med diversitet? Det gode ved vores projekt er, at vi også vil prøve at forklare nogle af disse holdninger. Vi vil ikke blot konkludere, at der findes kønsfordomme overfor for eksempel kvindelige politikere, når det kommer til specifikke emner. Vi vil forsøge at binde dette sammen med andre holdninger, som kendetegner de samme mennesker – det kunne for eksempel være holdninger til forældreorlov eller ansættelseskvoter, forklarer Isabelle.
Det oprindelige projekt handlede om at identificere mønstre i sproget der skaber kønslige fordomme. Isabelle udviklede sammen med forskere ved University of Cambridge, University College London, Johns Hopkins University og Microsoft Research maskinlæringsmetoder til at analysere 3.5 millioner bøger. Her fandt de ud af, at mænd typisk beskrives med ord, der siger noget om deres opførsel, mens kvinder bliver påhæftet tillægsord som knytter sig til deres udseende.
- Det startede som et tilnærmelsesvist fritidsprojekt, som vi ikke havde finansiering til, men som vi syntes, var rigtig spændende at kigge på. Jeg er derfor rigtig glad for, at vi nu har modtaget støtte fra Danmarks Frie Forskningsfond til at fortsætte projektet de næste fire år, siger Isabelle.
Analyser af naturligt sprog
Isabelle er leder af forskningsgruppen CopeNLU, der forsker i emner inden for feltet Natural Language Understanding (på dansk kan det betegnes som et område inden for sprogteknologi). Gruppen udvikler maskinlæringsmodeller, der automatisk kan forstå og analysere naturligt sprog, altså ethvert menneskeligt sprog. Udover kønsprojektet er CopeNLU-gruppen også i gang med et projekt om ”fact-checking” og et projekt om flersproglig læring, der også er nogle af Isabelles kerneområder.
Fact-checking-projektet har to ph.d.-studerende, der begge er finansieret af de eftertragtede Marie Curie-stipendier. Den ene ph.d.-studerende undersøger maskinlæringsbegrebet ”explainability” i forhold til fakta-tjek, og den anden undersøger, hvordan man kan kontrollere fakta i videnskabelige tekster, hvilket er en yderst udfordrende opgave. Isabelle og hendes ph.d.-studerende samarbejder desuden med en af DIKU’s andre forskere, professor Christina Lioma, hvis forskningsgruppe for nylig vandt en pris for deres redskab til at kontrollere fakta i online debatter.
I projektet om flersproglig læring arbejder Isabelles gruppe på at finde ligheder og forskelle mellem højressourcesprog som engelsk og lavressourcesprog som islandsk. Målet er at udvikle computermodeller til sproglæring der fungerer lige godt for begge typer sprog.
Anderledes forskningskultur
Isabelle er glad for at have afsluttet sin tenure-track adjunktstilling og være blevet forfremmet til lektor. At rykke op til at blive lektor giver hende nemlig flere muligheder for at styre flere spændende forskningsprojekter.
- Der er ret stor forskel på at være adjunkt og lektor i forhold til hvad man har lov til at lave, i hvert fald i det danske universitetssystem. Den vigtigste ændring i mit arbejdsliv er, at jeg nu formelt set må vejlede ph.d.-studerende, hvilket jeg virkelig godt kan lide. Det er faktisk min yndlingsdel af mit arbejde at vejlede, så det betyder meget for mig at kunne gøre det i større stil nu, siger Isabelle.
Dette skyldes, at forskningskulturen inden for maskinlæringsfeltet adskiller sig fra de mere teoretiske områder af datalogi. En hel del maskinlæringsforskning er eksperimentel, da det er en del af forskningen at implementere forskellige computermodeller og køre eksperimenter på servere. Vejledning af ph.d.-studerende og post-docs er derfor en stor del af, hvad det vil sige at forske på dette område.
- Vores arbejde kræver en masse ”hjælpere”, der enten kan være ph.d.-studerende eller post-docs. Mine kolleger og jeg ville faktisk ikke kunne skrive vores videnskabelige artikler uden den forskning, som vores ph.d.’er og postdocs laver. Derfor vejleder lektorer og professorer på vores felt som regel mange ph.d.-studerende og postdocs – jeg har 8 selv – og vi er meget aktivt involveret i at hjælpe dem med deres ideer og hypoteser, siger Isabelle.
Sidst men ikke mindst fortsætter Isabelle med at undervise i kurser i sprogteknologi og maskinlæring på DIKU's kandidat- og bacheloruddannelser, hvilket hun også er glad for.
- Jeg kan godt lide at undervise i det danske universitetssystem, fordi vi har tid til at forberede os til og reflektere over undervisningen. For mig bevarer det min glæde ved undervisningen. På den måde ender vi heller ikke med at udfase forelæsninger i modsætning til visse andre lande, siger Isabelle.
Relaterede nyheder
Kontakt
Isabelle Augenstein
Lektor
augenstein@di.ku.dk
93 56 59 19
Caroline Wistoft
Kommunikationskonsulent
cawi@di.ku.dk
21 30 96 31
Bio
Isabelle Augenstein er lektor ved Datalogisk Institut, Københavns Universitet (DIKU). Hun arbejder med feltet Natural Language Understanding, der er et område indenfor sprogteknologi og maskinlæring, hvor datalogiske og lingvistiske forskningsmetoder kombineres. Hun er tilknyttet DIKU’s Machine Learning-sektion og leder CopeNLU-forskningsgruppen, der udvikler maskinlæringsteknikker til at analysere og bearbejde menneskeligt sprog, som kan være alt lige fra skønlitteratur til statusopdateringer på sociale medier.
Før hun startede på DIKU som tenure-track adjunkt i 2017, var hun ansat som postdoc på University College London, hvor hun arbejdede med maskinlæsning af videnskabelige artikler. Før dette var hun ansat som forskningsassistent ved Sheffield Universitet i deres NLP-gruppe, hvor hun også skrev sin ph.d. Isabelle er oprindeligt fra Tyskland og har en kandidat- og bachelorgrad i Computational Linguistics fra Heidelberg Universitet.