Studerende opfinder værktøj, der forudsiger algoritmers CO2-aftryk
I forskerkredse anslår man, at kunstig intelligens - som ellers er udpeget som et effektivt våben mod klimaforandringer - bliver en af de største CO2-syndere, hvis den nuværende tendens fortsætter. For at skabe bevidsthed om den udfordring har to studerende fra Københavns Universitet lanceret et værktøj, der udregner hvor stort et klimaaftryk udvikling af såkaldte deep learning-modeller sætter.
De fleste af os er i nærkontakt med den avancerede metode inden for kunstig intelligens, deep learning, i det daglige, uden vi måske ved det. Når vi fx bruger Siri eller Alexa, når Netflix foreslår film og serier til os baseret på, hvad vi tidligere har set, eller når vi skriver med en kundeservice-chatbot på en hjemmeside, er deep learning-algoritmer i spil.
Men den fremadstormende teknologi, som ellers forventes at blive et effektivt våben i kampen mod klimaforandringer, har en bagside, mange ikke har øje for: nemlig et stort energiforbrug. Kunstig intelligens og især underområdet deep learning lader til at blive en af de helt store klimasyndere, hvis tendensen i industrien fortsætter. På bare seks år – fra 2012 til 2018 - er behovet for regnekraft i deep learning blevet 300.000 gange større. Men det energiforbrug og klimaaftryk, der er forbundet med at udvikle algoritmer bliver sjældent opgjort, selvom flere studier tydeligt viser et stigende problem.
To studerende ved Datalogisk Institut på Københavns Universitet, Lasse F. Wolff Anthony og Benjamin Kanding, har sammen med adjunkt Raghavendra Selvan derfor opfundet et softwareprogram, de kalder Carbontracker. Programmet kan både beregne, hvor meget energi, og hvor meget CO2-udledning, der går på at træne en deep learning-model.
”Udviklingen på området går sindssygt stærkt, og deep learning-modeller bliver hele tiden større og mere avancerede. Lige nu er der tale om en eksponentiel vækst. Og det betyder et større og større energiforbrug, som det lader til, at mange ikke tænker over,” siger Lasse F. Wolff Anthony.
Én træningssession = årligt energiforbrug i 126 danske hjem
Træningen er den proces, hvor den matematiske model lærer at genkende mønstre i store mængder data. Og det er en energitung proces, fordi den foregår i specialiseret, strømkrævende hardware, der kører i døgndrift.
”Samtidig bliver datasættene hele tiden større, og problemerne, som algoritmerne skal løse, mere og mere komplekse,” pointerer Benjamin Kanding.
En af de største deep learning-modeller, der indtil nu findes, er den avancerede sprogmodel GPT-3. På bare en enkelt træningssession estimeres den til at bruge, hvad der svarer til et års energiforbrug i 126 danske hjem og til at udlede den samme mængde CO2 som godt 700.000 kilometers bilkørsel.
”Men inden for et par år vil der formentlig findes adskillige modeller, der er mange gange større end denne,” påpeger Lasse F. Wolff Anthony.
Man kan godt gøre det bedre
”Hvis tendensen fortsætter, kan kunstig intelligens ende med at bidrage væsentligt til klimaforandringer. Det handler ikke om at stoppe den teknologiske udvikling, der rummer fantastiske muligheder, som også kan bruges til gavn for klimaet, men om at man bliver opmærksom på problemet og tænker: Hvordan kan vi gøre det bedre?” siger Benjamin Kanding.
Idéen med Carbontracker, som er et gratis program, er netop at give branchen et grundlag for at mindske modellernes klimabelastning. Programmet indhenter bl.a. periodevis information om, hvor meget CO2, der bliver brugt ved at producere energi i den region, som træningen foregår i, for så at kunne omregne energiforbruget til CO2-udledning.
De to datalogistuderende anbefaler, at man i branchen bl.a. kigger på, hvor man træner sin model, hvornår på dagen man træner sin model, da strømmen ikke er lige grøn i løbet af et døgn, hvilken type hardware og hvilke slags algoritmer, man bruger.
”Det ér muligt at mindske klimabelastningen betydeligt. Det er fx ikke ligegyldigt, om man træner sin model i Estland eller i Sverige, hvor CO2-aftrykket ved at træne en model kan være over 60 gange mindre, fordi energiforsyningen er langt grønnere. Derudover er der stor forskel på, hvor energieffektive algoritmer er. Nogle kræver mindre regnekraft og dermed mindre energi for at opnå det samme. Så har man mulighed for at skrue på den slags parametre, kan det rykke rigtig meget,” slutter Lasse F. Wolff Anthony.
Emner
Relaterede nyheder
Kontakt
Lasse F. Wolff Anthony
Datalogisk Institut
Københavns Universitet
81 19 71 00
sfp142@alumni.ku.dk
Benjamin Kanding
Datalogisk Institut
Københavns Universitet
61 46 14 69
bmk@di.ku.dk
Maria Hornbek
Journalist
Det Natur- og Biovidenskabelige Fakultet
Københavns Universitet
22 95 42 83
maho@science.ku.dk