18. februar 2021

Lige nu er en baby bedre til at lære sprog end en computer

Computere og sprog

Computere er stadig ret dårlige til at forstå menneskesprog. Som Ph.d-studerende arbejder 27-årige Yova Kementchedjhieva på at ændre dette - det er nemlig nødvendigt, hvis flere mennesker skal have adgang til de værktøjer, som er blevet en selvfølgelig del af vores hverdag.

Yova Kementchedjhieva
Yova Kementchedjhieva

“Straight children play best”. Sådan ser resultatet ud, når man beder Google Translate oversætte: ”Lige børn leger bedst”. Og hvem kender ikke lignende ubrugelige oversættelser. Det er sprogteknologien NLP, der her er i spil.

NLP – der står for Natural Language Processing – er det felt inden for kunstig intelligens, der handler om at lære computere at forstå og producere sprog. De fleste af os er i kontakt med NLP-teknologi i dagligdagen - ikke kun i form af Google Translate, men også som chatbots, email-filtre, autokorrektur og digitale assistenter som Siri og Alexa.

Men computerne har endnu meget at lære, som oversættelsen ovenover viser. For maskinerne har stadig svært ved sådan rigtigt at forstå menneskesprog, forklarer Yova Kementchedjhieva, der som Ph.D-studerende på Datalogisk Institut forsker i NLP:

”Når Google Translate ofte giver os den slags uduelige oversættelser, er det fordi computeren kun anvender en overfladisk viden om sprogene og egentlig ikke forstår det indhold, den oversætter på det abstrakte niveau, som vi mennesker gør,” siger hun.

Computere skal ”tænke” som mennesker

Målet inden for NLP-forskning er derfor netop at give computere en stærkere forbindelse til den virkelige verden, så de bliver i stand til at lære og ræsonnere mere ligesom mennesker.

”Computeren kan efterabe menneskeadfærd, men den lærer og ræsonnerer ikke på samme måde som et menneske. En baby behøver stadig langt mindre input for at lære sprog, end en computer gør. Det håber jeg, vi kan ændre. Forestillingen om computere, der ”tænker” som mennesker, får måske dystre sci-fi-agtige scenarier frem på nethinden hos nogle. Men mange af de opgaver, computere allerede løser for os, kan blot løses bedre, hvis vi lærer at træne computerne til at forstå vores sprog på et mere nuanceret plan,” siger Yova.

Det var først og fremmest en interesse for sprog, der førte 27-årige Yova Kementchedjhieva til NLP-forskningsfeltet. Efter en bachelorgrad i lingvistik og en master i NLP på University of Edinburgh, kom hun til Københavns Universitet, hvor hun nu er ved at gøre sin ph.d. færdig.

”Jeg synes det er ret cool at stå med et problem, hvor du både skal bruge algoritmer og lægge sproglige puslespil. Det er teoretisk og anvendeligt på samme tid. Du er nødt til at forstå et sprogs egenskaber for at kunne fodre computeren, men du skal også forstå, hvad computeren kan og ikke kan. Du arbejder i krydsfeltet mellem mennesketænkning og computerberegning – og forsøger så at bygge bro mellem de to,” siger Yova.

Hendes fokus er såkaldte multilingual NLP-metoder, hvor en central udfordring er at udvikle algoritmer, der virker med meget små mængder data.

”Det meste NLP er centreret om det engelske sprog, og det meste data er derfor på engelsk. Men vi vil også gerne udvikle redskaber på andre sprog. Mange vigtige stemmer rundt om i verden har i dag ikke adgang til NLP-værktøjer, der bliver mere og mere uundværlige, fordi deres sprog ikke rangerer højt nok til at blive prioriteret. Selv på et sprog som dansk er et værktøj som autokorrektur meget dårligere, end det er på engelsk. Så der er millioner af mennesker, der kan få gavn af bedre NLP-systemer. På den måde kan NLP have en demokratiserende effekt,” slutter Yova.

Hør mere om bacheloruddannelsen i Machine learning og datavidenskab – kom til Online Åbent Hus onsdag d. 3. marts eller fredag d. 5. marts kl. 13-17.