Evaluation of Summarization Systems across Gender, Age, and Race

Publikation: Bidrag til bog/antologi/rapport › Konferencebidrag i proceedings › Forskning › fagfællebedømt

Dokumenter

Evaluation of Summarization Systems across Gender, Age, and Race
Forlagets udgivne version, 264 KB, PDF-dokument

Anna Jørgensen
Søgaard, Anders

Summarization systems are ultimately evaluated by human annotators and raters. Usually, annotators and raters do not reflect the demographics of end users, but are recruited through student populations or crowdsourcing platforms with skewed demographics. For two different evaluation scenarios – evaluation against gold summaries and system output ratings – we show that summary evaluation is sensitive to protected attributes. This can severely bias system development and evaluation, leading us to build models that cater for some groups rather than others.

Originalsprog	Engelsk
Titel	Proceedings of the Third Workshop on New Frontiers in Summarization
Forlag	Association for Computational Linguistics
Publikationsdato	2021
Sider	51–56
DOI	https://doi.org/10.18653/v1/2021.newsum-1.6
Status	Udgivet - 2021
Begivenhed	3rd Workshop on New Frontiers in Summarization - Online Varighed: 10 nov. 2021 → 10 nov. 2021

Konference

Konference	3rd Workshop on New Frontiers in Summarization
By	Online
Periode	10/11/2021 → 10/11/2021

ID: 300074299

Datalogisk Institut