mFACE: Multilingual Summarization with Factual Consistency Evaluation (2212.10622v2)

Published 20 Dec 2022 in cs.CL

Abstract: Abstractive summarization has enjoyed renewed interest in recent years, thanks to pre-trained LLMs and the availability of large-scale datasets. Despite promising results, current models still suffer from generating factually inconsistent summaries, reducing their utility for real-world application. Several recent efforts attempt to address this by devising models that automatically detect factual inconsistencies in machine generated summaries. However, they focus exclusively on English, a language with abundant resources. In this work, we leverage factual consistency evaluation models to improve multilingual summarization. We explore two intuitive approaches to mitigate hallucinations based on the signal provided by a multilingual NLI model, namely data filtering and controlled generation. Experimental results in the 45 languages from the XLSum dataset show gains over strong baselines in both automatic and human evaluation.

PDF Abstract

Summarize PDF Markdown Bookmark Chat (Pro)

Authors (6)

Roee Aharoni (35 papers)
Shashi Narayan (35 papers)
Joshua Maynez (28 papers)
Jonathan Herzig (34 papers)
Elizabeth Clark (16 papers)
Mirella Lapata (135 papers)

Citations (36)

View on Semantic Scholar

mFACE: Multilingual Summarization with Factual Consistency Evaluation (2212.10622v2)

Related Papers