Learning Language Specific Sub-network for Multilingual Machine Translation (2105.09259v2)

Published 19 May 2021 in cs.CL

Abstract: Multilingual neural machine translation aims at learning a single translation model for multiple languages. These jointly trained models often suffer from performance degradation on rich-resource language pairs. We attribute this degeneration to parameter interference. In this paper, we propose LaSS to jointly train a single unified multilingual MT model. LaSS learns Language Specific Sub-network (LaSS) for each language pair to counter parameter interference. Comprehensive experiments on IWSLT and WMT datasets with various Transformer architectures show that LaSS obtains gains on 36 language pairs by up to 1.2 BLEU. Besides, LaSS shows its strong generalization performance at easy extension to new language pairs and zero-shot translation.LaSS boosts zero-shot translation with an average of 8.3 BLEU on 30 language pairs. Codes and trained models are available at https://github.com/NLP-Playground/LaSS.

PDF Abstract

Summarize PDF Markdown Bookmark Chat (Pro)

Authors (4)

Zehui Lin (14 papers)
Liwei Wu (34 papers)
Mingxuan Wang (83 papers)
Lei Li (1293 papers)

Citations (77)

View on Semantic Scholar

GitHub

GitHub - NLP-Playground/LaSS (31 stars)

Learning Language Specific Sub-network for Multilingual Machine Translation (2105.09259v2)

Related Papers

GitHub