Pivot-based Transfer Learning for Neural Machine Translation between Non-English Languages (1909.09524v1)

Published 20 Sep 2019 in cs.CL and cs.LG

Abstract: We present effective pre-training strategies for neural machine translation (NMT) using parallel corpora involving a pivot language, i.e., source-pivot and pivot-target, leading to a significant improvement in source-target translation. We propose three methods to increase the relation among source, pivot, and target languages in the pre-training: 1) step-wise training of a single model for different language pairs, 2) additional adapter component to smoothly connect pre-trained encoder and decoder, and 3) cross-lingual encoder training via autoencoding of the pivot language. Our methods greatly outperform multilingual models up to +2.6% BLEU in WMT 2019 French-German and German-Czech tasks. We show that our improvements are valid also in zero-shot/zero-resource scenarios.

Authors (5)

Yunsu Kim (40 papers)
Petre Petrov (1 paper)
Pavel Petrushkov (9 papers)
Shahram Khadivi (29 papers)
Hermann Ney (104 papers)

Citations (75)

View on Semantic Scholar

Summary

We haven't generated a summary for this paper yet.

Summarize Now

Pivot-based Transfer Learning for Neural Machine Translation between Non-English Languages (1909.09524v1)

Summary

Related Papers