Discriminatively-Tuned Generative Classifiers for Robust Natural Language Inference (2010.03760v1)

Published 8 Oct 2020 in cs.CL and cs.LG

Abstract: While discriminative neural network classifiers are generally preferred, recent work has shown advantages of generative classifiers in term of data efficiency and robustness. In this paper, we focus on natural language inference (NLI). We propose GenNLI, a generative classifier for NLI tasks, and empirically characterize its performance by comparing it to five baselines, including discriminative models and large-scale pretrained language representation models like BERT. We explore training objectives for discriminative fine-tuning of our generative classifiers, showing improvements over log loss fine-tuning from prior work . In particular, we find strong results with a simple unbounded modification to log loss, which we call the "infinilog loss". Our experiments show that GenNLI outperforms both discriminative and pretrained baselines across several challenging NLI experimental settings, including small training sets, imbalanced label distributions, and label noise.

PDF Abstract

Summarize Bookmark Chat (Pro)

Authors (5)

Xiaoan Ding (4 papers)
Tianyu Liu (177 papers)
Baobao Chang (80 papers)
Zhifang Sui (89 papers)
Kevin Gimpel (72 papers)

Citations (8)

View on Semantic Scholar

Discriminatively-Tuned Generative Classifiers for Robust Natural Language Inference (2010.03760v1)

Related Papers