Consistency Regularization for Cross-Lingual Fine-Tuning

Bo Zheng,Li Dong,Shaohan Huang,Wenhui Wang,Zewen Chi,Saksham Singhal,Wanxiang Che,Ting Liu,Xia Song,Furu Wei

Consistency Regularization for Cross-Lingual Fine-Tuning

2021

Bo Zheng
Li Dong
Shaohan Huang
Wenhui Wang
Zewen Chi
Saksham Singhal
Wanxiang Che
Ting Liu
Xia Song
Furu Wei

Fine-tuning pre-trained cross-lingual language models can transfer task-specific supervision from one language to the others. In this work, we propose to improve cross-lingual fine-tuning with consistency regularization. Specifically, we use example consistency regularization to penalize the prediction sensitivity to four types of data augmentations, i.e., subword sampling, Gaussian noise, code-switch substitution, and machine translation. In addition, we employ model consistency to regularize the models trained with two augmented versions of the same training set. Experimental results on the XTREME benchmark show that our method significantly improves cross-lingual fine-tuning across various tasks, including text classification, question answering, and sequence labeling.

Keywords:

Artificial intelligence
Gaussian noise
Sequence labeling
Question answering
Machine translation
regularization
Consistency (statistics)
Language model
Computer science
Pattern recognition
Data type

Correction
Source
Cite
Save
Machine Reading By IdeaReader

References

Citations