Turning transformer attention weights into zero-shot sequence labelers.

Kamil Bujel,Helen Yannakoudakis,Marek Rei

Turning transformer attention weights into zero-shot sequence labelers.

2021

Kamil Bujel
Helen Yannakoudakis
Marek Rei

We demonstrate how transformer-based models can be redesigned in order to capture inductive biases across tasks on different granularities and perform inference in a zero-shot manner. Specifically, we show how sentence-level transformers can be modified into effective sequence labelers at the token level without any direct supervision. We compare against a range of diverse and previously proposed methods for generating token-level labels, and present a simple yet effective modified attention layer that significantly advances the current state of the art.

Keywords:

zero
Machine learning
State (computer science)
Range (mathematics)
Artificial intelligence
Computer science
transformer
Sequence
Security token
Layer (object-oriented design)
Inference

Correction
Source
Cite
Save
Machine Reading By IdeaReader

References

Citations