Bahdanau 注意力机制 作者: Stefania Cristina 于 2023年1月6日 发表于 Attention 7 传统的编码器-解码器架构用于机器翻译,将每个源句子编码成一个固定长度的向量,无论其长度如何,然后解码器再从中生成翻译。这使得神经网络难以处理长句子,实际上导致了性能瓶颈。Bahdanau 注意力机制的提出是为了解决性能[…] 继续阅读