Bahdanau 注意力机制 作者: Stefania Cristina ,发布于 2023年1月6日 ,分类: 注意力机制 7 传统的用于机器翻译的编码器-解码器架构,会将每个源句子编码成一个固定长度的向量,而无论其长短,解码器再根据这个向量生成译文。这使得神经网络难以处理长句子,从而导致了性能瓶颈。Bahdanau 注意力机制的提出正是为了解决这一性能问题 […] 继续阅读
基于注意力的架构巡览 作者: Stefania Cristina ,发布于 2023年1月6日 ,分类: 注意力机制 4 随着注意力机制在机器学习领域的日益普及,融合了注意力机制的神经架构也越来越多。在本教程中,您将了解到与注意力机制结合使用的几种重要神经架构。完成本教程后,您将更好地理解注意力机制是如何融入不同架构的 […] 继续阅读