Bahdanau 注意力机制 作者: Stefania Cristina 于 2023年1月6日 发布在 Attention 7 传统的编码器-解码器架构用于机器翻译,它们将每个源句子编码为固定长度的向量,无论其长度如何,然后解码器会从中生成翻译。这使得神经网络难以处理长句子,实际上导致了性能瓶颈。Bahdanau 注意力机制的提出旨在解决性能[…] 继续阅读
注意力研究概览 作者: Stefania Cristina 于 2023年1月6日 发布在 Attention 7 注意力是跨多个学科科学研究的一个概念,包括心理学、神经科学,以及最近的机器学习。虽然所有学科可能都有自己对注意力的定义,但它们都能达成一致的一个核心特质是,注意力是使生物和人工神经网络系统更加灵活的机制。在 […] 继续阅读