标签档案 | Transformer

karsten-wurth-algc0FKHeMA-unsplash

Transformer 模型推理

我们已经了解了如何在英语和德语句子对数据集上训练 Transformer 模型,以及如何绘制训练和验证损失曲线来诊断模型的学习性能,并决定在哪个 epoch 对训练好的模型进行推理。现在我们准备对 […] 模型进行推理。

继续阅读
training_cover

训练 Transformer 模型

我们已经组装了完整的 Transformer 模型,现在我们准备对其进行神经机器翻译训练。我们将为此目的使用一个训练数据集,其中包含简短的英语和德语句子对。我们还将重新审视在训练 […] 过程中计算准确性和损失指标时掩码的作用。

继续阅读
encoder_cover

在 TensorFlow 和 Keras 中从零开始实现 Transformer 编码器

在了解了如何实现缩放点积注意力并将其集成到 Transformer 模型的多头注意力中之后,让我们通过应用其编码器,向实现完整的 Transformer 模型迈进一步。我们的最终目标仍然是将完整的模型应用于自然语言处理 (NLP)。在本教程中,您将发现如何 […]

继续阅读

Machine Learning Mastery 是 Guiding Tech Media 的一部分,Guiding Tech Media 是一家领先的数字媒体出版商,专注于帮助人们了解技术。访问我们的公司网站以了解更多关于我们的使命和团队的信息。