标签档案 | 注意力

karsten-wurth-algc0FKHeMA-unsplash

Transformer 模型推理

我们已经了解了如何在一个英语和德语句子对的数据集上训练 Transformer 模型,以及如何绘制训练和验证损失曲线来诊断模型的学习性能并决定在哪个 epoch 上对训练好的模型进行推理。我们现在准备对 […] 进行推理。

继续阅读
training_cover

训练 Transformer 模型

我们已经构建了完整的 Transformer 模型,现在我们可以为神经机器翻译训练它。为此,我们将使用一个包含简短英语和德语句子对的训练数据集。我们还将回顾掩码在计算训练过程中的准确率和损失指标中的作用 […]

继续阅读
vit_cover

Vision Transformer 模型

随着 Transformer 架构在注意力机制的实现上带来了革命性的变化,并在自然语言处理领域取得了非常有希望的结果,它被应用于计算机视觉领域只是时间问题。这最终通过 Vision Transformer (ViT) 的实现得以实现。在本教程中,您 […]

继续阅读

Machine Learning Mastery 是 Guiding Tech Media 的一部分,Guiding Tech Media 是一家领先的数字媒体出版商,专注于帮助人们了解技术。访问我们的公司网站以了解更多关于我们的使命和团队的信息。