samet-erkoseoglu-B0nUaoWnr0M-unsplash

BERT 简介

在我们学习了 Transformer 是什么以及如何训练 Transformer 模型后,我们发现它是让计算机理解人类语言的绝佳工具。然而,Transformer 最初被设计为一种翻译语言的模型。如果我们将其用于其他任务,我们就会 [...]

继续阅读

与Kirk Borne博士的互动式机器学习直播课程

赞助帖子     立即申请参加 Kirk Borne 博士的现场互动课程,将于 11 月 28 日开始。与前 NASA 科学家、Booz Allen Hamilton 前首席数据科学家 Kirk Borne 博士一起,通过实践实验室和真实应用探索实时机器学习。他曾是天体物理学和计算科学的教授 [...]

继续阅读
karsten-wurth-algc0FKHeMA-unsplash

Transformer 模型推理

我们已经了解了如何在一组英语和德语句子对的数据集上训练 Transformer 模型,以及如何绘制训练和验证损失曲线来诊断模型的学习性能并决定在哪个 epoch 上对训练好的模型进行推理。现在我们准备对 [...]

继续阅读

参加 2022 数据科学研讨会

赞助帖子      参加 2022 年数据科学研讨会,11 月 8 日,辛辛那提大学商业分析中心将于 11 月 8 日举办其年度数据科学研讨会 2022。本次全天线下活动将有三位特邀演讲嘉宾和两个技术讲座,每个讲座有四个并发演示。 [...]

继续阅读
training_cover

训练 Transformer 模型

我们已经完成了 Transformer 模型的构建,现在可以开始训练它进行神经机器翻译。为此,我们将使用一个包含简短英语和德语句子对的训练数据集。我们还将回顾掩码在计算训练过程中的准确率和损失指标方面的作用 [...]

继续阅读

Machine Learning Mastery 是 Guiding Tech Media 的一部分,Guiding Tech Media 是一家领先的数字媒体出版商,专注于帮助人们了解技术。访问我们的公司网站以了解更多关于我们的使命和团队的信息。