使用 PyTorch 的优化器

优化是一个我们尝试为深度学习模型找到最佳参数集的过程。优化器生成新的参数值,并使用某个标准来评估它们,以确定最佳选项。作为神经网络架构的重要组成部分,优化器有助于确定最佳权重、偏差或其他将产生所需输出的超参数。

PyTorch 中有许多种类的优化器,每种都有其优缺点。它们包括 Adagrad、Adam、RMSProp 等。

在之前的教程中,我们实现了优化器更新权重和偏差的所有必要步骤。在这里,您将了解一些 PyTorch 包,这些包可以使优化器的实现更加容易。特别是,您将学习

  • 如何使用 PyTorch 中的一些包来实现优化器。
  • 如何从 PyTorch 的 'nn' 包中导入线性类和损失函数。
  • 如何使用 PyTorch 的 'optim' 包实现随机梯度下降和 Adam(最常用的优化器)。
  • 如何自定义模型的权重和偏差。

请注意,我们将在 PyTorch 系列的后续教程中使用相同的实现步骤。

通过我的《用PyTorch进行深度学习》一书来启动你的项目。它提供了包含可用代码自学教程


让我们开始吧。

使用 PyTorch 中的优化器。
图片来源:Jean-Daniel Calame。部分权利保留。

概述

本教程分为五个部分:

  • 准备数据
  • 构建模型和损失函数
  • 使用随机梯度下降训练模型
  • 使用 Adam 优化器训练模型
  • 绘制图表

准备数据

让我们开始导入本教程中将使用的库。

我们将使用自定义数据类。数据是一条具有斜率和截距分别为 -5 和 1 的从 -5 到 5 的值。此外,我们将添加与 x 相同的值的噪声,并训练模型来估计这条线。

现在,我们使用它来创建我们的数据集对象并绘制数据。

来自自定义数据集对象的数据

总而言之,以下是创建图表的完整代码

构建模型和损失函数

在之前的教程中,我们为线性回归模型和损失函数创建了一些函数。PyTorch 只需几行代码即可实现这一点。以下是我们如何从 PyTorch 的 nn 包导入内置线性回归模型及其损失准则。

模型参数在创建时是随机化的。我们可以通过以下方式验证这一点

它会打印:

虽然 PyTorch 会随机初始化模型参数,但我们也可以自定义它们以使用自己的参数。我们可以按如下方式设置我们的权重和偏差。请注意,在实际应用中我们很少需要这样做。

在开始训练之前,让我们创建一个 DataLoader 对象将数据集加载到管道中。

想开始使用PyTorch进行深度学习吗?

立即参加我的免费电子邮件速成课程(附示例代码)。

点击注册,同时获得该课程的免费PDF电子书版本。

使用随机梯度下降训练模型

要使用我们选择的优化器,我们可以从 PyTorch 导入 optim 包。它包含了几个最先进的参数优化算法,这些算法只需一行代码即可实现。例如,随机梯度下降 (SGD) 可按如下方式提供。

作为输入,我们向构造函数提供了 model.parameters() 来指定要优化的内容。我们还定义了步长或学习率 (lr)。

为了帮助以后可视化优化器的进度,我们创建一个空列表来存储损失,并让我们的模型训练 20 个 epoch。

在上面,我们将数据样本馈送到模型进行预测并计算损失。梯度在反向传播期间计算,并优化参数。虽然在之前的会话中我们使用了额外的代码行来更新参数和清零梯度,但 PyTorch 提供了优化器中的 zero_grad()step() 方法来使过程简洁。

您可以增加上面 DataLoader 对象中的 batch_size 参数以进行小批量梯度下降。

总而言之,完整的代码如下

使用 Adam 优化器训练模型

Adam 是训练深度学习模型最常用的优化器之一。当您拥有大量训练数据时,它速度快且效率很高。Adam 是一个具有动量的优化器,当模型复杂时(在大多数深度学习情况下),它的性能可能优于 SGD。

在 PyTorch 中,将上面的 SGD 优化器替换为 Adam 优化器非常简单。虽然所有其他步骤都相同,但我们只需要将 SGD() 方法替换为 Adam() 来实现该算法。

同样,我们将定义迭代次数和一个空列表来存储模型损失。然后我们可以运行训练。

将所有内容放在一起,完整的代码如下。

绘制图表

我们已成功实现了用于模型训练的 SGD 和 Adam 优化器。让我们可视化模型损失在训练过程中在两种算法中的下降情况,这些损失存储在列表 loss_SGDloss_Adam

您可以看到,在上面的示例中,SGD 比 Adam 收敛得更快。这是因为我们正在训练一个线性回归模型,其中 Adam 提供的算法是过度的。

将所有内容放在一起,完整的代码如下。

总结

在本教程中,您使用 PyTorch 的一些内置包实现了优化算法。特别是,您学习了

  • 如何使用 PyTorch 中的一些包来实现优化器。
  • 如何从 PyTorch 的 nn 包中导入线性类和损失函数。
  • 如何使用 PyTorch 的 optim 包实现随机梯度下降和 Adam(最常用的优化器)。
  • 如何自定义模型的权重和偏差。

开始使用PyTorch进行深度学习!

Deep Learning with PyTorch

学习如何构建深度学习模型

...使用新发布的PyTorch 2.0库

在我的新电子书中探索如何实现
使用 PyTorch进行深度学习

它提供了包含数百个可用代码自学教程,让你从新手变成专家。它将使你掌握:
张量操作训练评估超参数优化等等...

通过动手练习开启你的深度学习之旅


查看内容

使用 PyTorch 的优化器 的一个回复

  1. Slava Kostin 2023年1月2日 下午1:19 #

    代码中有个错误——只在两个循环中使用了 1 个优化器 (Adam)。
    在完整列表中没有这一行
    optimizer = torch.optim.SGD(model.parameters(), lr=0.01)

    因此,最终的图表——看起来不像上面的图片

留下回复

Machine Learning Mastery 是 Guiding Tech Media 的一部分,Guiding Tech Media 是一家领先的数字媒体出版商,专注于帮助人们了解技术。访问我们的公司网站以了解更多关于我们的使命和团队的信息。