PyTorch 是一个深度学习库。您可以使用 PyTorch 构建非常复杂的深度学习模型。然而,有时您需要模型的图形表示。在这篇文章中,您将学习:如何以交换格式保存您的 PyTorch 模型,如何使用 Netron 创建图形 […]

PyTorch 是一个深度学习库。您可以使用 PyTorch 构建非常复杂的深度学习模型。然而,有时您需要模型的图形表示。在这篇文章中,您将学习:如何以交换格式保存您的 PyTorch 模型,如何使用 Netron 创建图形 […]
一个大型深度学习模型可能需要很长时间才能训练完成。如果训练过程在中间中断,您将丢失大量工作。但有时,您实际上希望在中间中断训练过程,因为您知道继续下去不会得到更好的模型。在这篇文章中,[…]
通过观察神经网络和深度学习模型在训练过程中随时间变化的性能,您可以学到很多东西。例如,如果您看到训练准确度随着训练周期变差,您就知道优化存在问题。可能您的学习率太快了。在这篇文章中,您将发现如何 […]
当您构建和训练 PyTorch 深度学习模型时,您可以通过几种不同的方式提供训练数据。最终,PyTorch 模型就像一个函数,它接受一个 PyTorch 张量并返回另一个张量。您可以自由选择如何获取输入张量。可能最简单的方法是 […]
训练神经网络或大型深度学习模型是一项困难的优化任务。训练神经网络的经典算法称为随机梯度下降。已经证实,通过使用在训练期间变化的学习率,您可以在某些问题上实现更高的性能和更快的训练。在这篇文章中,[…]
Dropout 是一种简单而强大的神经网络和深度学习模型正则化技术。在这篇文章中,您将发现 Dropout 正则化技术以及如何在 PyTorch 模型中将其应用于您的模型。阅读本文后,您将了解:Dropout 正则化技术的工作原理,如何在您的 […] 上使用 Dropout
损失度量对于神经网络非常重要。由于所有机器学习模型都是一个或另一个优化问题,因此损失是需要最小化的目标函数。在神经网络中,优化是通过梯度下降和反向传播完成的。但是损失函数是什么,它们如何影响您的神经网络?在这篇文章中,[…]
深度学习模型最简单的形式是串联连接的感知器层。如果没有任何激活函数,它们只是矩阵乘法,无论有多少层,其能力都有限。激活是神经网络能够近似各种非线性函数的魔力。在 PyTorch 中,有许多 […]
深度学习模型是数据的数学抽象,其中涉及许多参数。训练这些参数可能需要数小时、数天甚至数周,但之后,您可以利用结果将其应用于新数据。这在机器学习中称为推理。了解如何 […] 至关重要
神经网络的“权重”在 PyTorch 代码中称为“参数”,并在训练期间由优化器进行微调。相反,超参数是神经网络的参数,通过设计固定,而不是通过训练进行调整。例如隐藏层的数量和激活函数的选择。 […]