循环神经网络(RNN)是一种人工神经网络,通过向网络添加额外的权重来创建网络图中的循环,以维持内部状态。向神经网络添加状态的承诺在于,它们将能够显式地学习和利用上下文……
循环神经网络(RNN)是一种人工神经网络,通过向网络添加额外的权重来创建网络图中的循环,以维持内部状态。向神经网络添加状态的承诺在于,它们将能够显式地学习和利用上下文……
为深度学习模型选择优化算法,可能会导致在几分钟、几小时和几天内获得良好结果的差异。Adam 优化算法是随机梯度下降的扩展,最近在计算机视觉和自然语言处理的深度学习应用中得到了更广泛的应用。在这篇文章中,您将……
编码器-解码器架构很受欢迎,因为它在许多领域都取得了最先进的结果。该架构的一个限制是它将输入序列编码为固定长度的内部表示。这限制了可以合理学习的输入序列的长度,并导致非常……的性能下降。
循环神经网络能够学习序列预测问题中跨越多个时间步的时间依赖性。像长短期记忆(LSTM)网络这样的现代循环神经网络使用反向传播算法的一个变体进行训练,称为随时间反向传播。为了提高序列预测问题的效率,该算法已得到进一步修改……
长短期记忆(LSTM)循环神经网络能够学习和记忆长序列输入。如果您的问题的每个输入只有一个输出,例如时间序列预测或文本翻译,LSTM 会表现得非常好。但是,当您的输入序列非常长而只有……时,使用 LSTM 可能会很困难。
随时间反向传播(BPTT)是用于更新 LSTM 等循环神经网络权重的训练算法。要有效地构建循环神经网络的序列预测问题,您必须对随时间反向传播的作用及其可配置的变体(如截断随时间反向传播)如何影响……有牢固的理解。
序列数据缺失观测值是很常见的。数据可能已损坏或不可用,但您的数据也可能定义上就具有可变长度序列。那些时间步较少的序列可能被视为具有缺失值。在本教程中,您将了解如何处理缺失数据……
深度学习库假定您的数据是向量化的。对于可变长度序列预测问题,这要求对数据进行转换,使每个序列具有相同的长度。这种向量化允许代码为您选择的深度学习算法高效地批量执行矩阵运算。在本教程中……
双向 LSTM 是传统 LSTM 的扩展,可以提高模型在序列分类问题上的性能。在所有输入序列时间步都可用的问题中,双向 LSTM 会训练两个而不是一个 LSTM 来处理输入序列。第一个是在原始输入序列上,第二个是在输入序列的倒序副本上……
神经网络算法是随机的。这意味着它们利用随机性,例如随机初始化权重,因此在相同数据上训练的同一网络可能会产生不同的结果。这对于初学者来说可能会令人困惑,因为算法看起来不稳定,而且实际上它们就是这样设计的。随机初始化允许……