深度学习方法在处理一系列自然语言处理问题时取得了最先进的结果。令人兴奋的是,单一模型可以进行端到端训练,取代了一系列专门的统计模型。英国牛津大学开设了自然语言处理深度学习课程,其中大部分材料来自 […]

深度学习方法在处理一系列自然语言处理问题时取得了最先进的结果。令人兴奋的是,单一模型可以进行端到端训练,取代了一系列专门的统计模型。英国牛津大学开设了自然语言处理深度学习课程,其中大部分材料来自 […]
自然语言处理,简称 NLP,是机器学习的一个子领域,致力于理解语音和文本数据。统计方法和统计机器学习主导着该领域,最近,深度学习方法在语音识别和文本翻译等具有挑战性的 NLP 问题中已被证明非常有效。在本帖中,您将发现斯坦福 […]
自然语言处理,简称 NLP,是研究用于处理语音和文本数据的计算方法。该领域主要由统计范式主导,机器学习方法用于开发预测模型。在本帖中,您将发现可以用来入门的顶级书籍 […]
循环神经网络是一种神经网络,其中前一个时间步的输出作为当前时间步的输入。这会创建一个带有循环的网络图或电路图,这使得理解信息在网络中如何移动变得困难。在本帖中,您将发现 […]
序列预测与其他类型的监督学习问题不同。序列对观察值施加了一个必须在训练模型和进行预测时保留的顺序。通常,涉及序列数据的预测问题被称为序列预测问题,尽管存在一系列基于 […] 的问题。
要确定您的长短期记忆模型在序列预测问题上的表现是否良好可能很困难。您可能会获得良好的模型技能分数,但重要的是要了解您的模型是否适合您的数据,或者它是否欠拟合或过拟合,并且可以 […]
要理解如何准备序列数据作为 LSTM 模型输入可能很困难。通常,关于如何定义 LSTM 模型的输入层存在混淆。关于如何将可能是一维或二维数字矩阵的序列数据转换为 […] 也有混淆。
开发 LSTM 模型的目标是获得一个最终模型,您可以在序列预测问题上使用它。在本帖中,您将了解如何最终确定您的模型并使用它在新数据上进行预测。完成本帖后,您将了解:如何训练最终的 LSTM 模型。如何 […]
长短期记忆循环神经网络是为序列预测而开发的。除了序列预测问题。LSTM 也可以用作生成模型。在本帖中,您将了解 LSTM 如何用作生成模型。完成本帖后,您将了解:关于生成模型,重点是 […]
为序列到序列预测的编码器-解码器 LSTM 提供了温和的介绍,并附有 Python 代码示例。编码器-解码器 LSTM 是一种循环神经网络,旨在解决序列到序列问题,有时也称为 seq2seq。序列到序列预测问题具有挑战性,因为输入和输出序列中的项目数量可能会有所不同。例如,文本翻译和学习执行 […]