语言模型根据序列中已经出现的特定词语来预测序列中的下一个词语。使用神经网络也可以在字符级别上开发语言模型。基于字符的语言模型的好处在于其词汇量小,并且在处理任何单词、标点符号等方面具有灵活性,[…]

语言模型根据序列中已经出现的特定词语来预测序列中的下一个词语。使用神经网络也可以在字符级别上开发语言模型。基于字符的语言模型的好处在于其词汇量小,并且在处理任何单词、标点符号等方面具有灵活性,[…]
语言建模涉及在给定已有词语序列的情况下预测序列中的下一个词。语言模型是许多自然语言处理模型(如机器翻译和语音识别)中的关键元素。语言模型的构建方式必须与其预期用途相匹配 […]
语言建模是许多重要自然语言处理任务的核心。最近,基于神经网络的语言模型在独立使用以及作为更具挑战性的自然语言处理任务的一部分时,都表现出比传统方法更好的性能。在这篇文章中,您将探索用于自然语言处理的语言建模。阅读本文后,您将了解:为什么语言 […]
用 Python 和 Keras 逐步开发一个深度学习模型,自动将影评分类为正面或负面。词嵌入是一种表示文本的技术,其中具有相似含义的不同词语具有相似的实值向量表示。这是一项关键突破,它使得神经网络模型在[…]方面取得了优异的性能。
编码器-解码器模型为使用循环神经网络解决具有挑战性的序列到序列预测问题(如机器翻译)提供了一种模式。编码器-解码器模型可以在 Keras Python 深度学习库中开发,Keras 博客上已经描述了一个用此模型开发的神经机器翻译系统示例,并提供了示例 […]
文本分类描述了一类常见问题,例如预测推文和影评的情感,以及将电子邮件分类为垃圾邮件或非垃圾邮件。深度学习方法在文本分类方面表现非常出色,在一系列标准的学术基准问题上取得了最先进的结果。在这篇文章中,您将发现一些 […]
影评可以被分为好评或差评。对影评文本的评估是一个分类问题,通常称为情感分析。开发情感分析模型的一种流行技术是使用词袋模型,该模型将文档转换为向量,其中文档中的每个词都被赋予一个分数。在这篇 […]
你不能直接从原始文本开始拟合机器学习或深度学习模型。你必须首先清理你的文本,这意味着将其分割成单词并处理标点符号和大小写。实际上,你可能需要使用一整套文本准备方法,而方法的选择 […]
文本数据的准备工作因问题而异。准备工作从加载数据等简单步骤开始,但很快就会因为清理任务变得困难,这些任务与您正在处理的数据非常具体。您需要帮助,以了解从哪里开始,以及从原始数据到数据[…]的步骤顺序。
注意力(Attention)机制是为了提高编码器-解码器循环神经网络(RNN)在机器翻译上的性能而开发的。在本教程中,您将了解编码器-解码器模型的注意力机制。完成本教程后,您将了解:关于用于机器翻译的编码器-解码器模型和注意力机制。如何逐步实现注意力机制。[…]