深度学习在自然语言处理中的 7 个应用

自然语言处理领域正从统计方法转向神经网络方法。

在自然语言中仍有许多具有挑战性的问题需要解决。然而,深度学习方法在某些特定的语言问题上取得了最先进的结果。

最有趣的不只是深度学习模型在基准问题上的表现;更重要的是,一个单一的模型可以学习词义并执行语言任务,从而无需一系列专门的手工方法。

在这篇文章中,您将发现深度学习方法在7个有趣的自然语言处理任务中取得了一些进展。

通过我的新书《深度学习在自然语言处理中的应用启动您的项目,其中包括逐步教程和所有示例的Python源代码文件

让我们开始吧。

7 Applications of Deep Learning for Natural Language Processing

深度学习在自然语言处理中的 7 个应用
图片由Tim Gorman拍摄,部分权利保留。

概述

在这篇文章中,我们将探讨以下7个自然语言处理问题。

  1. 文本分类
  2. 语言建模
  3. 语音识别
  4. 字幕生成
  5. 机器翻译
  6. 文档摘要
  7. 问答

我尽量专注于您可能感兴趣的终端用户问题类型,而不是深度学习在诸如词性标注、短语块分析、命名实体识别等学术或语言学子问题上的出色表现。

每个例子都提供了问题的描述、一个示例以及演示方法和结果的参考文献。大多数参考文献引自Goldberg在2015年为NLP研究人员撰写的优秀深度学习入门指南

您是否有未列出的深度学习NLP最喜欢的应用?
在下面的评论中告诉我。

需要深度学习处理文本数据的帮助吗?

立即参加我的免费7天电子邮件速成课程(附代码)。

点击注册,同时获得该课程的免费PDF电子书版本。

1. 文本分类

给定一段文本示例,预测预定义的类别标签。

文本分类的目标是给文档的主题或类别进行分类。

——第575页,《统计自然语言处理基础》,1999年。

一个流行的分类例子是情感分析,其中类别标签表示源文本的情感基调,如“积极”或“消极”。

以下是另外3个例子:

  • 垃圾邮件过滤,将电子邮件文本分类为垃圾邮件或非垃圾邮件。
  • 语言识别,分类源文本的语言。
  • 体裁分类,分类虚构故事的体裁。

此外,问题可能被框架为需要为文本分配多个类别,即所谓的多标签分类。例如为源推文预测多个标签。

有关此一般主题的更多信息,请参阅

以下是3篇关于文本分类深度学习论文的例子

2. 语言模型

语言建模实际上是更有趣的自然语言问题的子任务,特别是那些以某种其他输入为条件的语言模型。

…问题是根据前面的词预测下一个词。这项任务是语音或光学字符识别的基础,也用于拼写校正、手写识别和统计机器翻译。

——第191页,《统计自然语言处理基础》,1999年。

除了语言建模的学术兴趣外,它还是许多深度学习自然语言处理架构的关键组成部分。

语言模型学习词语之间的概率关系,从而可以生成与源文本在统计上一致的新词语序列。

单独而言,语言模型可用于文本或语音生成;例如:

  • 生成新的文章标题。
  • 生成新的句子、段落或文档。
  • 生成句子的建议续写。

更多关于语言模型的信息,请参阅:

以下是深度学习用于语言建模(仅此一项)的一个例子

3. 语音识别

语音识别是理解所说内容的问题。

语音识别的任务是将包含口语自然语言语音的声学信号映射到说话者意图的相应词序列。

——第458页,《深度学习》,2016年。

给定作为音频数据的文本语音,模型必须生成人类可读的文本。

由于该过程的自动化性质,该问题也可能被称为自动语音识别(ASR)。

语言模型用于创建以音频数据为条件的文本输出。

一些例子包括:

  • 转录演讲。
  • 为电影或电视节目制作文本字幕。
  • 在驾驶时向收音机发出指令。

更多关于语音识别的信息,请参阅:

以下是深度学习在语音识别方面的3个例子。

4. 字幕生成

字幕生成是描述图像内容的问题。

给定一张数码图像,例如照片,生成对图像内容的文本描述。

语言模型用于创建以图像为条件的字幕。

一些例子包括:

  • 描述场景内容。
  • 为照片创建字幕。
  • 描述视频。

这不仅是为听力障碍者提供的应用,也是为图像和视频数据生成可搜索的人类可读文本的应用,例如在网络上。

以下是深度学习用于字幕生成的3个例子:

5. 机器翻译

机器翻译是将一种语言的源文本转换为另一种语言的问题。

机器翻译,即文本或语音从一种语言到另一种语言的自动翻译,是自然语言处理最重要的应用之一。

——第463页,《统计自然语言处理基础》,1999年。

鉴于使用深度神经网络,该领域被称为神经机器翻译。

在机器翻译任务中,输入已经包含某种语言的符号序列,计算机程序必须将其转换为另一种语言的符号序列。这通常应用于自然语言,例如从英语翻译到法语。深度学习最近开始对这类任务产生重要影响。

——第98页,《深度学习》,2016年。

语言模型用于输出第二语言中的目标文本,以源文本为条件。

一些例子包括:

  • 将法文文档翻译成英文。
  • 将西班牙语音频翻译成德语文本。
  • 将英文文本翻译成意大利语音频。

更多关于神经机器翻译的信息,请参阅

以下是深度学习用于机器翻译的3个例子

6. 文档摘要

文档摘要是创建文本文档简短描述的任务。

如上所述,语言模型用于输出以完整文档为条件的摘要。

文档摘要的一些例子包括:

  • 为文档创建标题。
  • 为文档创建摘要。

更多关于该主题的信息,请参阅

以下是深度学习用于文档摘要的3个例子

7. 问答

问答是这样一个问题:给定一个主题,例如一份文本文档,回答关于该主题的特定问题。

……问答系统试图通过返回适当的名词短语(如地点、人物或日期)来回答用户以问题形式提出的查询。例如,问题“谁杀害了肯尼迪总统?”可能被回答为名词短语“奥斯瓦尔德”。

——第377页,《统计自然语言处理基础》,1999年。

一些例子包括:

有关问答的更多信息,请参阅

  • 回答关于维基百科文章的问题。
  • 回答关于新闻文章的问题。
  • 回答关于医疗记录的问题。

以下是深度学习问答的3个例子

进一步阅读

本节提供了更多关于NLP深度学习应用的资源,如果您想深入了解。

总结

在这篇文章中,您发现了深度学习应用于自然语言处理任务的7个方面。

您最喜欢的深度学习NLP示例是否遗漏了?
请在评论中告诉我。

你有什么问题吗?
在下面的评论中提出你的问题,我会尽力回答。

立即开发文本数据的深度学习模型!

Deep Learning for Natural Language Processing

在几分钟内开发您自己的文本模型

...只需几行python代码

在我的新电子书中探索如何实现
用于自然语言处理的深度学习

它提供关于以下主题的自学教程
词袋模型、词嵌入、语言模型、标题生成、文本翻译等等...

最终将深度学习应用于您的自然语言处理项目

跳过学术理论。只看结果。

查看内容

深度学习在自然语言处理中的7大应用的60条回复

  1. Baran 2017年9月20日 6:05 AM #

    嗨,Jason,我很喜欢阅读它,谢谢。你是否计划用Keras为问答模型创建一个编码示例/教程?我需要一个可变问题和答案大小的实现。

    • Jason Brownlee 2017年9月20日 7:45 AM #

      我希望能尽快实现一个。

    • 娜塔莎 2019年3月8日 2:15 AM #

      嗨,Jason,
      非常感谢您对该领域的精彩介绍和丰富的资源!解释得如此清晰简洁,读起来真是享受,对我的项目帮助很大。
      我的项目可能与情感分析最密切相关,但我想深入研究。我相对来说是机器学习的新手,我真的很想彻底理解该主题的精髓。这就是为什么我发现您的网站非常非常好。谢谢!

  2. Emeka Farrier 2017年9月20日 10:18 PM #

    好读!我也要开始一个小型项目……在自然语言处理领域非常独特

  3. Chiedu 2017年9月21日 3:15 PM #

    嗨,Jason,
    我知道你已经开始了你的机器学习文本系列。
    做得好

  4. Farooq Zaman 2017年9月22日 5:23 AM #

    尊敬的先生,感谢您这篇关于NLP任务的精彩且富有知识性的文章
    我读了一些关于词性标注的论文,深度学习在其中也表现出色
    您能就此也发表一篇博文吗?并且最好能用keras进行一些实现。我会很喜欢它。再次感谢

  5. 本·彼得森 2017年9月23日 1:10 AM #

    很棒的帖子。我希望在我的研究生论文工作中利用这项技术,对宣传进行各种分析。您知道有哪些低成本或对教育友好的服务可供我这样的人使用机器学习进行此类研究吗?

    感谢这篇精彩的文章。

    此致,
    Ben

    • Jason Brownlee 2017年9月23日 5:42 AM #

      本,你具体指的是什么服务?数据来源?

  6. 瑞安 2017年9月23日 2:39 AM #

    嘿,Jason – 感谢您的这篇文章和资源列表。我正在寻找使用NLP来审查合同,以确定关键信息领域是否已填写;主名称、地址、签名等。目前正在手动扫描,哎呀。“问答”似乎很接近 – 您对部署工具或技术类型有什么建议吗?谢谢

    • Jason Brownlee 2017年9月23日 5:43 AM #

      有意思。听起来工程(检查每个字段)可能比机器学习更好,但我不太了解这个问题。

  7. Abhishek Singh 2017年9月28日 2:58 AM #

    先生,干得太棒了。如果能用工作实例来解释会更好。
    谢谢

  8. Deepu 2017年11月1日 4:56 PM #

    你太棒了!只用了5分钟阅读和理解这篇博文,就对深度学习的不同领域有了概念。现在我真的可以缩小我的项目研究范围了。谢谢你,感谢你的努力。顺便说一句,我上个月买了你的教科书,我很喜欢它。请继续更新。

  9. Anupam 2017年12月18日 1:12 PM #

    嗨,Jason,
    我有一段文本,我想从中得出一些推论。例如
    输入
    如果位A被设置,位B不能被设置。
    如果位A是1,则B不能被写入。

    输出
    要设置B,A必须被设置

    您如何分类这个问题?您推荐哪种方法?
    谢谢

    • Jason Brownlee 2017年12月18日 3:29 PM #

      也许您可以准备数百万个文本形式的输入-输出示例,然后训练一个NLP模型?

      也许你可以将文本翻译成二进制格式,然后学习一个简单的逻辑程序?

  10. Anu 2018年1月14日 11:37 PM #

    出色的介绍。我很想知道深度学习如何用于命名实体识别。

  11. shabir 2018年1月20日 5:14 PM #

    嘿,杰森

    非常有趣,你能帮我发送文本摘要的Python代码吗?

  12. priya 2018年3月21日 6:34 PM #

    嗨,Jason,

    如何在 Python 中将从音频中提取的特征向量作为 RNN 网络的输入?

  13. Harish 2018年4月16日 2:45 PM #

    嗨,Jason,
    发现这篇文章很有趣。我有一个想法,从一组评论中总结体育赛事的亮点。以板球为例,给定比赛的全部评论集,我必须挑选出与任何亮点(如4分、6分或 wickets)对应的评论。请帮我回答我该做什么?我可以使用文本分类还是文本摘要?如何在这样的背景下使用这种方法?

  14. Happy 2018年5月18日 12:34 AM #

    你好 Jason,

    从你的博客中学习总是令人鼓舞的。

    我正在尝试学习问答。你已经实现了一个吗?
    我很想向你学习。

    谢谢

  15. Mamta 2018年5月19日 10:56 AM #

    很棒的文章……感觉很有信心……开始了为期7天的小型课程
    “NLP深度学习速成班。”

  16. Balaji Gentela 2018年5月23日 7:26 PM #

    先生您好…您能解释一下文本分类是如何工作的吗…有没有什么算法…?

  17. Syed Alam 2018年7月8日 11:00 PM #

    你好,

    您是否计划提供用于语音识别的自然语言处理概念和代码?

  18. kush shrivastava 2018年8月7日 10:32 PM #

    谢谢你 Jason,我发现这篇文章对我的研究工作很有帮助

  19. Prithivi 2018年8月14日 7:32 PM #

    嗨 Jason – 这是一篇很棒的文章,但关于最后一个,问答,我有一个问题,我想我不同意您的描述。

    1. 以文本语料库作为输入,使用NLU/TE从段落中回答问题,如果不算错的话,这被称为机器阅读理解或机器阅读或机器理解。

    2. 另一方面,人们从文本语料库中提取事实性信息并将其存储在知识图谱式的数据存储中以回答事实性问题,我认为这通常被称为QA系统。

    QA是一个总称吗?我错过了什么吗?

  20. Hamza 2018年10月3日 3:49 PM #

    我需要一个这个领域的博士研究想法,但似乎一切都做完了!

  21. Arjun.K 2018年10月4日 9:02 PM #

    Jason,非常好的文章,它给了我一个NLP的概览,你能提供上述7个模型的编程代码吗?谢谢

  22. 史蒂夫 2018年10月9日 7:37 AM #

    您会推荐哪种GPU用于NLP?
    我发现了一些公司,例如https://www.exxactcorp.comhttps://bizon-tech.com/us/workstations/deeplearning/,它们都在构建深度学习工作站,但我不确定配置。

  23. w3d 2018年11月4日 7:54 PM #

    你好
    谢谢你的努力
    我想引用你在这里发布的信息
    我该如何引用它?这里的所有信息都在你的书里吗?
    那么我只需引用那本书吗?

  24. Bhagi 2019年1月11日 5:49 PM #

    您能给我一些使用深度学习进行研究的新想法吗?

  25. Abdullah A. Jassim 2019年4月2日 10:27 AM #

    嗨,Jason,
    我对使用Word2Vec和深度学习将文本文件转换为统一建模语言(UML)文本,然后将UML文本转换为差分解释器代码中的含义和推理感兴趣。
    请问,您能推荐一本书或讲座来帮助我完成我的项目吗?

    衷心感谢,并致以最诚挚的问候,

  26. Amita 2019年4月2日 5:13 PM #

    你好 Jason,

    我需要从PDF文档中提取模式或一些所需的文本。因此,我猜这个目标涉及语义分析。您在上面的文章中提到了NLP的7个应用。我的目标属于哪一类?您能推荐您的哪本书对我有用吗?

    此致,
    Amita

    • Jason Brownlee 2019年4月3日 6:40 AM #

      这可能是文本提取,如果输入是图像或类似图像,甚至可能是计算机视觉+NLP问题。

  27. Ase 2019年4月3日 6:15 AM #

    先生您好。我目前正在通过提取文本并使用多项式朴素贝叶斯进行文档分类。我发现使用该模型会出现很多误报。

    • Jason Brownlee 2019年4月3日 6:51 AM #

      也许您可以使用ROC曲线并选择一个能减少误报的阈值?

  28. Muhammad iqbal 2019年4月16日 8:10 PM #

    保持出色,我将向您道贺!

  29. Mamta Borle 2021年7月3日 2:09 PM #

    如何开始课程?链接?是视频讲座吗?

发表评论

Machine Learning Mastery 是 Guiding Tech Media 的一部分,Guiding Tech Media 是一家领先的数字媒体出版商,专注于帮助人们了解技术。访问我们的公司网站以了解更多关于我们的使命和团队的信息。