用于自然语言处理的深度学习
为你的自然语言问题开发深度学习模型
37 美元
深度学习方法在描述照片和将文本从一种语言翻译成另一种语言等具有挑战性的机器学习问题上取得了最先进的成果。
这本新颖的、以Machine Learning Mastery风格编写的电子书,终于让你摆脱了关于自然语言处理的数学、研究论文和零散描述。
通过清晰的解释、标准的 Python 库(Keras 和 TensorFlow 2)以及分步教程,你将了解什么是自然语言处理、深度学习在该领域的潜力、如何清理和准备文本数据以进行建模,以及如何为自己的自然语言处理项目开发深度学习模型。
关于电子书
- 支持所有设备阅读:英文 PDF 格式电子书,无数字版权管理 (DRM)。
- 大量教程:30个分步课程,414页。
- 真实项目:6个端到端项目。
- 可运行代码:包含99个Python (.py) 代码文件。
清晰完整的示例。
无数学。无隐藏。
心动了吗?
处理文本…很重要,讨论不足,而且很难
我们被文本淹没,来自书籍、论文、博客、推文、新闻,以及越来越多来自口语的文本。
每天,我都会收到关于如何为文本数据开发机器学习模型的问题。
处理文本很难,因为它需要借鉴语言学、机器学习、统计自然语言处理以及如今的深度学习等不同领域的知识。
文本问题
文本建模的问题在于它很混乱,而机器学习算法更喜欢定义明确的固定长度输入和输出。
机器学习算法不能直接处理原始文本;文本必须转换为数字。具体来说,是数字向量。
这被称为特征提取或特征编码,这是深度学习真正改变现状的关键领域之一。
使用深度学习解锁自然语言处理
传统的自然语言处理语言学方法需要语言专家定义规则来覆盖特定情况。这些方法在狭窄的情况下有效,但事实证明它们很脆弱。
统计方法通过从数据中学习规则和模型,而不是要求以自上而下的方式指定它们,从而改进了经典的语言学方法。它们带来了更好的性能,但仍需辅以语言专家手工制作的增强功能,才能取得有用的结果。
通常,为了实现单一建模结果(例如在机器翻译中),需要一系列统计方法。
深度学习方法正在一些具有挑战性的自然语言处理问题上,以单一且更简单的模型开始超越统计方法。
深度神经网络在自然语言处理领域的潜力
深度学习方法之所以受欢迎,主要是因为它们正在兑现其承诺。
这并不是说这项技术没有炒作,而是说炒作是基于在计算机视觉和自然语言处理等一系列极具挑战性的人工智能问题中展现出来的真实结果。
深度学习能力的一些首次大型演示是在自然语言处理领域,特别是语音识别。最近则是在机器翻译领域。
深度学习在自然语言处理领域的五大潜力如下:
- 即插即用替代模型的承诺。也就是说,深度学习方法可以作为替代模型插入到现有的自然语言系统中,从而实现相同或更好的性能。
- 新NLP模型的承诺。也就是说,深度学习方法为序列到序列预测等具有挑战性的自然语言问题提供了新的建模方法的机会。
- 特征学习的承诺。也就是说,深度学习方法可以从自然语言中学习模型所需的特征,而无需专家指定和提取特征。
- 持续改进的承诺。也就是说,深度学习在自然语言处理中的性能是基于真实结果的,并且改进似乎正在持续甚至加速。
- 端到端模型的承诺。也就是说,大型端到端深度学习模型可以适用于自然语言问题,提供更通用和性能更好的方法。
深度学习的惊人应用
自然语言处理并未“解决”,但要在该领域的许多挑战性问题上达到最先进水平,深度学习是必不可少的。
让我们看3个例子,让你了解深度学习在自然语言处理领域能够取得的成果:
1) 自动图像字幕生成
自动图像字幕生成任务是指给定一张照片,系统必须生成描述图像内容的字幕。
2) 自动文本翻译
自动文本翻译是一项任务,您会收到一种语言的文本句子,并且必须将其翻译成另一种语言的文本。
3) 自动文本分类
自动文本分类是为给定文本文档(如评论、推文或电子邮件)分配类别标签的任务。
你可以看到,开发能够完成这些任务的系统在广泛的领域和行业中都将具有价值。
那么,如何才能快速上手并擅长将深度学习应用于自然语言处理呢?
介绍我的新电子书
“自然语言处理深度学习”
这是我刚开始学习自然语言处理深度学习时希望拥有的书。
这本书源于一个想法
如何才能让你尽快精通自然语言处理的深度学习呢?
机器学习精通法建议学习这些材料的最佳方式是实践。这意味着本书的重点是实践项目和教程。这也意味着不涵盖某些主题,即使是“所有人”都涵盖的主题,例如语言理论或建模数学。
本书旨在循序渐进地教你如何将现代深度学习方法应用于你的自然语言处理项目。
你将被引导沿着关键路径前进,从一个对自然语言处理感兴趣的实践者,成长为一个能够自信地将深度学习方法应用于自然语言处理问题的实践者。
我希望你尽快精通自然语言处理的深度学习。我希望你在你的项目中使用这些方法。
这本书适合谁?
……那么这本书适合您吗?
让我们确保您来对了地方。
本书面向了解一些应用机器学习和一些深度学习的开发人员。
也许你希望或需要在你的研究项目或工作中开始使用深度学习处理文本。本书旨在通过将多年的知识和经验浓缩成一个专注于实践教程的课程,帮助你快速高效地实现这一目标。
本指南以您在机器学习精通中习惯的自上而下、结果优先的风格编写。
本书中的课程对您有几点假设。
您需要了解
- 你需要熟悉基本的 Python 和 NumPy。
- 你需要熟悉基本的 scikit-learn。
- 你需要熟悉深度学习的基本 Keras。
您不需要知道:
- 你不需要是数学高手!
- 你不需要是深度学习专家!
- 你不需要是语言大师!
关于您的学习成果
……那么阅读后您会知道什么呢?
本书将教您如何取得成果。
阅读并完成本书后,
您将了解:
- 什么是自然语言处理以及为什么它具有挑战性。
- 什么是深度学习以及它与其他机器学习方法有何不同,特别是深度学习专家如何最好地理解它。
- 该领域专家所定义的深度学习方法在自然语言处理问题中的潜力。
- 如何手工或使用自然语言工具包 (NLTK) 等一流 Python 库准备文本数据以进行建模。
- 如何使用 Gensim 库开发和绘制文本的分布式表示(词嵌入模型)。
- 如何开发一个词袋模型,这是一种可用于机器学习和深度学习方法的表示技术。
- 如何开发一个神经情感分析模型,用于自动预测文本文档的类别标签。
- 如何开发一个神经语言模型,这是任何文本生成神经网络所必需的。
- 如何开发一个照片字幕系统,用于自动生成照片的文本描述。
- 如何开发一个神经机器翻译系统,用于将文本从一种语言翻译成另一种语言。
本书不会教你如何成为一名研究科学家以及特定方法背后的所有理论。它将教你如何在自然语言处理项目中获得结果并创造价值。
您需要知道的一切
…30个精心设计的课程,带你从NLP初学者成为实践者
本书旨在成为针对自然语言处理深度学习的实践者速成课程。
关于自然语言处理,你可以学习很多东西,从理论到应用再到 Keras API。我的目标是通过 30 个重点突出的课程,直接带你获得成果。
我设计的课程侧重于每个自然语言处理项目所需的关键技能,例如数据清洗、数据准备和建模。
每个课程的设计阅读和完成时间约为一小时,不包括扩展阅读和进一步阅读。
您可以选择每天完成一节课,每周完成一节课,或者按照自己的节奏进行。我认为动量至关重要,这本书旨在被阅读和使用,而不是闲置。我建议您选择一个时间表并坚持执行。
教程分为八个部分
- 第一部分:基础知识。了解自然语言处理、深度学习以及两者结合的潜力,以及如何开始使用 Keras 的教程。
- 第二部分:数据准备:探索展示如何清理、准备和编码文本以用于神经网络建模的教程。
- 第三部分:词袋模型。探索词袋模型,这是机器学习的常用表示,也是情感分析神经网络的良好起点。
- 第四部分:词嵌入。探索更强大的词表示方法——词嵌入,以及如何将其开发为独立模型,以及如何将其作为神经网络模型的一部分进行学习。
- 第五部分:文本分类。探索如何利用词嵌入和卷积神经网络学习文本的空间不变模型进行情感分析,这是词袋模型的后续模型。
- 第六部分:语言建模。探索如何开发基于字符和基于词的语言模型,这是任何现代文本生成模型所需的技术。
- 第七部分:图像字幕。探索如何将预训练的对象识别模型与语言模型相结合,以自动为图像生成字幕。
- 第八部分:机器翻译。探索如何结合两个语言模型以自动将文本从一种语言翻译成另一种语言。
课程概览
下面是你将完成的30个分步教程课程概述:
每节课都旨在让普通开发人员在大约 30 到 60 分钟内完成。
第一部分 基础
- 第01课:自然语言处理
- 第02课:深度学习
- 第03课:深度学习在自然语言领域的潜力
- 第04课:如何使用 Keras 开发深度学习模型
第二部分 数据准备
- 第05课:如何手动和使用 NLTK 清理文本
- 第06课:如何使用 scikit-learn 准备文本数据
- 第07课:如何使用 Keras 准备文本数据
第三部分 词袋模型
- 第08课:词袋模型
- 第09课:为情感分析准备电影评论数据
- 第10课:用于情感分析的神经词袋模型
第四部分 词嵌入
- 第11课:词嵌入模型
- 第12课:如何使用 Gensim 开发词嵌入
- 第13课:如何在 Keras 中学习和加载词嵌入
第五部分 文本分类
- 第14课:用于文档分类的神经网络模型
- 第15课:开发一个嵌入+CNN模型
- 第16课:开发一个用于情感分析的n-gram CNN模型
第六部分:语言建模
- 第17课:神经语言建模
- 第18课:开发一个基于字符的神经语言模型
- 第19课:如何开发一个基于词的神经语言模型
- 第20课:开发一个用于文本生成的神经语言模型
第七部分:图像字幕
- 第21课:神经图像字幕生成
- 第22课:用于字幕生成的神经网络模型
- 第23课:加载和使用预训练的对象识别模型
- 第24课:如何使用 BLEU 分数评估生成的文本
- 第25课:如何准备用于建模的照片字幕数据集
- 第26课:开发一个神经图像字幕生成模型
第八部分:神经机器翻译
- 第27课:神经机器翻译
- 第28课:用于NMT的编码器-解码器模型
- 第29课:为NMT配置编码器-解码器模型
- 第30课:如何开发一个神经机器翻译模型
你可以看到每个部分都针对一个特定的学习成果,每个部分中的每个教程也是如此。这起到一个过滤器的作用,确保你只专注于你需要了解的事情,以便获得特定结果,而不会陷入数学或几乎无限数量的配置参数的困境。
这些教程并非旨在教授你所有关于每种技术或自然语言处理问题的知识。它们旨在让你了解它们如何工作,以及如何以我所知的最快方式在你的项目中使用它们:通过实践学习。
目录
下面的截图来自 PDF 电子书。它为您提供了本书的完整目录概览。

《自然语言处理深度学习》目录。
培养可立即应用的NLP实用技能
探索4种不同的NLP应用
你将完成4种不同的神经自然语言处理应用。
- 神经文本分类。开发一个深度学习模型,将电影评论的情感分类为积极或消极。
- 神经语言建模。基于柏拉图的文本开发一个神经语言模型,以生成与原文风格和风味相同的新文本段落。
- 神经照片字幕生成。开发一个模型来自动生成特设照片的简洁描述。
- 神经机器翻译。开发一个模型来将德语文本句子翻译成英语。
探索4种不同的神经网络模型
你将开发4种不同类型的神经自然语言处理模型。
- 神经词袋模型。开发将文本建模为词袋模型(忽略词序)的神经网络模型。
- 神经词嵌入。开发使用分布式表示对文本进行建模的神经网络模型。
- 嵌入+CNN。开发结合词嵌入表示和卷积神经网络的深度学习模型。
- 编码器-解码器RNN。开发使用编码器-解码器架构的循环神经网络。
抢先看电子书内容
点击图片放大。
奖励:深度学习NLP代码秘籍
…你还将获得99个功能齐全的Python脚本
示例代码配方
书中展示的每个配方都是独立的,这意味着您可以将其复制粘贴到您的项目中并立即使用。
- 书中提供的每个示例,您都会得到一个 Python 脚本(.py)文件。
这意味着您可以跟着操作,并将您的答案与所提供的 Python 文件中已知可行的实现进行比较。
这在您处理特定任务的细节时,能大大加快您的进度,例如:
- 清理文本数据。
- 构建问题。
- 开发模型。
- 评估模型。
- 进行预测。
提供的代码是在文本编辑器中开发的,旨在在命令行上运行。不需要特殊的 IDE 或笔记本。
所有代码示例均已使用 Python 3 和 Keras 2 进行测试。
所有代码示例都可以在普通和现代计算机硬件上运行,并且在 CPU 上执行。运行所提供的示例不需要 GPU,尽管 GPU 可以使代码运行得更快。
Python 技术细节
本节提供有关本书附带代码的一些技术细节。
- Python 版本:您可以使用 Python 3。
- SciPy:您将使用 NumPy、Pandas 和 scikit-learn。
- Keras:您需要 Keras 版本 2,并带有 Theano 或 TensorFlow 后端。
- 操作系统:您可以使用 Windows、Linux 或 Mac OS X。
- 硬件:标准现代工作站即可,不需要 GPU。
- 编辑器:您可以使用文本编辑器并在命令行中运行示例。
没有 Python 环境?
没问题!
附录包含分步教程,向您准确展示如何设置 Python 深度学习环境。

《自然语言处理深度学习》提供的 Python 代码秘籍。
关于作者
大家好,我是 Jason Brownlee。我运营这个网站,并且撰写并出版了这本书。
我和我的妻子及儿子们住在澳大利亚。我喜欢读书、写教程和开发系统。
我拥有计算机科学和软件工程背景,以及人工智能专业的硕士和博士学位,主攻随机优化。
我写过关于算法的书籍,在比赛中获胜并排名靠前,为初创公司提供咨询,并在业界工作多年。(是的,我花了很多时间构建和维护真正的运营系统!)
帮助开发者入门并精通应用机器学习,这让我感到非常满足。
我采用一种非传统的自上而下、结果优先的机器学习教学方法,我们从实践教程和问题开始,然后在需要时再深入理论。
如果您有任何问题,我随时乐意帮助。我希望您能在机器学习领域变得出色。
下载您的样章
你想仔细看看这本书吗?下载免费的章节样本 PDF。
输入您的电子邮件地址,样章将发送到您的收件箱。
看看客户们怎么说
在选择 Machine Learning Mastery 的路上,您并不孤单
受到超过 53,938 名从业者的信赖
...包括来自以下公司的员工
...以及来自以下大学的学生和教职员工
以及成千上万的其他人...
绝对没有风险,因为有...
100% 退款保证
此外,正如您对市场上任何优秀产品的期望一样,每一本 Machine Learning Mastery 的电子书
都附带了信心的最大保证:我的黄金标准 100% 退款保证。
100% 退款保证
如果您对购买的任何一本 Machine Learning Mastery 电子书不满意,
只需在购买后 90 天内给我发邮件,我将立即退款给您。
无需等待。不问任何问题。没有风险。
今天就将深度学习引入你的NLP项目!
选择您的套餐
所有价格均为美元(USD)。
(1)点击按钮。 (2)输入您的信息。 (3)立即下载。
采用 SSL 加密的安全支付处理
您有任何问题吗?
机器学习技能值多少钱?
你的老板问你:
“嘿,你能为这个建立一个预测模型吗?”
想象一下,你拥有技能和信心去说:
“好的!”
...并付诸行动。
我经历过。 那感觉太棒了!
这对你来说价值多少?
行业对机器学习技能的需求日益增长。
市场需要的是能交付成果的人,而不是写学术论文的人。
企业知道这些技能的价值,并支付天价的起薪。
数据科学家的起薪为
10 万美元到 15 万美元。
机器学习工程师的薪水甚至更高。
你还有哪些选择?
你已经走到了这一步。
你准备好采取行动了。
但是,你还有哪些选择?有哪些选项?
(1) 一本 100 美元以上的理论教科书
...它枯燥乏味,充满了数学,你很可能永远也读不完。
(2) 一个 10,000 美元以上的现场训练营
...那里都是年轻人,你必须出差,而且可能需要几个月的时间。
(3) 一个 100,000 美元以上的高等学位
...它很昂贵,需要数年时间,而且你会成为一名学者。
或者...
为了你获得的实践技能...
为了你看到的成果速度...
为了你支付的低廉价格...
Machine Learning Mastery 电子书是
超值的选择!
而且它们确实有效。这就是我提供退款保证的原因。
你是一名专业人士
这个领域发展迅速,
...你还能等多久?
你以为你有的是时间,但是...
- 新方法不断涌现,算法也在变化。
- 新书不断出版,价格也在上涨。
- 新的毕业生不断涌现,职位也被填补。
现在就是开始的最佳时机。
自下而上的学习方式缓慢而令人沮丧,
...难道你不想找到一条更快的路吗?
你真的能再这样日复一日、周复一周、月复一月地...
- 从不完整的帖子中拼凑想法和代码。
- 从简短的视频中浏览理论和见解。
- 从学术教科书中解析希腊字母。
针对性训练是你通往成果的最短路径。
专业人士始终保持在领域前沿
获取你需要的培训!
你不想落后或错过机会。
常见问题
客户问题 (78)
感谢您的兴趣。
抱歉,我不支持我的书籍的第三方经销商(例如在其他书店转售)。
我的书是自出版的,我将我的网站视为一个小型精品店,专门为那些对应用机器学习深感兴趣的开发者服务。
因此,我更喜欢自己控制书籍的销售和营销。
很抱歉,我不支持在捆绑包内更换书籍。
所提供捆绑包中的书籍组合是固定的。
我的电子商务系统不够先进,不支持临时捆绑。我相信您能理解。您可以在这里查看完整的书籍和捆绑包目录
如果您已经购买了一个捆绑包,并希望更换其中的一本书,那么非常抱歉,我不支持换书或部分退款。
如果您不满意,请直接联系我,我可以为您安排退款。
感谢您的兴趣。
很抱歉,我无法为您创建定制的书籍捆绑包。这会给我带来维护上的噩梦。我相信您能理解。
我的电子商务系统不是很先进。它不支持临时捆绑书籍或点菜式订购书籍。
我确实有一些现有的书籍捆绑包,我认为它们搭配得很好。
您可以在这里查看我所有可用的书籍和捆绑包目录
抱歉,我不销售我的书的实体版。
所有的书籍和捆绑包都是 PDF 文件格式的电子书。
这是我经过深思熟虑后有意为之的决定
- 这些书充满了必须在电脑上完成的教程。
- 这些书假定您正在实践教程,而不是被动阅读。
- 这些书旨在在电脑屏幕上阅读,旁边放着代码编辑器。
- 这些书是实践手册,而不是用作参考书放在书架上。
- 这些书会频繁更新,以跟上领域和 API 的变化。
我希望这解释了我的理由。
如果您真的想要实体版,您可以购买书籍或捆绑包,并为个人使用打印一份。PDF 文件上没有数字版权管理(DRM)来阻止您打印它们。
抱歉,我不提供 Kindle (mobi) 或 ePub 版本的书籍。
这些书仅以 PDF 文件格式提供。
这是我经过深思熟虑的设计。我的理由如下:
- 我使用 LaTeX 来排版文本和代码,以提供专业的外观,我担心电子书阅读器会搞砸这一点。
- 增加支持的格式会带来维护上的麻烦,这将占用大量时间,影响我更新书籍和创作新书。
- 最关键的是,在电子阅读器或 iPad 上阅读与选择 PDF 格式所支持的书籍与代码编辑器并排打开的方法背道而驰。
我的材料是实践手册,旨在在电脑上打开,旁边放着文本编辑器和命令行。
它们不是离开电脑阅读的教科书。
您可以查看任何一本书的目录。
我在每本书的页面上都提供了两份目录。
具体来说:
- 一份书面摘要,列出了书中的教程/课程及其顺序。
- 一份从 PDF 中截取的目录截图。
如果您找不到目录,请在页面上搜索标题为“目录”的部分。
我很高兴您在开发自己的课程材料时使用我的部分材料,例如课堂讲座的幻灯片或家庭作业练习。
如果您免费分享我的材料或逐字使用,我会不高兴。这将构成版权侵犯。
我网站上和我书中的所有代码都是为教育目的而开发和提供的。我对代码、它可能做什么或您可能如何使用它不承担任何责任。
如果您使用我的材料进行教学,请引用来源,包括:
- 作者姓名,例如“Jason Brownlee”。
- 教程或书籍的标题。
- 网站名称,例如“Machine Learning Mastery”。
- 教程或书籍的 URL。
- 您访问或复制该代码的日期。
例如
- Jason Brownlee, Python 机器学习算法, Machine Learning Mastery, 网址:https://machinelearning.org.cn/machine-learning-with-python/, 访问于 2018 年 4 月 15 日。
另外,如果您的作品是公开的,请联系我,我很乐意出于一般兴趣看看它。
通常不提供。
我的书中没有练习或作业。
我确实在一些书中有端到端的项目,但它们是以教程形式呈现的,我会引导您完成每一步。
书的章节是作为独立的教程编写的,有特定的学习成果。在教程结束时,您将学会如何做某件事。
有些书有一个名为“扩展”的部分,提供了一些以更高级的方式修改教程中代码的想法。它们就像自学练习。
不行。
我有一些书不需要任何编程技能,例如:
其他书籍确实有特定编程语言的代码示例。
您必须了解该编程语言的基础知识,例如如何安装环境以及如何编写简单的程序。我不教编程,我教的是面向开发者的机器学习。
您不需要是一个好的程序员。
话虽如此,我确实为那些可能不熟悉特定语言的开发者提供了关于如何高效设置环境的教程,甚至还有编程语言的速成课程。
抱歉,我没有视频。
我只有文本格式的教程课程和项目。
这是有意为之。我曾经有过视频内容,但我发现完成率要低得多。
我希望您能将材料付诸实践。我发现基于文本的教程是实现这一目标的最佳方式。通过基于文本的教程,您必须阅读、实现并运行代码。
而通过视频,您只是被动观看,不需要采取任何行动。视频是娱乐或信息娱乐,而不是富有成效的学习和工作。
在阅读并实践教程之后,您更有可能运用所学知识。
是的,我提供 90 天无理由退款保证。
我为我的书负责。它们包含了我对特定机器学习主题的最佳知识,并且每本书都经过数万名读者的阅读、测试和使用。
尽管如此,如果您发现我的某本电子书不适合您,我会全额退款。
是的。
我建议使用在 TensorFlow 2.2(或更高版本)上运行的独立 Keras 2.4(或更高版本)。
博客上的所有教程都已更新,使用在 Tensorflow 2 上运行的独立 Keras。
所有书籍都已更新,使用相同的组合。
我还不推荐使用作为 TensorFlow 2 一部分的 Keras(例如 tf.keras)。它太新了,新事物总有问题,我正在等待尘埃落定。独立 Keras 已经运行多年,并且继续表现出色。
有一种情况是教程不支持 TensorFlow 2,因为这些教程使用了尚未更新以支持 TensorFlow 2 的第三方库。具体来说,是那些使用 Mask-RCNN 进行对象识别的教程。一旦第三方库更新,这些教程也会更新。
“Python 长短期记忆网络”一书不侧重于时间序列预测,而是侧重于用于一系列序列预测问题的 LSTM 方法。
“时间序列预测的深度学习”一书向你展示了如何为单变量、多变量和多步时间序列预测问题开发 MLP、CNN 和 LSTM 模型。
迷你课程是关于一系列机器学习主题的免费课程,通过电子邮件、PDF 和博客文章提供。
迷你课程的特点是:
- 简短,通常为 7 天或 14 天。
- 简洁,通常每节课给出一个技巧或代码片段。
- 有限,通常范围较窄,仅限于几个相关领域。
电子书则在许多相同主题上提供完整的培训课程。
电子书的特点是:
- 更长,通常包含 25+ 个完整的教程课程,每个课程最多需要一小时完成。
- 完整,为每个课程提供温和的介绍,并包括完整的可用代码和进一步阅读材料。
- 广泛,涵盖了该主题所需的所有内容,以便快速上手并将技术应用到您自己的项目中。
迷你课程旨在让您快速获得结果。如果您想了解更多信息或更完整的代码示例,可以购买相关的电子书。
“掌握机器学习算法”一书适用于程序员和非程序员。它教你 10 种顶级机器学习算法的工作原理,其中包含算术和电子表格的工作示例,而不是代码。重点是理解每个模型如何学习和进行预测。
“从零开始的机器学习算法”一书适用于通过编写代码来学习的程序员。它提供了关于如何实现顶级算法以及如何加载数据、评估模型等的逐步教程。它较少关注算法的工作原理,而是完全专注于如何在代码中实现每个算法。
这两本书可以相互补充。
这些书是我博客内容的浓缩和更便捷的版本。
我将我的书设计成课程和项目的结合体,教您如何使用特定的机器学习工具或库,然后将其应用于真实的预测建模问题。
这些书会进行更新,包括错误修复、API 变更的更新以及新章节的增加,这些更新是完全免费的。
我确实会将一些书的章节作为示例发布在博客上,但它们与周围的章节或书提供的叙事没有联系,也不提供独立的代码文件。
每本书都附带了书中使用的所有源代码文件,您可以将它们用作配方来快速启动您自己的预测建模问题。
我的书是实践手册,不是教科书。
它们没有深入的理论解释,只有可行的例子,这些例子高度专注于您需要知道的信息,以便将机器学习应用到您的项目中。
几乎没有数学,没有理论或推导。
我的读者非常欣赏我材料中使用的自上而下而非自下而上的方法。这是我收到反馈最多的一个方面。
我的书并不适合所有人,它们是为需要快速获得结果的从业者精心设计的。
电子书可以直接从我的网站上购买。
- 首先,找到您希望购买的书籍或捆绑包,您可以在这里查看完整的目录
- 点击您想购买的书籍或捆绑包,进入该书的详情页面。
- 点击书籍或捆绑包的“立即购买”按钮,进入购物车页面。
- 在购物车中填写您的详细信息和支付信息,然后点击“下单”按钮。
- 完成购买后,您将收到一封包含下载您的书籍或捆绑包链接的电子邮件。
所有价格均为美元(USD)。
书籍可以通过 PayPal 或信用卡购买。
Machine Learning Mastery 上的所有价格均为美元。
可以使用支持国际支付的 PayPal 或信用卡进行支付(例如,大多数信用卡都支持)。
您不必明确地将您的货币兑换成美元。
当您使用 PayPal 或信用卡付款时,货币转换会自动进行。
要在购物时使用折扣码,也称为优惠码或折扣券,请按照以下步骤操作:
1. 在结账页面的“折扣券”字段中输入折扣码文本。
注意,如果您在结账页面上没有看到名为“折扣券”的字段,则表示该产品不支持折扣。
2. 点击“应用”按钮。
3. 然后您会看到一条消息,表明折扣已成功应用于您的订单。
注意,如果您使用的折扣码已失效,您会看到一条消息,表明折扣未能成功应用于您的订单。
你应该按什么顺序读这些书?
这是一个很好的问题,我最好的建议如下:
- 考虑从一本您最感兴趣的主题的书开始。
- 考虑从一本您可以立即应用到项目上的主题的书开始。
另外,请考虑您不需要阅读所有的书,也许一部分书就能让您获得您需要或想要的技能。
尽管如此,一个建议的阅读顺序如下:
-
- 机器学习概率
- 机器学习的统计方法
- 机器学习线性代数
- 机器学习优化
- 机器学习微积分
- 数据科学入门指南
- 精通机器学习算法
- 从零开始实现机器学习算法
- 用于机器学习的 Python
- 使用 Weka 精通机器学习
- 精通 Python 机器学习
- 精通 R 语言机器学习
- 新一代数据科学
- 机器学习数据准备
- 使用 Python 处理不平衡分类问题
- 使用 Python 进行时间序列预测
- 使用 Python 实现集成学习算法
- 使用 Python 实现 XGBoost
- 使用 Python 进行深度学习
- 使用 PyTorch进行深度学习
- 使用 Python 构建长短期记忆网络
- 用于自然语言处理的深度学习
- 使用 Hugging Face Transformers 进行自然语言处理
- 用于计算机视觉的深度学习
- OpenCV 中的机器学习
- 用于时间序列预测的深度学习
- 更好的深度学习
- 使用 Python 构建生成对抗网络
- 使用注意力机制构建 Transformer 模型
- 使用 ChatGPT 提高生产力(这本书可以按任何顺序阅读)
- 使用 Stable Diffusion 精通数字艺术(这本书可以按任何顺序阅读)
希望这能有所帮助。
我最好的建议是,从一本您可以立即应用的主题的书开始。
除此之外,选择一个您最感兴趣的主题。
如果您不确定,或许可以尝试学习一些免费教程,看看您倾向于哪个领域。
通常,我建议专注于端到端地解决预测建模问题的整个过程。
我有三本书,通过三个顶级的开源平台,向您展示如何做到这一点。
- 精通Weka机器学习 (无需编程)
- 精通R语言机器学习 (使用caret)
- 精通Python机器学习 (使用pandas和scikit-learn)
这些都是很好的入门选择。
您随时可以回过头来,选择一本关于算法的书,以便更深入地了解特定方法的工作原理。
《Python深度学习》这本书可以看作是《Python长短期记忆网络》的预备知识。它教您如何开始使用Keras,以及如何开发您的第一个MLP、CNN和LSTM。
《Python长短期记忆网络》这本书深入探讨了LSTM,教您如何准备数据、如何开发一系列不同的LSTM架构、参数调整、更新模型等等。
这两本书都专注于使用Keras库在Python中进行深度学习。
《Python长短期记忆网络》这本书主要关注如何为序列预测开发一系列不同的LSTM网络。
“时间序列预测的深度学习”一书重点介绍了如何使用一系列不同的深度学习模型(MLP、CNN、LSTM 和混合模型)来解决一系列不同的时间序列预测问题(单变量、多变量、多步和组合)。
LSTM这本书只教LSTM,不侧重于时间序列。而时间序列深度学习这本书则侧重于时间序列,并教授如何使用包括LSTM在内的多种不同模型。
《Python长短期记忆网络》这本书专注于如何实现不同类型的LSTM模型。
《自然语言处理深度学习》这本书专注于如何使用包括LSTM在内的多种不同网络来解决文本预测问题。
LSTM这本书可以为NLP这本书提供支持,但它不是必需的预备知识。
您可能需要“Machine Learning Mastery”公司的企业或公司税号用于您自己的税务目的。例如,这在欧盟公司中很常见。
Machine Learning Mastery 公司在波多黎各运营。
因此,公司没有欧盟的增值税(VAT)识别号或适用于您所在国家或地区的类似税号。
公司确实有一个公司编号。详细信息如下:
- 公司名称:Zeus LLC
- 公司编号: 421867-1511
在《精通机器学习算法》中没有代码示例,因此没有使用任何编程语言。
书中通过基本算术描述算法并总结其工作原理。算法的行为也在Excel电子表格中进行了演示,这些表格随书提供。
这是一本学习算法工作原理的绝佳书籍,不会被理论或编程语法所分心。
如果您有兴趣通过从头开始编码(使用Python编程语言)来学习机器学习算法,我推荐另一本书:
所有的书都经过测试,可以与Python 3(例如3.5或3.6)一起使用。
大多数书籍也经过测试,可以与Python 2.7一起使用。
在可能的情况下,我建议使用最新版本的Python 3。
我确实会先在博客上测试我的教程和项目。这就像是创意的早期体验,其中许多并没有进入我的培训材料。
书中的大部分材料最初都以某种形式出现在我的博客上,后来经过提炼、改进并以章节格式重新包装。我发现这对于提高质量和修复错误有很大帮助。
书籍提供了更方便的材料包装,包括源代码、数据集和PDF格式。它们还包括对新API的更新、新章节、错误和拼写修正,以及直接与我联系以获得我能提供的所有支持和帮助。
我相信我的书以几十美元的价格提供了价值数千美元的教育。
它们是我数月甚至数年经验的结晶,浓缩在几百页精心制作且经过充分测试的教程中。
我认为对于希望快速掌握应用机器学习技能或在项目中使用机器学习的专业开发人员来说,它们是物超所值的。
此外,机器学习技能对您、对您的下一个项目、以及对您当前或未来的雇主价值几何?
尽管如此,如果您是学生,或者您不习惯北美、澳大利亚、英国及世界类似地区开发人员的高薪,我的书的价格可能看起来很贵。对此,我感到抱歉。
折扣
我确实为学生、教师和退休人员提供折扣。
请联系我了解更多信息。
免费资料
我在我的博客上提供了大量免费内容,您可以在这里开始学习我最好的免费资料:
关于我的书籍
我的书是实战手册。
它们是为那些想知道如何使用特定库来实际解决问题并在工作中交付价值的开发人员准备的。
- 我的书只引导您了解那些为了取得成果而必须知道的要素。
- 我的书是PDF格式,并附带代码和数据集,专为方便您在电脑上阅读和实践而设计。
- 我的书让您可以通过电子邮件直接联系到我(还有哪些书能提供这个?)。
- 对于专业开发人员来说,我的书是一笔微小的业务开销,可以记入公司账目,并且在大多数地区可以抵税。
很少有机器学习培训材料专注于如何取得成果。
绝大多数资料都在重复同样的数学和理论,却忽略了您真正关心的一件事:如何在项目中使用这些方法。
与其他选项的比较
让我为您提供一些关于书籍定价的背景信息:
YouTube上有免费视频,博客上有免费教程。
- 很好,我鼓励您使用它们,包括我自己的免费教程。
有一些非常便宜的视频课程,教您一两个API的技巧。
- 我的书教您如何使用一个库来端到端地完成一个项目并交付价值,而不仅仅是几个技巧。
一本机器学习教科书可能要花费50到100美元。
- 我所有的书都比一般的机器学习教科书便宜,而且我期望您能更快地提高生产力。
一个训练营或其他线下培训可能花费1000多美元,并持续数天到数周。
- 我所有书籍的捆绑包比这便宜得多,它们允许您按自己的节奏学习,并且捆绑包涵盖的内容比一般训练营更多。
抱歉,我的书不在像Amazon.com这样的网站上销售。
出于多种原因,我慎重决定不把我的书放在亚马逊上:
- 亚马逊会从自出版书籍的销售价格中抽取65%,这会让我无法经营下去。
- 亚马逊对销售页面和购物车体验的控制权很小。
- 亚马逊不允许我通过电子邮件联系我的客户,并提供直接支持和更新。
- 亚马逊不允许我以PDF格式向客户交付我的书,而PDF是我的客户在屏幕上阅读的首选格式。
我希望这能帮助您理解我的理由。
我免费赠送了很多内容。事实上,是大部分内容。
帮助经济不宽裕的学生和从业者对我来说很重要,因此我提供了大量的免费内容。
您可以通过以下方式获取免费内容:
我对此进行了深思熟虑,我销售机器学习电子书有几个重要原因:
- 我用收入来支持网站和所有非付费用户。
- 我用收入来养家糊口,以便我能继续创作内容。
- 为教程付费的从业者更有可能认真学习并学到东西。
- 我的书目标读者是更有可能负担得起这些材料的职业人士。
是的。
您购买的书籍或捆绑包中的所有书籍更新都是免费的。
书籍通常每隔几个月更新一次,以修复错误、拼写问题并跟上API的变化。
随时联系我,查询是否有更新。请告诉我您拥有的书籍版本(版本号列在版权页上)。
是的,这些书可以帮助您找到工作,但只是间接的。
找到工作取决于您自己。
这是一个寻找职位空缺的组织与拥有技能和背景的您之间的匹配问题。
话虽如此,有些公司更看重您能为业务带来的价值,而不是您的学位。通常,这些是较小的公司和初创企业。
您可以通过学习并精通端到端解决预测建模问题来专注于提供机器学习价值。您可以通过建立一个已完成项目的机器学习作品集来展示这项技能。
我的书正是为了帮助您实现这些目标而设计的。它们准确地教您如何使用开源工具和库在预测建模项目中取得成果。
您还有其他问题吗?
请联系我.