机器学习概率
探索如何用 Python 驾驭不确定性
概率论是机器学习的基石。没有它,你就不可能深入理解和应用机器学习。
本书将带你拨开方程、希腊字母和困惑的迷雾,探索你需要了解的概率论主题。
通过清晰的解释、标准的 Python 库和循序渐进的教程课程,你将发现概率论对机器学习、贝叶斯概率、熵、密度估计、最大似然等等的重要性。
关于本电子书
- 支持所有设备阅读:英文 PDF 格式电子书,无数字版权管理 (DRM)。
- 海量教程:28 个循序渐进的课程,共 312 页。
- 基础知识:分布、估计等。
- 可用代码:包含 74 个 Python (.py) 代码文件。
清晰、完整的端到端示例。
心动了吗?
没有概率论,机器学习就毫无意义
什么是概率论?
……它是关于处理不确定性的
不确定性涉及在信息不完整的情况下做出决策,而这正是我们在世界中通常的运作方式。
处理不确定性通常使用日常词汇来描述,如机会、运气和风险。
概率是数学的一个领域,它为我们提供了量化事件不确定性并以原则性方式进行推理的语言和工具。
我们可以为我们关心事物(如结果、事件或数值)的可能性进行赋值和量化。
为什么概率论对机器学习很重要?
……项目的每一步都需要它
可以毫不夸张地说,要有效地完成一个机器学习预测建模项目,概率论是必不可少的。
机器学习的核心在于从不确定的数据中开发预测模型。不确定性意味着处理不完美或不完整的信息。
不确定性是机器学习领域的基础,但它也是给初学者,尤其是那些来自开发者背景的初学者带来最多困难的方面之一。
机器学习中的不确定性主要有三个来源:噪声数据、对问题域的覆盖不完整以及不完美的模型。
尽管如此,我们可以利用概率论的工具来管理不确定性。.
作为机器学习从业者,我们必须理解概率论,才能管理好在每个项目中遇到的不确定性。
事实上……
概率论是机器学习的基石
- 分类模型必须预测一个类别成员的概率。
- 算法的设计是基于概率论的(例如朴素贝叶斯)。
- 学习算法会利用概率论来做决策(例如信息增益)。
- 一些子研究领域是建立在概率论之上的(例如贝叶斯网络)。
- 算法是在概率框架下进行训练的(例如最大似然估计)。
- 模型是使用概率损失函数进行拟合的(例如对数损失和交叉熵)。
- 模型的超参数是使用概率方法配置的(例如贝叶斯优化)。
- 概率度量被用来评估模型的性能(例如布里尔分数,ROC)。
- ……这样的例子不胜枚举
初学者常犯的 3 个错误
当你发现概率论对机器学习的重要性之后,初学者往往会犯三个关键的错误。
1. 初学者不理解概率论
开发人员不懂概率论,这是一个大问题。
程序员在开发软件时并不需要了解和使用概率论。软件工程和计算机科学课程侧重于确定性程序,有输入,有输出,没有随机性或噪声。
因此,从计算机科学或开发者背景转型的机器学习从业者,通常不了解也不重视概率思维。
鉴于概率论是预测建模项目的基石,这就成了一个问题。
2. 初学者学习了错误的概率论知识
最终,机器学习从业者会意识到需要概率论技能。
这可能始于需要更好地解释描述性统计数据,并可能发展到需要理解许多流行机器学习算法背后的概率框架。
问题是,他们不去寻找他们需要的概率论信息。相反,他们试图通读一本概率论教科书,或者学习本科概率方法课程的材料。
这种方法很慢,很无聊,而且它所涵盖的概率论材料的广度和深度超出了机器学习从业者的需求。
3. 初学者学习概率论的方式不对
情况比这更糟。
无论通过何种媒介学习概率论,无论是书籍、视频还是课程材料,机器学习从业者学习概率论的方式都是错误的。
因为这些材料是为需要通过考试的本科生准备的,所以材料侧重于数学、理论、证明和推导。
这对于测试学生来说很好,但对于需要结果的从业者来说却很糟糕。
从业者需要的是能清楚说明何时适用以及如何解释结果的方法。他们需要复杂方程背后的直觉。他们需要可以立即在自己的项目上使用的代码示例。
一种更好的概率论入门方式
看到一个又一个从业者投入到为本科生设计的概率论教科书和在线课程中,然后又放弃,我感到很沮丧。
自下而上的学习方法很难,特别是如果你已经有了一份全职工作。
概率论不仅对机器学习很重要,而且它也很有趣,或者说如果用正确的方式来学习,它可以变得很有趣。
我想帮助你像我一样看待这个领域:它只是我们在通往机器学习精通之路上可以驾驭的另一套工具。
隆重推出我的新电子书
“机器学习概率论”
欢迎阅读电子书:机器学习概率论。
我设计这本书是为了教像你这样的机器学习从业者,通过具体的、可执行的 Python 示例,一步步学习概率论的基础知识。
我着手为机器学习从业者编写一本实战手册,只为你提供在完成预测建模项目时所需要了解的那些概率论知识。
我着手以从业者学习的方式来介绍概率论技术——即通过简单的语言和可运行的代码示例。
概率论对机器学习很重要,我相信,如果以适合从业者的水平来教授,它可以成为一个引人入胜、充满乐趣、直接适用且极其实用的研究领域。
我希望您也同意。
心动了吗?
点击直接跳转至套餐选择.
但是,如果……?
您还有些疑虑吗?让我看看是否能帮到您。
如果我是机器学习新手怎么办?
这本书不假设您有机器学习背景。
话虽如此,我确实建议你先学习如何完成一个预测建模问题。它会为你提供学习概率论的背景。否则,这个主题可能会感觉过于抽象。
如果我只是一名开发者怎么办?
太好了。这本书就是为您而写的。
如果我的数学真的很差怎么办?
也许你很久以前在学校学过概率论?
也许你以前从未接触过概率论。
没问题。这本书就是为你准备的。我假设你懂一些基本的算术,即便如此,我还是会为你复习一下。
如果我不是 Python 程序员怎么办?
如果您是其他语言的程序员,即使您不熟悉 Python,也能看懂这本书。
所有内容都通过一个小的代码示例来演示,您可以直接运行。
所有代码都提供给您,供您体验、修改和学习。
这本书甚至有一个附录,教您如何在您的工作站上设置 Python。
如果我正在大学修一门概率论课程怎么办?
太棒了!
这本书不能替代本科的概率论课程或这类课程的教科书,尽管它是对这类材料的一个很好的补充。
关于您的学习成果
…那么,读完这本书后,您将掌握什么?
在阅读并实践完这本书后,您将了解:
- 关于概率论领域,它与机器学习的关系,以及如何在机器学习项目上运用概率思维。
- 如何计算不同类型的概率,如联合概率、边缘概率和条件概率。
- 如何用随机变量的角度来考虑数据,以及如何识别和采样常见的离散和连续概率分布函数。
- 如何将学习过程构建为最大似然估计,以及这个重要的概率框架如何用于回归、分类和聚类机器学习算法。
- 如何使用概率方法直接评估机器学习模型,而无需在测试数据集上评估其性能。
- 如何从贝叶斯视角考虑概率,并使用贝叶斯定理计算常见情景下的条件概率。
- 如何使用贝叶斯定理进行朴素贝叶斯分类、贝叶斯优化以及贝叶斯网络等图模型。
- 如何利用信息论中的信息和熵的度量来量化不确定性,并计算交叉熵和互信息等量。
- 如何使用概率框架来开发和评估朴素分类器。
- 如何评估预测概率的分类模型并校准预测结果。
对概率论的这种新的基本理解将从以下方面影响你的机器学习实践。
读完这本书,你将能够:
- 在机器学习数据集的一般和特定情境下,自信地计算和运用频率派概率(基于计数)和贝叶斯概率(基于信念)。
- 在训练机器学习算法时,您可以自信地选择和使用损失函数和性能指标,这得益于对底层概率框架(例如最大似然估计)的了解以及指标之间的关系(例如交叉熵和负对数似然)。
- 自信地评估分类预测模型,包括建立稳健的性能基线、使用概率性能度量以及校准预测概率。
这本书里究竟有什么?
…请看目录
这本书被设计为面向机器学习从业者(理想情况下,是有开发者背景的从业者)的概率论速成课程。
这本书围绕与机器学习算法直接相关的主要思想和方法进行设计。
关于概率论,你可以学到很多东西,从理论到抽象概念再到 API。我的目标是通过重点突出的教程,带你直奔主题,为你必须理解的元素建立直觉。
我设计的教程侧重于如何利用概率论来完成任务。它们为你提供了快速理解并应用每种技术或操作的工具。
每个教程的设计都旨在让你在不到一小时内读完并完成,不包括扩展和延伸阅读部分。
您可以选择每天完成一课,每周完成一课,或者按照自己的节奏进行。我认为势头至关重要,这本书旨在被阅读和使用,而不是束之高阁。
我建议您制定一个计划并坚持下去。
全书 7 部分概览
- 第 1 部分:基础。轻松入门概率论领域,了解其与机器学习的关系,以及在处理预测建模问题时概率论的重要性。
- 第 2 部分:基本概念。了解不同类型的概率,如边缘概率、联合概率和条件概率,并通过实例来培养计算每种概率的直觉。
- 第 3 部分:分布。了解描述事件可能性的概率分布,以及离散和连续随机变量的常见分布函数。
- 第 4 部分:最大似然估计。了解最大似然估计这一概率框架,许多机器学习算法的参数都是基于它在训练数据上进行拟合的。
- 第 5 部分:贝叶斯概率。了解贝叶斯定理及其在应用机器学习中的一些最重要用途,如朴素贝叶斯算法和贝叶斯优化。
- 第 6 部分:信息论。了解概率论与信息论之间的关系,以及在应用机器学习中一些最重要的概念,如交叉熵和信息增益。
- 第 7 部分:分类。了解分类与概率论之间的关系,包括预测类别标签概率的模型、评估指标和概率校准。
课程概览
以下是你将学习的 28 个循序渐进的教程课程概览。
每个课程都设计成让普通开发者在大约 30 到 60 分钟内完成。
第一部分:背景知识
- 第 01 课:什么是概率论
- 第 02 课:机器学习中的不确定性
- 第 03 课:为什么机器学习要学习概率论
第二部分:基础
- 第 04 课:联合概率、边缘概率和条件概率
- 第 05 课:概率计算实例
- 第 06 课:概率高级实例
第三部分:分布
- 第 07 课:概率分布
- 第 08 课:离散概率分布
- 第 09 课:连续概率分布
- 第 10 课:密度估计
第四部分:最大似然估计
- 第 11 课:最大似然估计
- 第 12 课:使用最大似然估计的回归
- 第 13 课:使用最大似然估计的分类
- 第 14 课:期望最大化算法
- 第 15 课:概率模型评估
第五部分:贝叶斯概率
- 第 16 课:贝叶斯定理
- 第 17 课:贝叶斯定理与机器学习
- 第 18 课:朴素贝叶斯分类器
- 第 19 课:贝叶斯优化
- 第 20 课:贝叶斯信念网络
第六部分:信息论
- 第 21 课:熵
- 第 22 课:KL 散度
- 第 23 课:交叉熵
- 第 24 课:信息增益
第七部分:分类
- 第 25 课:朴素分类器
- 第 26 课:概率分数
- 第 27 课:ROC 曲线和精确率-召回率曲线
- 第 28 课:校准预测概率
附录
- 附录 A:获取帮助
- 附录 B:如何为 Python 设置工作环境
- 附录 C:基本数学符号
您可以看到,每个部分都针对一个特定的学习成果,每个部分内的每个教程也是如此。这充当了一个过滤器,确保您只专注于需要了解的内容以获得特定结果,而不会陷入数学或近乎无限的旁枝末节。
这些教程的设计目的不是教您有关概率的每种理论或技术的所有知识。它们的设计目的是让您了解它们的工作原理、如何使用它们以及如何以我所知最快的方式解释结果:通过实践学习。
电子书目录
下面的截图来自 PDF 电子书。它为您提供了本书的完整目录概览。

《机器学习概率论》目录
您将获得所有这些…
在《机器学习概率论》中
一份包含您所需一切的数字下载包,包括:
- 清晰的描述,帮助你理解应用机器学习所需的概率论知识。
- 手把手的 Python 教程,向您准确展示如何应用每种技术和算法。
- 端到端、自包含的示例,在每个教程中为您提供所需的一切,无需先验知识。
- 书中每个示例的 Python 源代码配方,让您可以在几秒钟内运行教程代码。
- PDF 格式的数字电子书,让您可以将书和代码并排打开,准确地看到每个示例是如何工作的。
在你需要时,提供你所需的深入学习资源,包括:
- 关于 Python 生态系统的最佳信息来源,包括 SciPy、NumPy、Matplotlib 和 scikit-learn 库。
- 您可以在网上提出有挑战性问题并能得到回复的最佳平台。
- 学习书中涵盖的每种概率方法的最佳书籍和文章。
提供你需要的背景知识,让你了解概率论领域,包括:
- 概率论作为一个数学领域,如何关注于量化和利用不确定性。
- 概率论的两个学派:频率派概率和贝叶斯概率。
- 机器学习中不确定性的三个主要来源:噪声数据、覆盖不完整和不完美的模型。
- 概率论如何在应用机器学习中提供管理不确定性的工具。
- 概率论如何在预测建模项目的每个步骤中被使用,从理解数据、训练模型到预测概率。
理解和计算概率所需的基础知识,包括:
- 概率是分配给随机变量的事件的。
- 如何计算事件之间的联合概率。
- 如何计算事件的边缘概率。
- 在其他事件发生的情况下,如何计算事件的条件概率。
- 相关概率和独立概率之间的区别。
- 如何计算互斥事件的概率。
- 如何通过实例将概率计算付诸实践。
用于关联事件发生与概率的连续和离散概率分布,包括:
- 如何区分离散、布尔和连续随机变量。
- 如何描述概率分布函数、概率质量函数和累积分布函数之间的区别。
- 如何从伯努利、二项、多努利和多项分布等离散概率分布中抽样。
- 如何从正态(高斯)、指数和帕累托分布等连续概率分布中抽样。
- 如何使用直方图和核密度估计(KDE)模型来概括概率密度。
如何使用最大似然估计概率框架来拟合机器学习模型,包括:
- 最大似然估计如何作为一个框架,用于优化分布函数和参数以最好地描述观测数据。
- 最大似然估计如何成为许多流行机器学习算法(包括人工神经网络)的基础。
- 如何在最大似然估计下优化线性回归模型。
- 如何在最大似然估计下优化用于分类的逻辑回归模型。
- 如何在最大似然估计下优化带有潜变量的密度估计模型。
- 如何使用 AIC、BIC 和 MLD 等概率度量在没有测试数据集的情况下评估模型。
如何理解和利用贝叶斯定理的强大功能来完成一系列任务,包括:
- 如何使用贝叶斯定理为机器学习计算条件概率。
- 如何将一个完整的贝叶斯分类模型大幅简化(称为朴素贝叶斯),并且仍然非常有效。
- 如何使用贝叶斯定理来解决具有挑战性的优化问题,例如调整机器学习算法的超参数。
- 如何将贝叶斯定理作为基础,开发用于推理的概率图模型,称为贝叶斯信念网络。
- 如何使用最大后验概率(MAP)贝叶斯概率框架作为最大似然估计的替代方法来拟合模型。
信息论如何建立在概率论之上,以及该领域的技术如何在机器学习中使用,包括:
- 信息如何量化一个事件的意外程度,而熵如何量化一个随机变量的信息量。
- 信息增益如何计算一个变量意外程度的减少量,并可用于决策树的构建和特征选择(此时称为互信息)。
- 交叉熵如何计算用一种分布与另一种分布相比,对一个随机变量进行编码所需的平均总比特数,以及它与最大似然估计中的负对数似然是如何相同的。
- KL 散度如何计算用一种分布与另一种分布相比,对一个随机变量进行编码所需的平均额外比特数,并且通常被称为相对熵。
在进行分类预测建模项目时,概率论如何提供了一个必需的属性,包括:
- 如何开发一系列不同的朴素分类模型,并使用概率框架评估它们的预期性能。
- 如何使用对数损失和布里尔分数等指标,评估预测概率的分类模型的性能。
- 如何使用 ROC 曲线为预测概率的分类模型评估和选择阈值。
- 如何使用可靠性图审查预测概率,并为分类模型校准预测概率。
您还需要什么?
先睹为快,看看电子书内部
点击图片放大。
附赠:概率论 Python 代码秘籍
……你还将获得 74 个可完全运行的 Python 脚本
示例代码配方
书中展示的每个配方都是独立的,这意味着您可以将其复制粘贴到您的项目中并立即使用。
- 书中提供的每个示例,您都会得到一个 Python 脚本(.py)文件。
这意味着您可以跟着操作,并将您的答案与所提供的 Python 文件中已知可行的实现进行比较。
这在您处理特定任务的细节时,能大大加快您的进度,例如:
- 采样和绘制概率分布图。
- 从零开始开发一个朴素贝叶斯分类器。
- 从零开始开发一个贝叶斯优化。
- 从零开始计算交叉熵。
- 从零开始计算信息增益。
- 从零开始用 AIC 和 BIC 指标评估模型。
- 开发和评估朴素分类器模型。
- 计算布里尔分数和 ROC 曲线等指标。
- 校准预测概率。
所提供的代码是在文本编辑器中开发的,并旨在在命令行上运行。不需要特殊的 IDE 或笔记本。
所有代码示例都已在 Python 3.6+ 版本上设计和测试。
所有代码示例都可以在普通的现代计算机硬件上运行,并在 CPU 上执行。
Python 技术细节
本节提供有关本书附带代码的一些技术细节。
- Python 版本:你可以使用 Python 3.6 或更高版本。
- SciPy:您将使用 NumPy、SciPy 和 scikit-learn 的 API。
- 操作系统:你可以使用 Windows、Linux 或 Mac OS X。
- 硬件:标准的现代工作站即可。
- 编辑器:您可以使用文本编辑器并在命令行中运行示例。
没有 Python 环境?
没问题!
附录中包含一个手把手的教程,向您展示如何准确地设置 Python 机器学习环境。

《机器学习概率论》附赠代码
关于作者
你好,我是 Jason Brownlee。我运营这个网站,并且撰写和出版了这本书。
我和我的妻子及儿子们住在澳大利亚。我喜欢读书、写教程和开发系统。
我拥有计算机科学和软件工程背景,以及人工智能专业的硕士和博士学位,主攻随机优化。
我写过关于算法的书籍,在比赛中获胜并排名靠前,为初创公司提供咨询,并在业界工作多年。(是的,我花了很多时间构建和维护真正的运营系统!)
帮助开发者入门并精通应用机器学习,这让我感到非常满足。
我采用一种非传统的自上而下、结果优先的机器学习教学方法,我们从实践教程和问题开始,然后在需要时再深入理论。
如果您有任何问题,我随时乐意帮助。我希望您能在机器学习领域变得出色。
下载您的样章
想更详细地了解这本书吗?下载免费的样章 PDF。
输入您的电子邮件地址,样章将发送到您的收件箱。
看看客户们怎么说
在选择 Machine Learning Mastery 的路上,您并不孤单
受到超过 53,938 名从业者的信赖
...包括来自以下公司的员工
...以及来自以下大学的学生和教职员工
以及成千上万的其他人...
绝对没有风险,因为有...
100% 退款保证
此外,正如您对市场上任何优秀产品的期望一样,每一本 Machine Learning Mastery 的电子书
都附带了信心的最大保证:我的黄金标准 100% 退款保证。
100% 退款保证
如果您对购买的任何一本 Machine Learning Mastery 电子书不满意,
只需在购买后 90 天内给我发邮件,我将立即退款给您。
无需等待。不问任何问题。没有风险。
…是时候迈出下一步了。
立即将概率论应用于你的机器学习项目!
选择您的套餐
所有价格均为美元(USD)。
(1)点击按钮。 (2)输入您的信息。 (3)立即下载。
采用 SSL 加密的安全支付处理
您有任何问题吗?
机器学习技能值多少钱?
你的老板问你:
“嘿,你能为这个建立一个预测模型吗?”
想象一下,你拥有技能和信心去说:
“好的!”
...并付诸行动。
我经历过。 那感觉太棒了!
这对你来说价值多少?
行业对机器学习技能的需求日益增长。
市场需要的是能交付成果的人,而不是写学术论文的人。
企业知道这些技能的价值,并支付天价的起薪。
数据科学家的起薪为
10 万美元到 15 万美元。
机器学习工程师的薪水甚至更高。
你还有哪些选择?
你已经走到了这一步。
你准备好采取行动了。
但是,你还有哪些选择?有哪些选项?
(1) 一本 100 美元以上的理论教科书
...它枯燥乏味,充满了数学,你很可能永远也读不完。
(2) 一个 10,000 美元以上的现场训练营
...那里都是年轻人,你必须出差,而且可能需要几个月的时间。
(3) 一个 100,000 美元以上的高等学位
...它很昂贵,需要数年时间,而且你会成为一名学者。
或者...
为了你获得的实践技能...
为了你看到的成果速度...
为了你支付的低廉价格...
Machine Learning Mastery 电子书是
超值的选择!
而且它们确实有效。这就是我提供退款保证的原因。
你是一名专业人士
这个领域发展迅速,
...你还能等多久?
你以为你有的是时间,但是...
- 新方法不断涌现,算法也在变化。
- 新书不断出版,价格也在上涨。
- 新的毕业生不断涌现,职位也被填补。
现在就是开始的最佳时机。
自下而上的学习方式缓慢而令人沮丧,
...难道你不想找到一条更快的路吗?
你真的能再这样日复一日、周复一周、月复一月地...
- 从不完整的帖子中拼凑想法和代码。
- 从简短的视频中浏览理论和见解。
- 从学术教科书中解析希腊字母。
针对性训练是你通往成果的最短路径。
专业人士始终保持在领域前沿
获取你需要的培训!
你不想落后或错过机会。
常见问题
客户问题 (78)
感谢您的兴趣。
抱歉,我不支持我的书籍的第三方经销商(例如在其他书店转售)。
我的书是自出版的,我将我的网站视为一个小型精品店,专门为那些对应用机器学习深感兴趣的开发者服务。
因此,我更喜欢自己控制书籍的销售和营销。
很抱歉,我不支持在捆绑包内更换书籍。
所提供捆绑包中的书籍组合是固定的。
我的电子商务系统不够先进,不支持临时捆绑。我相信您能理解。您可以在这里查看完整的书籍和捆绑包目录
如果您已经购买了一个捆绑包,并希望更换其中的一本书,那么非常抱歉,我不支持换书或部分退款。
如果您不满意,请直接联系我,我可以为您安排退款。
感谢您的兴趣。
很抱歉,我无法为您创建定制的书籍捆绑包。这会给我带来维护上的噩梦。我相信您能理解。
我的电子商务系统不是很先进。它不支持临时捆绑书籍或点菜式订购书籍。
我确实有一些现有的书籍捆绑包,我认为它们搭配得很好。
您可以在这里查看我所有可用的书籍和捆绑包目录
抱歉,我不销售我的书的实体版。
所有的书籍和捆绑包都是 PDF 文件格式的电子书。
这是我经过深思熟虑后有意为之的决定
- 这些书充满了必须在电脑上完成的教程。
- 这些书假定您正在实践教程,而不是被动阅读。
- 这些书旨在在电脑屏幕上阅读,旁边放着代码编辑器。
- 这些书是实践手册,而不是用作参考书放在书架上。
- 这些书会频繁更新,以跟上领域和 API 的变化。
我希望这解释了我的理由。
如果您真的想要实体版,您可以购买书籍或捆绑包,并为个人使用打印一份。PDF 文件上没有数字版权管理(DRM)来阻止您打印它们。
抱歉,我不提供 Kindle (mobi) 或 ePub 版本的书籍。
这些书仅以 PDF 文件格式提供。
这是我经过深思熟虑的设计。我的理由如下:
- 我使用 LaTeX 来排版文本和代码,以提供专业的外观,我担心电子书阅读器会搞砸这一点。
- 增加支持的格式会带来维护上的麻烦,这将占用大量时间,影响我更新书籍和创作新书。
- 最关键的是,在电子阅读器或 iPad 上阅读与选择 PDF 格式所支持的书籍与代码编辑器并排打开的方法背道而驰。
我的材料是实践手册,旨在在电脑上打开,旁边放着文本编辑器和命令行。
它们不是离开电脑阅读的教科书。
您可以查看任何一本书的目录。
我在每本书的页面上都提供了两份目录。
具体来说:
- 一份书面摘要,列出了书中的教程/课程及其顺序。
- 一份从 PDF 中截取的目录截图。
如果您找不到目录,请在页面上搜索标题为“目录”的部分。
我很高兴您在开发自己的课程材料时使用我的部分材料,例如课堂讲座的幻灯片或家庭作业练习。
如果您免费分享我的材料或逐字使用,我会不高兴。这将构成版权侵犯。
我网站上和我书中的所有代码都是为教育目的而开发和提供的。我对代码、它可能做什么或您可能如何使用它不承担任何责任。
如果您使用我的材料进行教学,请引用来源,包括:
- 作者姓名,例如“Jason Brownlee”。
- 教程或书籍的标题。
- 网站名称,例如“Machine Learning Mastery”。
- 教程或书籍的 URL。
- 您访问或复制该代码的日期。
例如
- Jason Brownlee, Python 机器学习算法, Machine Learning Mastery, 网址:https://machinelearning.org.cn/machine-learning-with-python/, 访问于 2018 年 4 月 15 日。
另外,如果您的作品是公开的,请联系我,我很乐意出于一般兴趣看看它。
通常不提供。
我的书中没有练习或作业。
我确实在一些书中有端到端的项目,但它们是以教程形式呈现的,我会引导您完成每一步。
书的章节是作为独立的教程编写的,有特定的学习成果。在教程结束时,您将学会如何做某件事。
有些书有一个名为“扩展”的部分,提供了一些以更高级的方式修改教程中代码的想法。它们就像自学练习。
不行。
我有一些书不需要任何编程技能,例如:
其他书籍确实有特定编程语言的代码示例。
您必须了解该编程语言的基础知识,例如如何安装环境以及如何编写简单的程序。我不教编程,我教的是面向开发者的机器学习。
您不需要是一个好的程序员。
话虽如此,我确实为那些可能不熟悉特定语言的开发者提供了关于如何高效设置环境的教程,甚至还有编程语言的速成课程。
抱歉,我没有视频。
我只有文本格式的教程课程和项目。
这是有意为之。我曾经有过视频内容,但我发现完成率要低得多。
我希望您能将材料付诸实践。我发现基于文本的教程是实现这一目标的最佳方式。通过基于文本的教程,您必须阅读、实现并运行代码。
而通过视频,您只是被动观看,不需要采取任何行动。视频是娱乐或信息娱乐,而不是富有成效的学习和工作。
在阅读并实践教程之后,您更有可能运用所学知识。
是的,我提供 90 天无理由退款保证。
我为我的书负责。它们包含了我对特定机器学习主题的最佳知识,并且每本书都经过数万名读者的阅读、测试和使用。
尽管如此,如果您发现我的某本电子书不适合您,我会全额退款。
是的。
我建议使用在 TensorFlow 2.2(或更高版本)上运行的独立 Keras 2.4(或更高版本)。
博客上的所有教程都已更新,使用在 Tensorflow 2 上运行的独立 Keras。
所有书籍都已更新,使用相同的组合。
我还不推荐使用作为 TensorFlow 2 一部分的 Keras(例如 tf.keras)。它太新了,新事物总有问题,我正在等待尘埃落定。独立 Keras 已经运行多年,并且继续表现出色。
有一种情况是教程不支持 TensorFlow 2,因为这些教程使用了尚未更新以支持 TensorFlow 2 的第三方库。具体来说,涉及使用 Mask-RCNN 进行对象识别的教程。一旦第三方库更新,这些教程也将得到更新。
这本书“Python 中的长短期记忆网络”并不侧重于时间序列预测,而是侧重于用于一系列序列预测问题的 LSTM 方法。
这本书“深度学习在时间序列预测中的应用”向您展示了如何为单变量、多变量和多步时间序列预测问题开发 MLP、CNN 和 LSTM 模型。
迷你课程是关于一系列机器学习主题的免费课程,通过电子邮件、PDF 和博客文章提供。
迷你课程的特点是:
- 简短,通常为 7 天或 14 天。
- 简洁,通常每节课给出一个技巧或代码片段。
- 有限,通常范围较窄,仅限于几个相关领域。
电子书则在许多相同主题上提供完整的培训课程。
电子书的特点是:
- 更长,通常包含 25+ 个完整的教程课程,每个课程最多需要一小时完成。
- 完整,为每个课程提供温和的介绍,并包括完整的可用代码和进一步阅读材料。
- 广泛,涵盖了该主题所需的所有内容,以便快速上手并将技术应用到您自己的项目中。
迷你课程旨在让您快速获得结果。如果您想了解更多信息或更完整的代码示例,可以购买相关的电子书。
这本书“精通机器学习算法”适合程序员和非程序员。它通过算术和电子表格中的示例(而非代码)向您传授 10 种顶级机器学习算法的工作原理。重点在于理解每种模型如何学习和进行预测。
这本书“从零开始机器学习算法”适合喜欢通过编写代码来学习的程序员。它提供了分步教程,介绍如何实现顶级算法,以及如何加载数据、评估模型等。它较少涉及算法的工作原理,而是完全专注于如何在代码中实现它们。
这两本书可以相互补充。
这些书是我博客内容的浓缩和更便捷的版本。
我将我的书设计成课程和项目的结合体,教您如何使用特定的机器学习工具或库,然后将其应用于真实的预测建模问题。
这些书会进行更新,包括错误修复、API 变更的更新以及新章节的增加,这些更新是完全免费的。
我确实会将一些书的章节作为示例发布在博客上,但它们与周围的章节或书提供的叙事没有联系,也不提供独立的代码文件。
每本书都附带了书中使用的所有源代码文件,您可以将它们用作配方来快速启动您自己的预测建模问题。
我的书是实践手册,不是教科书。
它们没有深入的理论解释,只有可行的例子,这些例子高度专注于您需要知道的信息,以便将机器学习应用到您的项目中。
几乎没有数学,没有理论或推导。
我的读者非常欣赏我材料中使用的自上而下而非自下而上的方法。这是我收到反馈最多的一个方面。
我的书并不适合所有人,它们是为需要快速获得结果的从业者精心设计的。
电子书可以直接从我的网站上购买。
- 首先,找到您希望购买的书籍或捆绑包,您可以在这里查看完整的目录
- 点击您想购买的书籍或捆绑包,进入该书的详情页面。
- 点击书籍或捆绑包的“立即购买”按钮,进入购物车页面。
- 在购物车中填写您的详细信息和支付信息,然后点击“下单”按钮。
- 完成购买后,您将收到一封包含下载您的书籍或捆绑包链接的电子邮件。
所有价格均为美元(USD)。
书籍可以通过 PayPal 或信用卡购买。
Machine Learning Mastery 上的所有价格均为美元。
可以使用支持国际支付的 PayPal 或信用卡进行支付(例如,大多数信用卡都支持)。
您不必明确地将您的货币兑换成美元。
当您使用 PayPal 或信用卡付款时,货币转换会自动进行。
要在购物时使用折扣码,也称为优惠码或折扣券,请按照以下步骤操作:
1. 在结账页面的“折扣券”字段中输入折扣码文本。
注意,如果您在结账页面上没有看到名为“折扣券”的字段,则表示该产品不支持折扣。
2. 点击“应用”按钮。
3. 然后您会看到一条消息,表明折扣已成功应用于您的订单。
注意,如果您使用的折扣码已失效,您会看到一条消息,表明折扣未能成功应用于您的订单。
你应该按什么顺序读这些书?
这是一个很好的问题,我最好的建议如下:
- 考虑从一本您最感兴趣的主题的书开始。
- 考虑从一本您可以立即应用到项目上的主题的书开始。
另外,请考虑您不需要阅读所有的书,也许一部分书就能让您获得您需要或想要的技能。
尽管如此,一个建议的阅读顺序如下:
-
- 机器学习概率
- 机器学习的统计方法
- 机器学习线性代数
- 机器学习优化
- 机器学习微积分
- 数据科学入门指南
- 精通机器学习算法
- 从零开始实现机器学习算法
- 用于机器学习的 Python
- 使用 Weka 精通机器学习
- 精通 Python 机器学习
- 精通 R 语言机器学习
- 新一代数据科学
- 机器学习数据准备
- 使用 Python 处理不平衡分类问题
- 使用 Python 进行时间序列预测
- 使用 Python 实现集成学习算法
- 使用 Python 实现 XGBoost
- 使用 Python 进行深度学习
- 使用 PyTorch进行深度学习
- 使用 Python 构建长短期记忆网络
- 用于自然语言处理的深度学习
- 使用 Hugging Face Transformers 进行自然语言处理
- 用于计算机视觉的深度学习
- OpenCV 中的机器学习
- 用于时间序列预测的深度学习
- 更好的深度学习
- 使用 Python 构建生成对抗网络
- 使用注意力机制构建 Transformer 模型
- 使用 ChatGPT 提高生产力(这本书可以按任何顺序阅读)
- 使用 Stable Diffusion 精通数字艺术(这本书可以按任何顺序阅读)
希望这能有所帮助。
我最好的建议是,从一本您可以立即应用的主题的书开始。
除此之外,选择一个您最感兴趣的主题。
如果您不确定,或许可以尝试学习一些免费教程,看看您倾向于哪个领域。
通常,我建议专注于端到端地解决预测建模问题的整个过程。
我有三本书,通过三个顶级的开源平台,向您展示如何做到这一点。
- 精通Weka机器学习 (无需编程)
- 精通R语言机器学习 (使用caret)
- 精通Python机器学习 (使用pandas和scikit-learn)
这些都是很好的入门选择。
您随时可以回过头来,选择一本关于算法的书,以便更深入地了解特定方法的工作原理。
《Python深度学习》这本书可以看作是《Python长短期记忆网络》的预备知识。它教您如何开始使用Keras,以及如何开发您的第一个MLP、CNN和LSTM。
《Python长短期记忆网络》这本书深入探讨了LSTM,教您如何准备数据、如何开发一系列不同的LSTM架构、参数调整、更新模型等等。
这两本书都专注于使用Keras库在Python中进行深度学习。
《Python长短期记忆网络》这本书主要关注如何为序列预测开发一系列不同的LSTM网络。
这本书“深度学习在时间序列预测中的应用”侧重于如何使用一系列不同的深度学习模型(MLP、CNN、LSTM 和混合模型)来解决一系列不同的时间序列预测问题(单变量、多变量、多步和组合)。
LSTM这本书只教LSTM,不侧重于时间序列。而时间序列深度学习这本书则侧重于时间序列,并教授如何使用包括LSTM在内的多种不同模型。
《Python长短期记忆网络》这本书专注于如何实现不同类型的LSTM模型。
《自然语言处理深度学习》这本书专注于如何使用包括LSTM在内的多种不同网络来解决文本预测问题。
LSTM这本书可以为NLP这本书提供支持,但它不是必需的预备知识。
您可能需要“Machine Learning Mastery”公司的企业或公司税号用于您自己的税务目的。例如,这在欧盟公司中很常见。
Machine Learning Mastery 公司在波多黎各运营。
因此,公司没有欧盟的增值税(VAT)识别号或适用于您所在国家或地区的类似税号。
公司确实有一个公司编号。详细信息如下:
- 公司名称:Zeus LLC
- 公司编号: 421867-1511
在《精通机器学习算法》中没有代码示例,因此没有使用任何编程语言。
书中通过基本算术描述算法并总结其工作原理。算法的行为也在Excel电子表格中进行了演示,这些表格随书提供。
这是一本学习算法工作原理的绝佳书籍,不会被理论或编程语法所分心。
如果您有兴趣通过从头开始编码(使用Python编程语言)来学习机器学习算法,我推荐另一本书:
所有的书都经过测试,可以与Python 3(例如3.5或3.6)一起使用。
大多数书籍也经过测试,可以与Python 2.7一起使用。
在可能的情况下,我建议使用最新版本的Python 3。
我确实会先在博客上测试我的教程和项目。这就像是创意的早期体验,其中许多并没有进入我的培训材料。
书中的大部分材料最初都以某种形式出现在我的博客上,后来经过提炼、改进并以章节格式重新包装。我发现这对于提高质量和修复错误有很大帮助。
书籍提供了更方便的材料包装,包括源代码、数据集和PDF格式。它们还包括对新API的更新、新章节、错误和拼写修正,以及直接与我联系以获得我能提供的所有支持和帮助。
我相信我的书以几十美元的价格提供了价值数千美元的教育。
它们是我数月甚至数年经验的结晶,浓缩在几百页精心制作且经过充分测试的教程中。
我认为对于希望快速掌握应用机器学习技能或在项目中使用机器学习的专业开发人员来说,它们是物超所值的。
此外,机器学习技能对您、对您的下一个项目、以及对您当前或未来的雇主价值几何?
尽管如此,如果您是学生,或者您不习惯北美、澳大利亚、英国及世界类似地区开发人员的高薪,我的书的价格可能看起来很贵。对此,我感到抱歉。
折扣
我确实为学生、教师和退休人员提供折扣。
请联系我了解更多信息。
免费资料
我在我的博客上提供了大量免费内容,您可以在这里开始学习我最好的免费资料:
关于我的书籍
我的书是实战手册。
它们是为那些想知道如何使用特定库来实际解决问题并在工作中交付价值的开发人员准备的。
- 我的书只引导您了解那些为了取得成果而必须知道的要素。
- 我的书是PDF格式,并附带代码和数据集,专为方便您在电脑上阅读和实践而设计。
- 我的书让您可以通过电子邮件直接联系到我(还有哪些书能提供这个?)。
- 对于专业开发人员来说,我的书是一笔微小的业务开销,可以记入公司账目,并且在大多数地区可以抵税。
很少有机器学习培训材料专注于如何取得成果。
绝大多数资料都在重复同样的数学和理论,却忽略了您真正关心的一件事:如何在项目中使用这些方法。
与其他选项的比较
让我为您提供一些关于书籍定价的背景信息:
YouTube上有免费视频,博客上有免费教程。
- 很好,我鼓励您使用它们,包括我自己的免费教程。
有一些非常便宜的视频课程,教您一两个API的技巧。
- 我的书教您如何使用一个库来端到端地完成一个项目并交付价值,而不仅仅是几个技巧。
一本机器学习教科书可能要花费50到100美元。
- 我所有的书都比一般的机器学习教科书便宜,而且我期望您能更快地提高生产力。
一个训练营或其他线下培训可能花费1000多美元,并持续数天到数周。
- 我所有书籍的捆绑包比这便宜得多,它们允许您按自己的节奏学习,并且捆绑包涵盖的内容比一般训练营更多。
抱歉,我的书不在像Amazon.com这样的网站上销售。
出于多种原因,我慎重决定不把我的书放在亚马逊上:
- 亚马逊会从自出版书籍的销售价格中抽取65%,这会让我无法经营下去。
- 亚马逊对销售页面和购物车体验的控制权很小。
- 亚马逊不允许我通过电子邮件联系我的客户,并提供直接支持和更新。
- 亚马逊不允许我以PDF格式向客户交付我的书,而PDF是我的客户在屏幕上阅读的首选格式。
我希望这能帮助您理解我的理由。
我免费赠送了很多内容。事实上,是大部分内容。
帮助经济不宽裕的学生和从业者对我来说很重要,因此我提供了大量的免费内容。
您可以通过以下方式获取免费内容:
我对此进行了深思熟虑,我销售机器学习电子书有几个重要原因:
- 我用收入来支持网站和所有非付费用户。
- 我用收入来养家糊口,以便我能继续创作内容。
- 为教程付费的从业者更有可能认真学习并学到东西。
- 我的书目标读者是更有可能负担得起这些材料的职业人士。
是的。
您购买的书籍或捆绑包中的所有书籍更新都是免费的。
书籍通常每隔几个月更新一次,以修复错误、拼写问题并跟上API的变化。
随时联系我,查询是否有更新。请告诉我您拥有的书籍版本(版本号列在版权页上)。
是的,这些书可以帮助您找到工作,但只是间接的。
找到工作取决于您自己。
这是一个寻找职位空缺的组织与拥有技能和背景的您之间的匹配问题。
话虽如此,有些公司更看重您能为业务带来的价值,而不是您的学位。通常,这些是较小的公司和初创企业。
您可以通过学习并精通端到端解决预测建模问题来专注于提供机器学习价值。您可以通过建立一个已完成项目的机器学习作品集来展示这项技能。
我的书正是为了帮助您实现这些目标而设计的。它们准确地教您如何使用开源工具和库在预测建模项目中取得成果。
您还有其他问题吗?
请联系我.