使用 Python 实现集成学习算法
通过 Bagging、Boosting 和 Stacking 做出更好的预测
预测性能是许多分类和回归问题上最重要的考量。集成学习算法结合了多个模型的预测,旨在比任何一个成员模型表现得更好。
抛开复杂的方程式、希腊字母和令人困惑的概念,您将发现为了充分利用下一个项目中的数据,您需要了解的专业集成学习算法。
通过清晰的解释、标准的 Python 库和分步教程课程,您将学习如何自信而有效地使用集成算法来提高预测建模性能。
关于本电子书
- 支持所有设备阅读:英文 PDF 格式电子书,无数字版权管理 (DRM)。
- 海量教程:30 节分步课程,450 页。
- 基础知识:集成学习直觉、多样性等。
- 多种算法:xgboost、Extra Trees、Blending 等。
- 可运行代码:包含 186 个 Python (.py) 代码文件。
清晰、完整的端到端示例。
心动了吗?
…那么什么是集成学习?
集成学习算法结合了两个或多个模型的预测。
集成学习的理念与“群体智慧”的理念紧密相关。后者是指将许多不同的独立决策、选择或估计结合成一个最终结果,这个结果往往比任何单一贡献都更准确。
这是现代社会主要方面(例如科学同行评审、陪审团和寻求第二意见)的核心思想。它是寻求并采纳专家建议的替代方案。
在应用机器学习中,这意味着结合从多个模型获得的预测,这些模型在您的数据集上进行训练,而不是寻求单个表现最佳的模型。
…那么为什么要使用集成学习模型?
集成学习模型通常比使用单个机器学习模型更复杂。
这可能需要更复杂的模型准备技术、更多的计算资源来训练模型,以及更少的内省来理解为什么会做出特定的预测。
尽管如此,使用集成学习算法有两个主要原因,它们是:
更好的鲁棒性
许多机器学习算法在每次在相同数据甚至略有不同的数据上训练模型时都会给出不同的预测。
这被称为预测中的方差或模型的稳定性。
集成学习算法可以提供比单个模型更稳定的预测。
更好的预测
在某些问题领域和预测建模任务中,更好的预测性能比其他任何因素都更重要。
在竞争性机器学习中尤其如此,其中预测技能是唯一被考虑的结果。
集成学习算法可以提供比使用单个模型更好的预测技能。
集成方法常用于稳定深度学习模型所做的预测,鉴于模型架构(用随机权重初始化)的随机性和随机梯度下降学习算法。
集成学习益处的最佳案例是机器学习竞赛,例如百万美元的Netflix大奖,获胜团队使用了数百个模型的集成;以及Kaggle竞赛,其中顶尖参与者和获胜者几乎普遍使用集成学习方法。
集成学习曾经非常困难!
集成学习曾经更像是一门艺术而不是科学。
在标准技术发展之前,您必须设计自己的集成学习算法。
这很困难,因为它需要仔细管理集成成员的多样性,并仔细选择如何组合预测。
集成多样性是指构成集成的模型所做的预测或预测误差的差异。理想情况下,每个集成成员都将统计独立,这意味着它将以与所有其他集成成员完全不同的方式做出良好预测。这不可能实现,因为我们只有一个训练数据集。
组合方法是指将每个集成成员的输出用于做出最终预测的具体方式。这可能涉及使用简单的统计方法,如算术平均值或投票,尽管也可能涉及根据贡献模型的技能对预测进行加权,甚至使用另一个模型来学习如何最好地组合预测。
幸运的是,一套标准的集成学习算法已经开发出来。
…我们现在有了
标准集成学习算法
1990 年代和 2000 年代初期是集成学习算法发展的繁荣时期。
这是主要类型的集成算法被开发、扩展和改进的时期。
这为我们提供了三种主要的集成学习算法家族可供选择,包括:
装袋法集成
这些集成涉及在训练数据集的不同样本上训练许多高方差模型。
一些算法包括:
- 装袋决策树
- 随机子空间
- 随机森林
- 额外树
- 自定义 Bagging
提升法集成
这些集成涉及顺序添加模型以纠正先前模型的预测。
一些算法包括:
- AdaBoost
- 梯度提升机
- 随机梯度提升
- XGBoost
- LightGBM
堆叠集成
这些集成涉及使用模型来学习如何最好地组合来自模型的预测。
一些算法包括:
- 投票
- 加权平均
- 混合
- 堆叠
- 超级学习器
在某些情况下,算法是通过仔细系统的试错法开发的,在其他情况下,算法受到类比或隐喻的启发,有些则基于深厚的理论机器学习。
大量的方法和每种方法的复杂性使得在实践中使用这些经过验证的集成学习算法非常具有挑战性。
在许多情况下,很容易出现小的实施错误,导致数据泄露和过于乐观的模型性能估计。在其他情况下,算法训练速度太慢,以至于无法实际处理大尺寸的训练数据集。
值得庆幸的是,像Python中的scikit-learn库这样的现代机器学习库提供了易于使用的实现复杂算法和避免数据泄露的工具。XGBoost和LightGBM等第三方库提供了高度优化的实现,旨在提高执行速度,使得一些计算成本更高的方法能够扩展到更大的数据集。
现在是时候将集成学习带入您的预测建模项目了!
隆重推出我的新电子书
“用 Python 实现集成学习算法”
欢迎阅读电子书:《Python集成学习算法》。
我设计这本书是为了逐步教像您这样的机器学习从业者如何使用 Python 示例配置和使用最强大的集成学习技术。
本书经过精心设计,旨在帮助您将各种经过验证的自定义集成学习技术带入您的下一个项目。
这些教程旨在以我所知的最快、最有效的方式教授您这些技术:通过实践学习。通过可运行的代码,您可以运行这些代码来培养所需的直觉,并且可以复制粘贴到您的项目中并立即获得结果。
集成学习对机器学习很重要,我相信如果以适合从业者的水平进行教学,它可以成为一个引人入胜、有趣、直接适用且非常有用的技术工具箱。
我希望您也同意。
心动了吗?
点击直接跳转至套餐选择.
…那么,这本书适合您吗?
这本书适合谁?
让我们确保您来对了地方。
这本书适合那些可能了解一些应用机器学习的开发者。也许您知道如何端到端地解决一个预测建模问题,或者至少了解其中的主要步骤,并且熟悉常用工具。
本指南采用您在 Machine Learning Mastery 所习惯的自上而下、结果优先的机器学习风格编写。
本书的课程对您有一些假设,例如:
您需要了解
- 您熟悉基本的Python编程。
- 您可能了解一些基本的NumPy用于数组操作。
- 您可能了解一些基本的 scikit-learn 建模知识。
您不需要是
- 您不需要是数学天才!
- 您不需要是编程大师!
- 您不需要是机器学习专家!
关于您的学习成果
…那么,读完这本书后,您将掌握什么?
在阅读并实践完这本书后,您将了解:
- 在做出重要决策时,借鉴群体或多位专家的直觉,以及这种直觉如何延续到集成学习算法中。
- 集成学习技术对预测建模的好处,包括提高预测技能和改善模型鲁棒性。
- 如何开发和评估分类和回归问题的多模型算法,为集成学习提供先导。
- 如何开发、配置和评估用于分类和回归预测建模问题的 Bagging 集成。
- 如何开发和评估 Bagging 的扩展,例如随机子空间、随机森林和 Extra Trees 集成。
- 如何开发、配置和评估用于分类和回归预测建模问题的自适应 Boosting (AdaBoost) 和梯度集成。
- 如何开发和评估梯度 Boosting 集成的有效实现,例如极限梯度 Boosting (XGBoost) 和 Light Gradient Boosting Machines (LightGBM)。
- 如何开发、配置和评估用于分类和回归预测建模问题的堆叠集成。
- 如何开发和评估更简单的堆叠集成,例如投票和加权平均集成。
- 如何开发和评估堆叠的扩展,例如模型混合和超级学习器集成。
但是,如果…?
您还有些疑虑吗?让我看看是否能帮到您。
如果我是机器学习新手怎么办?
这本书不假设您有机器学习背景。
话虽如此,我确实建议您先学习如何解决预测建模问题。它将为您提供集成学习挑战的背景。
如果我只是一名开发者怎么办?
太好了。这本书就是为您而写的。
如果我的数学真的很差怎么办?
太好了。这本书就是为您而写的。
除了基本的算术之外,不需要任何数学知识。
如果我不是 Python 程序员怎么办?
如果您是其他语言的程序员,即使您不熟悉 Python,也能看懂这本书。
所有内容都通过一个小的代码示例来演示,您可以直接运行。
所有代码都提供给您,供您体验、修改和学习。
这本书甚至有一个附录,教您如何在您的工作站上设置 Python。
如果我正在学习另一门机器学习课程怎么办?
太棒了!
这本书不能替代大学的机器学习课程或该课程的教科书,但它是这类材料的绝佳补充。
这本书里到底有什么?
…请看目录
本书围绕与现实世界问题直接相关的主要集成学习技术进行设计。
关于集成学习,您可以学习很多东西,从理论到抽象概念再到 API。我的目标是让您直接通过聚焦教程,为必须理解的要素培养直觉。
这些教程旨在教您如何使用集成学习方法获得结果。因此,教程为您提供了快速理解和应用每种技术或操作的工具。它混合了教程课程和项目,旨在介绍这些方法并提供大量的示例和实践机会。
每个教程都设计成让您大约花费一小时来阅读和完成,不包括扩展和进一步阅读部分。
您可以选择每天完成一课,每周完成一课,或者按照自己的节奏进行。我认为势头至关重要,这本书旨在被阅读和使用,而不是束之高阁。
我建议您制定一个计划并坚持下去。
这些教程分为六个部分;它们是:
- 第一部分:基础:探索集成学习技术的强大功能,为什么它们对您的项目获得良好性能很重要,以及如何培养对正在学习内容的直觉。
- 第二部分:背景:发现集成学习所需的背景知识,包括集成成员的多样性、组合预测的技术、集成模型的复杂性以及主要类型的集成方法。
- 第三部分:多模型:发现明确使用多个模型的机器学习技术,这些技术为集成学习方法提供了基础。
- 第四部分:Bagging:发现自举聚合,即 Bagging 系列集成学习技术,包括随机森林、Extra Trees 和相关方法。
- 第五部分:Boosting:发现 Boosting 系列集成学习技术,包括自适应 Boosting、梯度 Boosting 和现代高效实现,如极限梯度 Boosting 和 Light Gradient Boosting Machines。
- 第六部分:堆叠:发现堆叠泛化或堆叠系列集成学习方法,包括投票、混合和相关方法。
课程概览
以下是您将要学习的 30 个手把手教程课程的概览:
每个课程都设计成让普通开发者在大约 30 到 60 分钟内完成。
第 1 部分:基础
- 第 01 课:什么是集成学习
- 第 02 课:为什么要使用集成学习
- 第 03 课:集成学习的直觉
第 2 部分:背景知识
- 第 04 课:集成成员多样性
- 第 05 课:组合预测的技术
- 第 06 课:集成复杂性
- 第 07 课:集成算法类型
第三部分:多模型
- 第 08 课:一对多和一对一模型
- 第 09 课:纠错输出码
- 第 10 课:多重回归模型
- 第 11 课:动态分类器选择
- 第 12 课:动态集成选择
- 第 13 课:专家混合集成
第四部分:Bagging
- 第 14 课:Bagged 决策树集成
- 第 15 课:随机子空间集成
- 第 16 课:特征选择 Bagging 集成
- 第 17 课:随机森林集成
- 第 18 课:Extra Trees 集成
- 第 19 课:数据准备 Bagging 集成
第五部分:Boosting
- 第 20 课:强学习器与弱学习器
- 第 21 课:自适应 Boosting 集成
- 第 22 课:梯度 Boosting 集成
- 第 23 课:极限梯度 Boosting 集成
- 第 24 课:Light Gradient Boosting Machine 集成
第六部分:堆叠
- 第 25 课:投票集成
- 第 26 课:加权平均集成
- 第 27 课:集成成员选择
- 第 28 课:堆叠集成
- 第 29 课:混合集成
- 第 30 课:超级学习器集成
附录
- 附录 A:获取帮助
- 附录 B:如何为 Python 设置工作环境
您可以看到每个部分都针对一个特定的学习成果,每个部分内的每个教程也是如此。这作为一个过滤器,确保您只专注于获得特定结果所需了解的内容,而不会陷入数学或几乎无限的分支细节中。
这些教程并非旨在教您关于每个理论或技术的所有知识。它们旨在以我所知的最快方式让您了解它们的工作原理、如何使用它们以及如何解释结果:通过实践学习。
电子书目录
下面的截图来自 PDF 电子书。它为您提供了本书的完整目录概览。

用 Python 实现集成学习算法目录
您将获得所有这些…
在“用 Python 实现集成学习算法”中
一份包含您所需一切的数字下载包,包括:
- 清晰的描述,帮助您理解用于应用机器学习的集成学习算法。
- 手把手的 Python 教程,向您准确展示如何应用每种技术和算法。
- 端到端、自包含的示例,在每个教程中为您提供所需的一切,无需先验知识。
- 书中每个示例的 Python 源代码配方,让您可以在几秒钟内运行教程代码。
- PDF 格式的数字电子书,让您可以将书和代码并排打开,准确地看到每个示例是如何工作的。
在您需要时,用于深入学习的资源,包括:
- 关于 Python 生态系统的最佳信息来源,包括 SciPy、NumPy 和 scikit-learn 库。
- 您可以在网上提出有挑战性问题并能得到回复的最佳平台。
- 学习更多关于所涵盖技术的最佳书籍和文章。
开发和使用集成学习算法所需的基础知识,包括
- 集成成员之间统计独立性的重要性。
- 集成成员的预测和预测错误之间的相关性考虑。
- 集成成员的多样性以及旨在控制或增加集成多样性的技术。
- 组合方法的需求,以汇集多个模型的输出。
- 用于分类任务的类标签和类成员概率的组合技术。
- 用于回归预测建模的数值组合技术。
- 如何用奥卡姆剃刀调和更复杂的集成学习模型。
- 要关注的三种集成学习算法类型。
堆叠算法,学习如何最好地组合来自多个模型的预测,包括
- 用于分类和回归的堆叠泛化集成学习的本质。
- 如何开发包括硬投票和软投票的投票集成,用于分类任务。
- 如何开发加权平均和加权和集成算法。
- 如何从头开始构建集成或从模型中修剪集成成员。
- 如何开发、配置和评估学习如何组合预测的堆叠集成。
- 如何开发大型机器学习竞赛中常见的更简单的混合集成。
- 如何开发更复杂的超级学习器集成。
集成学习领域的背景知识,为您提供所需的上下文,包括
- 作为集成学习基础的群体智慧原则。
- 如何定义集成学习算法。
- 使用集成学习进行预测建模的两个好处。
- 分类和回归任务中集成学习的直觉。
为集成学习提供基础的多模型技术,包括
- 用于分类和回归的多模型机器学习技术的本质。
- 如何开发一对多 (OvR) 和一对一 (OvO) 多模型算法,用于多类别分类。
- 如何开发输出纠错码多模型算法,用于多类别分类。
- 如何开发用于多输出回归任务的多模型算法。
- 动态分类器选择,它在数据集上拟合许多模型,并为每个预测选择最佳模型。
- 动态集成选择,它为每个预测选择最佳模型子集。
- 专家混合,它使用分而治之的方法进行集成学习。
Bagging 算法,组合在不同训练数据上拟合的模型,包括
- 用于分类和回归的自举聚合集成学习的本质。
- 如何开发、配置和评估 Bagged 决策树集成。
- 如何开发随机子空间集成,它在输入特征的不同子集上训练成员。
- 如何探索基于自定义特征选择的 Bagging 集成。
- 如何开发结合了 Bagging 和随机子空间集成思想的随机森林集成。
- 如何开发放宽随机森林约束的 Extra Trees 集成。
- 如何探索基于自定义数据准备的 Bagging 集成。
Boosting 算法,顺序添加模型以纠正先前的模型,包括
- 用于分类和回归的基于 Boosting 的集成学习的本质。
- 强学习器和弱学习器之间的区别以及它们在 Boosting 集成中的作用。
- 如何开发、配置和评估梯度 Boosting 集成。
- 如何使用 XGBoost 降低训练梯度 Boosting 模型的计算成本。
- 如何使用 LightGBM 提高性能并降低梯度 Boosting 模型的复杂性。
您还需要什么?
先睹为快,看看电子书内部
点击图片放大。
额外赠送:用 Python 实现集成学习算法代码食谱
……您还将获得 186 个完全可用的 Python 脚本
示例代码配方
书中展示的每个配方都是独立的,这意味着您可以将其复制粘贴到您的项目中并立即使用。
- 书中提供的每个示例,您都会得到一个 Python 脚本(.py)文件。
这意味着您可以跟着操作,并将您的答案与所提供的 Python 文件中已知可行的实现进行比较。
这在您处理特定任务的细节时,能大大加快您的进度,例如:
- 用于分类的多个模型。
- 用于回归的多个模型。
- 调整集成的超参数。
- 创建自定义集成。
- 配置梯度 Boosting。
- 使用第三方库进行梯度 Boosting。
- 比较不同模型的性能。
- 从头开始实现混合。
- 使用管道避免数据泄露。
- 从头开始编写超级学习器。
所提供的代码是在文本编辑器中开发的,并旨在在命令行上运行。不需要特殊的 IDE 或笔记本。
所有代码示例都已在 Python 3.6+ 版本上设计和测试。
所有代码示例都可以在普通的现代计算机硬件上运行,并在 CPU 上执行。
Python 技术细节
本节提供有关本书附带代码的一些技术细节。
- Python 版本:您可以使用 Python 3.6 或更高版本。
- SciPy:您将使用 NumPy、SciPy 和 scikit-learn 的 API。
- 操作系统:您可以使用 Windows、Linux 或 MacOS。
- 硬件:标准的现代工作站即可。
- 编辑器:您可以使用文本编辑器并在命令行中运行示例。
没有 Python 环境?
没问题!
附录中包含一个手把手的教程,向您展示如何准确地设置 Python 机器学习环境。

用 Python 实现集成学习算法代码食谱
关于作者
大家好,我是 Jason Brownlee。我运营这个网站,并撰写和出版了这本书。
我和我的妻子及儿子们住在澳大利亚。我喜欢读书、写教程和开发系统。
我拥有计算机科学和软件工程背景,以及人工智能专业的硕士和博士学位,主攻随机优化。
我写过关于算法的书籍,在比赛中获胜并排名靠前,为初创公司提供咨询,并在业界工作多年。(是的,我花了很多时间构建和维护真正的运营系统!)
帮助开发者入门并精通应用机器学习,这让我感到非常满足。
我采用一种非传统的自上而下、结果优先的机器学习教学方法,我们从实践教程和问题开始,然后在需要时再深入理论。
如果您有任何问题,我随时乐意帮助。我希望您能在机器学习领域变得出色。
下载您的样章
您想仔细看看这本书吗?下载免费的样本章节PDF。
输入您的电子邮件地址,样章将发送到您的收件箱。
在选择 Machine Learning Mastery 的路上,您并不孤单
受到超过 53,938 名从业者的信赖
...包括来自以下公司的员工
...以及来自以下大学的学生和教职员工
以及成千上万的其他人...
绝对没有风险,因为有...
100% 退款保证
此外,正如您对市场上任何优秀产品的期望一样,每一本 Machine Learning Mastery 的电子书
都附带了信心的最大保证:我的黄金标准 100% 退款保证。
100% 退款保证
如果您对购买的任何一本 Machine Learning Mastery 电子书不满意,
只需在购买后 90 天内给我发邮件,我将立即退款给您。
无需等待。不问任何问题。没有风险。
…是时候迈出下一步了。
将现代集成学习技术带入
您的预测建模项目中,就在此刻!
选择您的套餐
所有价格均为美元(USD)。
(1)点击按钮。 (2)输入您的信息。 (3)立即下载。
采用 SSL 加密的安全支付处理
您有任何问题吗?
机器学习技能值多少钱?
你的老板问你:
“嘿,你能为这个建立一个预测模型吗?”
想象一下,你拥有技能和信心去说:
“好的!”
...并付诸行动。
我经历过。 那感觉太棒了!
这对你来说价值多少?
行业对机器学习技能的需求日益增长。
市场需要的是能交付成果的人,而不是写学术论文的人。
企业知道这些技能的价值,并支付天价的起薪。
数据科学家的起薪为
10 万美元到 15 万美元。
机器学习工程师的薪水甚至更高。
你还有哪些选择?
你已经走到了这一步。
你准备好采取行动了。
但是,你还有哪些选择?有哪些选项?
(1) 一本 100 美元以上的理论教科书
...它枯燥乏味,充满了数学,你很可能永远也读不完。
(2) 一个 10,000 美元以上的现场训练营
...那里都是年轻人,你必须出差,而且可能需要几个月的时间。
(3) 一个 100,000 美元以上的高等学位
...它很昂贵,需要数年时间,而且你会成为一名学者。
或者...
为了你获得的实践技能...
为了你看到的成果速度...
为了你支付的低廉价格...
Machine Learning Mastery 电子书是
超值的选择!
而且它们确实有效。这就是我提供退款保证的原因。
你是一名专业人士
这个领域发展迅速,
...你还能等多久?
你以为你有的是时间,但是...
- 新方法不断涌现,算法也在变化。
- 新书不断出版,价格也在上涨。
- 新的毕业生不断涌现,职位也被填补。
现在就是开始的最佳时机。
自下而上的学习方式缓慢而令人沮丧,
...难道你不想找到一条更快的路吗?
你真的能再这样日复一日、周复一周、月复一月地...
- 从不完整的帖子中拼凑想法和代码。
- 从简短的视频中浏览理论和见解。
- 从学术教科书中解析希腊字母。
针对性训练是你通往成果的最短路径。
专业人士始终保持在领域前沿
获取你需要的培训!
你不想落后或错过机会。
常见问题
客户问题 (78)
感谢您的兴趣。
抱歉,我不支持我的书籍的第三方经销商(例如在其他书店转售)。
我的书是自出版的,我将我的网站视为一个小型精品店,专门为那些对应用机器学习深感兴趣的开发者服务。
因此,我更喜欢自己控制书籍的销售和营销。
很抱歉,我不支持在捆绑包内更换书籍。
所提供捆绑包中的书籍组合是固定的。
我的电子商务系统不够先进,不支持临时捆绑。我相信您能理解。您可以在这里查看完整的书籍和捆绑包目录
如果您已经购买了一个捆绑包,并希望更换其中的一本书,那么非常抱歉,我不支持换书或部分退款。
如果您不满意,请直接联系我,我可以为您安排退款。
感谢您的兴趣。
很抱歉,我无法为您创建定制的书籍捆绑包。这会给我带来维护上的噩梦。我相信您能理解。
我的电子商务系统不是很先进。它不支持临时捆绑书籍或点菜式订购书籍。
我确实有一些现有的书籍捆绑包,我认为它们搭配得很好。
您可以在这里查看我所有可用的书籍和捆绑包目录
抱歉,我不销售我的书的实体版。
所有的书籍和捆绑包都是 PDF 文件格式的电子书。
这是我经过深思熟虑后有意为之的决定
- 这些书充满了必须在电脑上完成的教程。
- 这些书假定您正在实践教程,而不是被动阅读。
- 这些书旨在在电脑屏幕上阅读,旁边放着代码编辑器。
- 这些书是实践手册,而不是用作参考书放在书架上。
- 这些书会频繁更新,以跟上领域和 API 的变化。
我希望这解释了我的理由。
如果您真的想要实体版,您可以购买书籍或捆绑包,并为个人使用打印一份。PDF 文件上没有数字版权管理(DRM)来阻止您打印它们。
抱歉,我不提供 Kindle (mobi) 或 ePub 版本的书籍。
这些书仅以 PDF 文件格式提供。
这是我经过深思熟虑的设计。我的理由如下:
- 我使用 LaTeX 来排版文本和代码,以提供专业的外观,我担心电子书阅读器会搞砸这一点。
- 增加支持的格式会带来维护上的麻烦,这将占用大量时间,影响我更新书籍和创作新书。
- 最关键的是,在电子阅读器或 iPad 上阅读与选择 PDF 格式所支持的书籍与代码编辑器并排打开的方法背道而驰。
我的材料是实践手册,旨在在电脑上打开,旁边放着文本编辑器和命令行。
它们不是离开电脑阅读的教科书。
您可以查看任何一本书的目录。
我在每本书的页面上都提供了两份目录。
具体来说:
- 一份书面摘要,列出了书中的教程/课程及其顺序。
- 一份从 PDF 中截取的目录截图。
如果您找不到目录,请在页面上搜索标题为“目录”的部分。
我很高兴您在开发自己的课程材料时使用我的部分材料,例如课堂讲座的幻灯片或家庭作业练习。
如果您免费分享我的材料或逐字使用,我会不高兴。这将构成版权侵犯。
我网站上和我书中的所有代码都是为教育目的而开发和提供的。我对代码、它可能做什么或您可能如何使用它不承担任何责任。
如果您使用我的材料进行教学,请引用来源,包括:
- 作者姓名,例如“Jason Brownlee”。
- 教程或书籍的标题。
- 网站名称,例如“Machine Learning Mastery”。
- 教程或书籍的 URL。
- 您访问或复制该代码的日期。
例如
- Jason Brownlee, Python 机器学习算法, Machine Learning Mastery, 网址:https://machinelearning.org.cn/machine-learning-with-python/, 访问于 2018 年 4 月 15 日。
另外,如果您的作品是公开的,请联系我,我很乐意出于一般兴趣看看它。
通常不提供。
我的书中没有练习或作业。
我确实在一些书中有端到端的项目,但它们是以教程形式呈现的,我会引导您完成每一步。
书的章节是作为独立的教程编写的,有特定的学习成果。在教程结束时,您将学会如何做某件事。
有些书有一个名为“扩展”的部分,提供了一些以更高级的方式修改教程中代码的想法。它们就像自学练习。
不行。
我有一些书不需要任何编程技能,例如:
其他书籍确实有特定编程语言的代码示例。
您必须了解该编程语言的基础知识,例如如何安装环境以及如何编写简单的程序。我不教编程,我教的是面向开发者的机器学习。
您不需要是一个好的程序员。
话虽如此,我确实为那些可能不熟悉特定语言的开发者提供了关于如何高效设置环境的教程,甚至还有编程语言的速成课程。
抱歉,我没有视频。
我只有文本格式的教程课程和项目。
这是有意为之。我曾经有过视频内容,但我发现完成率要低得多。
我希望您能将材料付诸实践。我发现基于文本的教程是实现这一目标的最佳方式。通过基于文本的教程,您必须阅读、实现并运行代码。
而通过视频,您只是被动观看,不需要采取任何行动。视频是娱乐或信息娱乐,而不是富有成效的学习和工作。
在阅读并实践教程之后,您更有可能运用所学知识。
是的,我提供 90 天无理由退款保证。
我为我的书负责。它们包含了我对特定机器学习主题的最佳知识,并且每本书都经过数万名读者的阅读、测试和使用。
尽管如此,如果您发现我的某本电子书不适合您,我会全额退款。
是的。
我建议使用在 TensorFlow 2.2(或更高版本)上运行的独立 Keras 2.4(或更高版本)。
博客上的所有教程都已更新,使用在 Tensorflow 2 上运行的独立 Keras。
所有书籍都已更新,使用相同的组合。
我还不推荐使用作为 TensorFlow 2 一部分的 Keras(例如 tf.keras)。它太新了,新事物总有问题,我正在等待尘埃落定。独立 Keras 已经运行多年,并且继续表现出色。
有一种教程情况不支持TensorFlow 2,因为这些教程使用了尚未更新以支持TensorFlow 2的第三方库。具体来说,是使用Mask-RCNN进行对象识别的教程。一旦第三方库更新,这些教程也将更新。
《使用Python的长期短期记忆网络》一书不侧重于时间序列预测,而是侧重于针对一系列序列预测问题的LSTM方法。
《深度学习时间序列预测》一书向您展示了如何为单变量、多变量和多步时间序列预测问题开发MLP、CNN和LSTM模型。
迷你课程是关于一系列机器学习主题的免费课程,通过电子邮件、PDF 和博客文章提供。
迷你课程的特点是:
- 简短,通常为 7 天或 14 天。
- 简洁,通常每节课给出一个技巧或代码片段。
- 有限,通常范围较窄,仅限于几个相关领域。
电子书则在许多相同主题上提供完整的培训课程。
电子书的特点是:
- 更长,通常包含 25+ 个完整的教程课程,每个课程最多需要一小时完成。
- 完整,为每个课程提供温和的介绍,并包括完整的可用代码和进一步阅读材料。
- 广泛,涵盖了该主题所需的所有内容,以便快速上手并将技术应用到您自己的项目中。
迷你课程旨在让您快速获得结果。如果您想了解更多信息或更完整的代码示例,可以购买相关的电子书。
《掌握机器学习算法》一书适用于程序员和非程序员。它教您10种顶级机器学习算法的工作原理,并附有算术和电子表格(而非代码)的示例。重点在于理解每个模型如何学习和做出预测。
《从零开始的机器学习算法》一书适用于通过编写代码来学习理解的程序员。它提供了关于如何实现顶级算法以及如何加载数据、评估模型等的逐步教程。它较少关注算法的工作原理,而是
完全专注于如何在代码中实现每个算法。
这两本书可以相互补充。
这些书是我博客内容的浓缩和更便捷的版本。
我将我的书设计成课程和项目的结合体,教您如何使用特定的机器学习工具或库,然后将其应用于真实的预测建模问题。
这些书会进行更新,包括错误修复、API 变更的更新以及新章节的增加,这些更新是完全免费的。
我确实会将一些书的章节作为示例发布在博客上,但它们与周围的章节或书提供的叙事没有联系,也不提供独立的代码文件。
每本书都附带了书中使用的所有源代码文件,您可以将它们用作配方来快速启动您自己的预测建模问题。
我的书是实践手册,不是教科书。
它们没有深入的理论解释,只有可行的例子,这些例子高度专注于您需要知道的信息,以便将机器学习应用到您的项目中。
几乎没有数学,没有理论或推导。
我的读者非常欣赏我材料中使用的自上而下而非自下而上的方法。这是我收到反馈最多的一个方面。
我的书并不适合所有人,它们是为需要快速获得结果的从业者精心设计的。
电子书可以直接从我的网站上购买。
- 首先,找到您希望购买的书籍或捆绑包,您可以在这里查看完整的目录
- 点击您想购买的书籍或捆绑包,进入该书的详情页面。
- 点击书籍或捆绑包的“立即购买”按钮,进入购物车页面。
- 在购物车中填写您的详细信息和支付信息,然后点击“下单”按钮。
- 完成购买后,您将收到一封包含下载您的书籍或捆绑包链接的电子邮件。
所有价格均为美元(USD)。
书籍可以通过 PayPal 或信用卡购买。
Machine Learning Mastery 上的所有价格均为美元。
可以使用支持国际支付的 PayPal 或信用卡进行支付(例如,大多数信用卡都支持)。
您不必明确地将您的货币兑换成美元。
当您使用 PayPal 或信用卡付款时,货币转换会自动进行。
要在购物时使用折扣码,也称为优惠码或折扣券,请按照以下步骤操作:
1. 在结账页面的“折扣券”字段中输入折扣码文本。
注意,如果您在结账页面上没有看到名为“折扣券”的字段,则表示该产品不支持折扣。
2. 点击“应用”按钮。
3. 然后您会看到一条消息,表明折扣已成功应用于您的订单。
注意,如果您使用的折扣码已失效,您会看到一条消息,表明折扣未能成功应用于您的订单。
你应该按什么顺序读这些书?
这是一个很好的问题,我最好的建议如下:
- 考虑从一本您最感兴趣的主题的书开始。
- 考虑从一本您可以立即应用到项目上的主题的书开始。
另外,请考虑您不需要阅读所有的书,也许一部分书就能让您获得您需要或想要的技能。
尽管如此,一个建议的阅读顺序如下:
-
- 机器学习概率
- 机器学习的统计方法
- 机器学习线性代数
- 机器学习优化
- 机器学习微积分
- 数据科学入门指南
- 精通机器学习算法
- 从零开始实现机器学习算法
- 用于机器学习的 Python
- 使用 Weka 精通机器学习
- 精通 Python 机器学习
- 精通 R 语言机器学习
- 新一代数据科学
- 机器学习数据准备
- 使用 Python 处理不平衡分类问题
- 使用 Python 进行时间序列预测
- 使用 Python 实现集成学习算法
- 使用 Python 实现 XGBoost
- 使用 Python 进行深度学习
- 使用 PyTorch进行深度学习
- 使用 Python 构建长短期记忆网络
- 用于自然语言处理的深度学习
- 使用 Hugging Face Transformers 进行自然语言处理
- 用于计算机视觉的深度学习
- OpenCV 中的机器学习
- 用于时间序列预测的深度学习
- 更好的深度学习
- 使用 Python 构建生成对抗网络
- 使用注意力机制构建 Transformer 模型
- 使用 ChatGPT 提高生产力(这本书可以按任何顺序阅读)
- 使用 Stable Diffusion 精通数字艺术(这本书可以按任何顺序阅读)
希望这能有所帮助。
我最好的建议是,从一本您可以立即应用的主题的书开始。
除此之外,选择一个您最感兴趣的主题。
如果您不确定,或许可以尝试学习一些免费教程,看看您倾向于哪个领域。
通常,我建议专注于端到端地解决预测建模问题的整个过程。
我有三本书,通过三个顶级的开源平台,向您展示如何做到这一点。
- 精通Weka机器学习 (无需编程)
- 精通R语言机器学习 (使用caret)
- 精通Python机器学习 (使用pandas和scikit-learn)
这些都是很好的入门选择。
您随时可以回过头来,选择一本关于算法的书,以便更深入地了解特定方法的工作原理。
《Python深度学习》这本书可以看作是《Python长短期记忆网络》的预备知识。它教您如何开始使用Keras,以及如何开发您的第一个MLP、CNN和LSTM。
《Python长短期记忆网络》这本书深入探讨了LSTM,教您如何准备数据、如何开发一系列不同的LSTM架构、参数调整、更新模型等等。
这两本书都专注于使用Keras库在Python中进行深度学习。
《Python长短期记忆网络》这本书主要关注如何为序列预测开发一系列不同的LSTM网络。
《深度学习时间序列预测》一书侧重于如何使用一系列不同的深度学习模型(MLP、CNN、LSTM和混合模型)来解决一系列不同的时间序列预测问题(单变量、多变量、多步和组合)。
LSTM这本书只教LSTM,不侧重于时间序列。而时间序列深度学习这本书则侧重于时间序列,并教授如何使用包括LSTM在内的多种不同模型。
《Python长短期记忆网络》这本书专注于如何实现不同类型的LSTM模型。
《自然语言处理深度学习》这本书专注于如何使用包括LSTM在内的多种不同网络来解决文本预测问题。
LSTM这本书可以为NLP这本书提供支持,但它不是必需的预备知识。
您可能需要“Machine Learning Mastery”公司的企业或公司税号用于您自己的税务目的。例如,这在欧盟公司中很常见。
Machine Learning Mastery 公司在波多黎各运营。
因此,公司没有欧盟的增值税(VAT)识别号或适用于您所在国家或地区的类似税号。
公司确实有一个公司编号。详细信息如下:
- 公司名称:Zeus LLC
- 公司编号: 421867-1511
在《精通机器学习算法》中没有代码示例,因此没有使用任何编程语言。
书中通过基本算术描述算法并总结其工作原理。算法的行为也在Excel电子表格中进行了演示,这些表格随书提供。
这是一本学习算法工作原理的绝佳书籍,不会被理论或编程语法所分心。
如果您有兴趣通过从头开始编码(使用Python编程语言)来学习机器学习算法,我推荐另一本书:
所有的书都经过测试,可以与Python 3(例如3.5或3.6)一起使用。
大多数书籍也经过测试,可以与Python 2.7一起使用。
在可能的情况下,我建议使用最新版本的Python 3。
我确实会先在博客上测试我的教程和项目。这就像是创意的早期体验,其中许多并没有进入我的培训材料。
书中的大部分材料最初都以某种形式出现在我的博客上,后来经过提炼、改进并以章节格式重新包装。我发现这对于提高质量和修复错误有很大帮助。
书籍提供了更方便的材料包装,包括源代码、数据集和PDF格式。它们还包括对新API的更新、新章节、错误和拼写修正,以及直接与我联系以获得我能提供的所有支持和帮助。
我相信我的书以几十美元的价格提供了价值数千美元的教育。
它们是我数月甚至数年经验的结晶,浓缩在几百页精心制作且经过充分测试的教程中。
我认为对于希望快速掌握应用机器学习技能或在项目中使用机器学习的专业开发人员来说,它们是物超所值的。
此外,机器学习技能对您、对您的下一个项目、以及对您当前或未来的雇主价值几何?
尽管如此,如果您是学生,或者您不习惯北美、澳大利亚、英国及世界类似地区开发人员的高薪,我的书的价格可能看起来很贵。对此,我感到抱歉。
折扣
我确实为学生、教师和退休人员提供折扣。
请联系我了解更多信息。
免费资料
我在我的博客上提供了大量免费内容,您可以在这里开始学习我最好的免费资料:
关于我的书籍
我的书是实战手册。
它们是为那些想知道如何使用特定库来实际解决问题并在工作中交付价值的开发人员准备的。
- 我的书只引导您了解那些为了取得成果而必须知道的要素。
- 我的书是PDF格式,并附带代码和数据集,专为方便您在电脑上阅读和实践而设计。
- 我的书让您可以通过电子邮件直接联系到我(还有哪些书能提供这个?)。
- 对于专业开发人员来说,我的书是一笔微小的业务开销,可以记入公司账目,并且在大多数地区可以抵税。
很少有机器学习培训材料专注于如何取得成果。
绝大多数资料都在重复同样的数学和理论,却忽略了您真正关心的一件事:如何在项目中使用这些方法。
与其他选项的比较
让我为您提供一些关于书籍定价的背景信息:
YouTube上有免费视频,博客上有免费教程。
- 很好,我鼓励您使用它们,包括我自己的免费教程。
有一些非常便宜的视频课程,教您一两个API的技巧。
- 我的书教您如何使用一个库来端到端地完成一个项目并交付价值,而不仅仅是几个技巧。
一本机器学习教科书可能要花费50到100美元。
- 我所有的书都比一般的机器学习教科书便宜,而且我期望您能更快地提高生产力。
一个训练营或其他线下培训可能花费1000多美元,并持续数天到数周。
- 我所有书籍的捆绑包比这便宜得多,它们允许您按自己的节奏学习,并且捆绑包涵盖的内容比一般训练营更多。
抱歉,我的书不在像Amazon.com这样的网站上销售。
出于多种原因,我慎重决定不把我的书放在亚马逊上:
- 亚马逊会从自出版书籍的销售价格中抽取65%,这会让我无法经营下去。
- 亚马逊对销售页面和购物车体验的控制权很小。
- 亚马逊不允许我通过电子邮件联系我的客户,并提供直接支持和更新。
- 亚马逊不允许我以PDF格式向客户交付我的书,而PDF是我的客户在屏幕上阅读的首选格式。
我希望这能帮助您理解我的理由。
我免费赠送了很多内容。事实上,是大部分内容。
帮助经济不宽裕的学生和从业者对我来说很重要,因此我提供了大量的免费内容。
您可以通过以下方式获取免费内容:
我对此进行了深思熟虑,我销售机器学习电子书有几个重要原因:
- 我用收入来支持网站和所有非付费用户。
- 我用收入来养家糊口,以便我能继续创作内容。
- 为教程付费的从业者更有可能认真学习并学到东西。
- 我的书目标读者是更有可能负担得起这些材料的职业人士。
是的。
您购买的书籍或捆绑包中的所有书籍更新都是免费的。
书籍通常每隔几个月更新一次,以修复错误、拼写问题并跟上API的变化。
随时联系我,查询是否有更新。请告诉我您拥有的书籍版本(版本号列在版权页上)。
是的,这些书可以帮助您找到工作,但只是间接的。
找到工作取决于您自己。
这是一个寻找职位空缺的组织与拥有技能和背景的您之间的匹配问题。
话虽如此,有些公司更看重您能为业务带来的价值,而不是您的学位。通常,这些是较小的公司和初创企业。
您可以通过学习并精通端到端解决预测建模问题来专注于提供机器学习价值。您可以通过建立一个已完成项目的机器学习作品集来展示这项技能。
我的书正是为了帮助您实现这些目标而设计的。它们准确地教您如何使用开源工具和库在预测建模项目中取得成果。
您还有其他问题吗?
请联系我.