为什么在同一数据上运行算法的不同次会得到不同的结果?应用机器学习是突破和思维模式转变的结合体。理解随机性在机器学习算法中的作用是其中一项突破。一旦你理解了这一点,你就会以全新的视角看待事物,焕然一新。诸如[…]

为什么在同一数据上运行算法的不同次会得到不同的结果?应用机器学习是突破和思维模式转变的结合体。理解随机性在机器学习算法中的作用是其中一项突破。一旦你理解了这一点,你就会以全新的视角看待事物,焕然一新。诸如[…]
从开发人员到机器学习实践者,14 天学会 Python 是应用机器学习增长最快的平台之一。在本微型课程中,您将了解如何开始、构建准确的模型,并通过 Python 在 14 天内自信地完成预测建模机器学习项目。这是一篇重要且篇幅较大的文章。您[…]
Python XGBoost 微型课程。XGBoost 是梯度提升的一种实现,被用于赢得机器学习竞赛。它功能强大,但入门可能有点难。在这篇文章中,您将发现一个关于 Python XGBoost 的 7 部分速成课程。本微型课程是为 Python 机器学习实践者设计的,他们[…]
20 个对抗过拟合和获得更好泛化能力的技巧、窍门和技术。如何从深度学习模型中获得更好的性能?这是我经常被问到的最普遍的问题之一。它可能被问为:我如何提高准确率?……或者反过来问:什么[…]
集成决策树的一个简单技术是在训练数据集的子样本上训练树。可以从训练数据中抽取行子集来训练称为装袋(bagging)的单个树。当在计算每个分裂点时也抽取训练数据行子集时,这就称为随机森林(random forest)。[…]
梯度提升决策树的一个问题是它们学习速度快且容易过拟合训练数据。减缓梯度提升模型学习速度的一个有效方法是使用学习率,也称为收缩(shrinkage)(或 XGBoost 文档中的 eta)。在这篇文章中,您将发现学习[…]
入门深度学习是一件困难的事。之所以困难,是因为深度学习是由学术界为学术界人士教授的。如果您是开发人员(或实践者),情况则不同。您想要的是结果。实践者学习新技术的方式是通过开发能快速带来价值的原型。这是一种自上而下的学习方法,但它不是[…]
XGBoost 库提供了梯度提升的实现,该实现专为速度和性能而设计。它被实现为最大程度地利用您的计算资源,包括所有 CPU 核心和内存。在这篇文章中,您将了解如何设置 Amazon 云服务上的服务器,以快速且廉价地创建非常大的模型。阅读后[…]
梯度提升是应用机器学习中最强大的技术之一,因此它正迅速成为最受欢迎的技术之一。但是,如何针对您的问题配置梯度提升?在这篇文章中,您将通过查看配置来了解如何针对您的机器学习问题配置梯度提升[…]
梯度提升是构建预测模型最强大的技术之一。在这篇文章中,您将了解梯度提升机器学习算法,并获得一个关于它从何而来以及如何工作的初步介绍。阅读本文后,您将了解:提升理论和 AdaBoost 的起源。如何[…]