作者归档 | Jason Brownlee

Box Plot of Standalone and Stacking Model Accuracies for Binary Classification

使用 Python 的堆叠集成机器学习

堆叠(Stacking)或堆叠泛化(Stacked Generalization)是一种集成机器学习算法。它使用元学习算法来学习如何最好地组合两个或多个基础机器学习算法的预测。堆叠的好处在于,它可以利用一系列在分类或回归任务上表现良好的模型的强大功能,并且 […]

继续阅读
Scatter Plot of Multi-Class Classification Dataset

机器学习中4种分类任务类型

机器学习是一门研究领域,涉及从示例中学习的算法。分类是一项需要使用机器学习算法的任务,这些算法学习如何为问题域中的示例分配类别标签。一个易于理解的例子是将电子邮件分类为“垃圾邮件”或“非垃圾邮件”。 […]

继续阅读
Scatter Plot of Synthetic Clustering Dataset With Points Colored by Known Cluster

使用 Python 的 10 种聚类算法

聚类(Clustering)或聚类分析(Cluster Analysis)是一个无监督学习问题。它通常用作数据分析技术,用于发现数据中有趣的模式,例如基于客户行为的客户群体。有许多聚类算法可供选择,并且没有一种最佳的聚类算法适用于所有情况。相反,这是一个好的 […]

继续阅读
What Is argmax in Machine Learning?

机器学习中的Argmax是什么?

Argmax 是您在应用机器学习中可能遇到的数学函数。例如,您可能会在研究论文中看到“argmax”或“arg max”用于描述算法。您也可能被指示在您的算法实现中使用 argmax 函数。这可能是您第一次遇到 […]

继续阅读
Bar Chart of XGBClassifier Feature Importance Scores

如何使用 Python 计算特征重要性

特征重要性(Feature importance)是指为输入特征分配分数的技术,这些分数基于它们在预测目标变量方面的有用性。特征重要性分数有很多类型和来源,尽管流行的例子包括统计相关性分数、作为线性模型一部分计算的系数、决策树和置换重要性分数。特征重要性 […]

继续阅读
How to Develop Multioutput Regression Models in Python

如何使用 Python 开发多输出回归模型

多输出回归(Multioutput regression)是指涉及根据输入示例预测两个或多个数值的问题。一个例子可能是根据输入预测坐标,例如,预测 x 和 y 值。另一个例子将是多步时间序列预测,这涉及预测给定变量的多个未来时间序列。许多机器学习 […]

继续阅读
Distance Measures for Machine Learning

机器学习的 4 种距离度量

距离度量(Distance measures)在机器学习中扮演着重要角色。它们为许多流行且有效的机器学习算法奠定了基础,例如监督学习的 k-最近邻(k-nearest neighbors)和无监督学习的 k-均值聚类(k-means clustering)。必须根据数据的类型选择和使用不同的距离度量。因此,了解 […]

继续阅读

Machine Learning Mastery 是 Guiding Tech Media 的一部分,Guiding Tech Media 是一家领先的数字媒体出版商,专注于帮助人们了解技术。访问我们的公司网站以了解更多关于我们的使命和团队的信息。