作者归档 | Jason Brownlee

Nearest Shrunken Centroids With Python

使用 Python 的最近收缩质心

最近收缩质心(Nearest Centroids)是一种线性分类机器学习算法。它通过将新样本与训练数据集中基于类别的质心进行比较,来预测样本所属的类别。最近收缩质心算法(Nearest Shrunken Centroids)是其一种扩展,它将基于类别的质心向整个训练数据集的质心进行偏移,并移除 [...]

继续阅读
How to Develop LASSO Regression Models in Python

如何在Python中开发LASSO回归模型

回归(Regression)是一种建模任务,旨在根据输入预测一个数值。线性回归是回归的标准算法,它假设输入与目标变量之间存在线性关系。线性回归的一种扩展是在训练过程中向损失函数添加惩罚项,以鼓励更简单的模型,这些模型具有较小的系数 [...]

继续阅读
How to Develop Ridge Regression Models in Python

如何在Python中开发岭回归模型

回归(Regression)是一种建模任务,旨在根据输入预测一个数值。线性回归是回归的标准算法,它假设输入与目标变量之间存在线性关系。线性回归的一种扩展是在训练过程中向损失函数添加惩罚项,以鼓励更简单的模型,这些模型具有较小的系数 [...]

继续阅读
Gaussian Processes for Classification With Python

使用 Python 进行高斯过程分类

高斯过程分类器(Gaussian Processes Classifier)是一种分类机器学习算法。高斯过程是高斯概率分布的推广,可以作为复杂非参数机器学习算法(用于分类和回归)的基础。它们属于一种核模型,类似于支持向量机(SVM)。与 SVM 不同的是,它们能够预测高度 [...]

继续阅读
Radius Neighbors Classifier Algorithm With Python

使用 Python 的半径邻居分类器算法

半径邻近分类器(Radius Neighbors Classifier)是一种分类机器学习算法。它是 k-近邻算法(k-nearest neighbors)的一种扩展,它通过考虑新样本半径范围内的所有样本来做出预测,而不是仅考虑 k 个最近邻。因此,基于半径的方法在选择邻近样本时更适合稀疏数据,可以防止 [...] 离得远的样本。

继续阅读
Linear Discriminant Analysis With Python

使用 Python 进行线性判别分析

线性判别分析(Linear Discriminant Analysis)是一种线性分类机器学习算法。该算法通过为每个类别构建一个概率模型,该模型基于每个输入变量观测值的具体分布。然后,通过计算新样本属于每个类别的条件概率来对其进行分类,并选择概率最高的类别。 [...]

继续阅读
Line Plot of Accuracy vs. Hill Climb Optimization Iteration for the Diabetes Dataset

如何对机器学习的测试集进行爬山算法

对测试集进行爬坡(Hill climbing the test set)是一种在不接触训练集甚至不开发预测模型的情况下,在机器学习竞赛中获得良好或完美预测的方法。作为机器学习竞赛的一种方法,这种做法理应受到鄙视,并且大多数竞赛平台都设有限制来阻止它,这一点很重要。尽管如此, [...]

继续阅读
How to Train to the Test Set in Machine Learning

如何在机器学习中针对测试集进行训练

对测试集进行训练(Training to the test set)是一种过拟合类型,在这种情况下,模型被准备好以牺牲泛化误差的增加为代价,从而在给定的测试集上获得良好的性能。这是一种在机器学习竞赛中常见的过拟合类型,在这些竞赛中提供了完整的训练数据集,并且 [...]

继续阅读

Machine Learning Mastery 是 Guiding Tech Media 的一部分,Guiding Tech Media 是一家领先的数字媒体出版商,专注于帮助人们了解技术。访问我们的公司网站以了解更多关于我们的使命和团队的信息。