作者归档 | Jason Brownlee

Overview of Data Transform Techniques

机器学习数据准备技术巡览

诸如分类和回归之类的预测建模机器学习项目,总是涉及某种形式的数据准备。数据集所需的具体数据准备取决于数据的具体情况,例如变量类型,以及将用于对其进行建模的算法,这些算法可能会施加期望或要求 […]

继续阅读
Ordinal and One-Hot Encoding Transforms for Machine Learning

分类数据的序数和独热编码

机器学习模型要求所有输入和输出变量都是数值的。这意味着如果您的数据包含分类数据,则必须在拟合和评估模型之前将其编码为数字。最流行的两种技术是顺序编码和独热编码。在本教程中,您将发现如何 […]

继续阅读
Box and Whisker Plot of Number of Imputation Iterations on the Horse Colic Dataset

机器学习中缺失值的迭代估算

数据集可能存在缺失值,这会给许多机器学习算法带来问题。因此,在对预测任务进行建模之前,识别并替换输入数据中每列的缺失值是一个好习惯。这被称为缺失数据插补,或简称插补。一种复杂的方法涉及定义 […]

继续阅读
How to Use Polynomial Features Transforms for Machine Learning

如何在机器学习中使用多项式特征变换

通常,预测建模任务的输入特征以意想不到的、通常是非线性的方式进行交互。这些交互可以通过学习算法来识别和建模。另一种方法是构建新特征来暴露这些交互,看看它们是否能提高模型性能。此外,像将输入变量提高到某个幂这样的转换可以 […]

继续阅读

Machine Learning Mastery 是 Guiding Tech Media 的一部分,Guiding Tech Media 是一家领先的数字媒体出版商,专注于帮助人们了解技术。访问我们的公司网站以了解更多关于我们的使命和团队的信息。