归档 | 数据准备

How to Choose Data Preparation Methods for Machine Learning

如何为机器学习选择数据准备方法

数据准备是预测建模项目的重要组成部分。正确应用数据准备可以将原始数据转换为一种表示形式,使学习算法能够最大限度地利用数据并做出有技能的预测。问题在于选择一种转换或一系列转换,从而产生有用的表示……

继续阅读
Feature Engineering and Selection

特征工程与选择(书籍评论)

数据准备是将原始数据转换为学习算法的过程。在某些情况下,数据准备是必需的步骤,以便将数据以其必需的输入格式提供给算法。在其他情况下,输入数据的最合适表示形式是未知的,并且必须在……中进行探索。

继续阅读
Box and Whisker Plot of Imputation Number of Neighbors for the Horse Colic Dataset

机器学习中缺失值的 kNN 估算

数据集可能包含缺失值,这会给许多机器学习算法带来问题。因此,在对预测任务进行建模之前,识别并替换输入数据中每个列的缺失值是一种好习惯。这称为缺失数据插补,或简称插补。一种流行的缺失值处理方法……

继续阅读
Overview of Data Transform Techniques

机器学习数据准备技术巡览

分类和回归等预测建模机器学习项目总是涉及某种形式的数据准备。特定数据集所需的数据准备取决于数据的具体情况,例如变量类型,以及将用于建模的算法,这些算法可能会施加期望或要求……

继续阅读
What Is Data Preparation in a Machine Learning Project

机器学习项目中的数据准备是什么

数据准备可能是任何机器学习项目中 ZUI 困难的步骤之一。原因在于每个数据集都不同,并且高度特定于项目。尽管如此,在预测建模项目之间存在足够的共性,我们可以定义一个你可能会执行的松散的步骤和子任务序列。……

继续阅读
Ordinal and One-Hot Encoding Transforms for Machine Learning

分类数据的序数和独热编码

机器学习模型要求所有输入和输出变量都必须是数值型的。这意味着如果你的数据包含分类数据,你必须在拟合和评估模型之前将其编码为数字。ZUI 流行的两种技术是序数编码和独热编码。在本教程中,你将发现如何……

继续阅读

Machine Learning Mastery 是 Guiding Tech Media 的一部分,Guiding Tech Media 是一家领先的数字媒体出版商,专注于帮助人们了解技术。访问我们的公司网站以了解更多关于我们的使命和团队的信息。