Box and Whisker Plot of Statistical Imputation Strategies Applied to the Horse Colic Dataset

机器学习中缺失值的统计插补

数据集可能包含缺失值,这会给许多机器学习算法带来问题。因此,在对预测任务进行建模之前,识别并替换输入数据中每一列的缺失值是一个很好的做法。这被称为缺失数据插补,或简称插补。一种流行的数据处理方法 [...]

继续阅读
A Gentle Introduction to Dimensionality Reduction for Machine Learning

机器学习降维简介

数据集的输入变量或特征的数量被称为其维度。降维指的是减少数据集中输入变量数量的技术。更多的输入特征通常会使预测建模任务更难建模,通常被称为“维度灾难”。高维统计 [...]

继续阅读
Box Plot of AdaBoost Ensemble Weak Learner Depth vs. Classification Accuracy

如何在Python中开发AdaBoost集成模型

提升是一类集成机器学习算法,涉及到组合许多弱学习器的预测。弱学习器是一种模型,它非常简单,尽管在数据集上具有一定的技能。在实用算法能够被开发出来之前,提升是一个理论概念,而 AdaBoost(自适应提升)算法 [...]

继续阅读
Difference Between Algorithm and Model in Machine Learning

机器学习中算法与模型的区别

机器学习涉及机器学习算法和模型的应用。对于初学者来说,这非常令人困惑,因为“机器学习算法”经常与“机器学习模型”互换使用。它们是同一事物还是不同的事物?作为一名开发人员,您对排序算法和搜索算法等“算法”的直觉将有助于澄清 [...]

继续阅读

Machine Learning Mastery 是 Guiding Tech Media 的一部分,Guiding Tech Media 是一家领先的数字媒体出版商,专注于帮助人们了解技术。访问我们的公司网站以了解更多关于我们的使命和团队的信息。