归档 | 数据准备

Line Plot of Accuracy vs. Hill Climb Optimization Iteration for the Diabetes Dataset

如何对机器学习的测试集进行爬山算法

对测试集进行爬山算法是一种在机器学习竞赛中实现良好甚至完美预测的方法,它无需接触训练集,甚至无需开发预测模型。作为一种机器学习竞赛方法,它理所当然地受到鄙视,大多数竞赛平台都施加限制以防止这种情况发生,这一点很重要。尽管如此,[...]

继续阅读
Dimensionality Reduction Algorithms With Python

6种使用Python实现的降维算法

降维是一种无监督学习技术。然而,它可以作为机器学习算法在分类和回归预测建模数据集上的数据转换预处理步骤,与监督学习算法一同使用。有许多降维算法可供选择,没有一种算法适用于所有情况。相反,这是一个很好的 [...]

继续阅读
Model-Based Outlier Detection and Removal in Python

Python中的4种自动离群值检测算法

分类或回归数据集中离群值的存在可能导致拟合不佳和预测建模性能下降。鉴于大多数机器学习数据集输入变量众多,使用简单的统计方法识别和移除离群值具有挑战性。相反,可以在建模流程中使用自动离群值检测方法 [...]

继续阅读

Machine Learning Mastery 是 Guiding Tech Media 的一部分,Guiding Tech Media 是一家领先的数字媒体出版商,专注于帮助人们了解技术。访问我们的公司网站以了解更多关于我们的使命和团队的信息。