作者归档 | Jason Brownlee

Tour of Data Resampling Methods for Imbalanced Classification

不平衡分类数据采样方法巡览

在类别分布不平衡的分类数据集上,机器学习技术常常会失效或给出误导性的乐观性能。原因是许多机器学习算法被设计用于处理每个类别具有相等数量观测值的分类数据。当情况并非如此时,算法会学习到只有很少的示例 […]

继续阅读
Scatter Plot of Imbalanced Dataset Undersampled With the Condensed Nearest Neighbor Rule

用于不平衡分类的欠采样算法

重采样方法旨在改变不平衡分类任务的训练数据集的组成。重采样方法在不平衡分类中的注意力大多放在少数类过采样上。尽管如此,已经开发了一套用于多数类欠采样的方法,这些方法可以与有效的 […] 结合使用。

继续阅读

Machine Learning Mastery 是 Guiding Tech Media 的一部分,Guiding Tech Media 是一家领先的数字媒体出版商,专注于帮助人们了解技术。访问我们的公司网站以了解更多关于我们的使命和团队的信息。