Cost-Sensitive Learning for Imbalanced Classification

不平衡分类的成本敏感学习

大多数机器学习算法假设模型所做的所有误分类错误都是相等的。对于不平衡分类问题,这通常不是情况,因为遗漏正例或少数类案例比错误地将示例从负类或多数类中分类更糟糕。有很多现实世界的例子,例如检测垃圾邮件 […]

继续阅读
Scatter Plot of Binary Classification Dataset With 1 to 100 Class Imbalance

如何为不平衡分类配置 XGBoost

XGBoost 算法对于各种回归和分类预测建模问题都非常有效。它是随机梯度提升算法的高效实现,并提供一系列超参数,可对模型训练过程进行精细控制。尽管该算法在一般情况下表现良好,即使在不平衡分类数据集上也是如此,但它 […]

继续阅读
Tour of Data Resampling Methods for Imbalanced Classification

不平衡分类数据采样方法巡览

机器学习技术在具有不平衡类分布的分类数据集上常常会失败或给出误导性的乐观性能。原因是许多机器学习算法旨在处理每个类别具有相等数量观测值的分类数据。当不是这种情况时,算法会学习到很少的示例 […]

继续阅读

Machine Learning Mastery 是 Guiding Tech Media 的一部分,Guiding Tech Media 是一家领先的数字媒体出版商,专注于帮助人们了解技术。访问我们的公司网站以了解更多关于我们的使命和团队的信息。