作者归档 | Jason Brownlee

Scatter Plots of an Imbalanced Classification Dataset With Different Numbers of Clusters

为什么不平衡分类很困难?

不平衡分类作为一项预测建模任务,主要挑战在于类别分布严重偏斜。这是传统机器学习模型和假设类别分布平衡的评估指标表现不佳的原因。尽管如此,分类数据集还有一些其他属性,它们不仅对预测建模具有挑战性 [...]

继续阅读
Cost-Sensitive Learning for Imbalanced Classification

不平衡分类的成本敏感学习

大多数机器学习算法都假设模型产生的所有误分类错误都是相等的。对于不平衡分类问题,情况通常并非如此,因为漏掉一个正类或少数类样本比错误地将一个来自负类或多数类的样本分类更糟糕。有很多现实世界的例子,例如检测垃圾邮件 [...]

继续阅读
Scatter Plot of Binary Classification Dataset With 1 to 100 Class Imbalance

如何为不平衡分类配置 XGBoost

XGBoost 算法对于各种回归和分类预测建模问题都有效。它是随机梯度提升算法的一个高效实现,并提供了一系列超参数,可以对模型训练过程进行精细控制。尽管该算法在一般情况下表现良好,即使在不平衡分类数据集上也是如此,但它 [...]

继续阅读

Machine Learning Mastery 是 Guiding Tech Media 的一部分,Guiding Tech Media 是一家领先的数字媒体出版商,专注于帮助人们了解技术。访问我们的公司网站以了解更多关于我们的使命和团队的信息。