档案 | 不平衡分类

A Gentle Introduction to the Fbeta-Measure for Machine Learning

Fbeta-Measure 机器学习简介

Fbeta 分数是一种可配置的单一分数指标,用于根据对正类的预测来评估二元分类模型。Fbeta 分数使用精确率和召回率计算。精确率是一种计算正类正确预测百分比的指标。召回率计算正类正确预测的百分比……

继续阅读
Scatter Plots of an Imbalanced Classification Dataset With Different Numbers of Clusters

为什么不平衡分类很困难?

不平衡分类作为预测建模任务具有挑战性,主要是由于类别分布严重失衡。这是传统机器学习模型和假设类别分布均衡的评估指标表现不佳的原因。尽管如此,分类数据集还有一些其他特性,这些特性不仅对预测建模提出了挑战……

继续阅读
Cost-Sensitive Learning for Imbalanced Classification

不平衡分类的成本敏感学习

大多数机器学习算法都假设模型的所有误分类错误都是相等的。对于不平衡分类问题,情况通常并非如此,在这种问题中,漏掉一个正类或少数类样本比错误地将一个样本从负类或多数类中分类更糟糕。有很多现实世界的例子,例如检测垃圾邮件……

继续阅读
Scatter Plot of Binary Classification Dataset With 1 to 100 Class Imbalance

如何为不平衡分类配置 XGBoost

XGBoost 算法对广泛的回归和分类预测建模问题都有效。它是随机梯度提升算法的一个高效实现,并提供了一系列超参数,可以对模型训练过程进行精细控制。尽管该算法通常表现良好,即使在不平衡分类数据集上,它……

继续阅读

Machine Learning Mastery 是 Guiding Tech Media 的一部分,Guiding Tech Media 是一家领先的数字媒体出版商,专注于帮助人们了解技术。访问我们的公司网站以了解更多关于我们的使命和团队的信息。