Extra Trees 是一种集成机器学习算法,它结合了许多决策树的预测。它与广泛使用的随机森林算法相关。它通常可以达到与随机森林算法一样好甚至更好的性能,尽管它使用一种更简单的算法来构建用作成员的决策树 […]
Extra Trees 是一种集成机器学习算法,它结合了许多决策树的预测。它与广泛使用的随机森林算法相关。它通常可以达到与随机森林算法一样好甚至更好的性能,尽管它使用一种更简单的算法来构建用作成员的决策树 […]
随机森林是一种集成机器学习算法。鉴于其在各种分类和回归预测建模问题中表现良好或优秀,它可能是最流行和最广泛使用的机器学习算法。它也很容易使用,因为它只有几个关键的超参数和合理的启发式方法来配置 […]
投票是一种集成机器学习算法。对于回归,投票集成涉及做出多个其他回归模型的平均预测。在分类中,硬投票集成涉及对来自其他模型的清晰类别标签的投票进行求和,并预测得票最多的类别。软投票集成涉及 […]
如果我的数据集中的列比行多怎么办?机器学习数据集通常是结构化或表格数据,由行和列组成。馈送给模型的列称为预测变量或“p”,行是样本“n”。大多数机器学习算法都假设存在许多 […]
并非所有分类预测模型都支持多类分类。例如,感知器、逻辑回归和支持向量机等算法是为二元分类设计的,并且不原生支持具有两个以上类别的分类任务。使用二元分类算法解决多类分类问题的一种方法是将多类分类数据集拆分为多个 […]
堆叠(Stacking)或堆叠泛化(Stacked Generalization)是一种集成机器学习算法。它使用元学习算法来学习如何最好地组合两个或多个基础机器学习算法的预测。堆叠的好处在于,它可以利用一系列在分类或回归任务上表现良好的模型的强大功能,并且 […]
机器学习是一个研究领域,涉及从示例中学习的算法。分类是一项需要使用机器学习算法的任务,这些算法学习如何为问题域中的示例分配类别标签。一个易于理解的例子是将电子邮件分类为“垃圾邮件”或“非垃圾邮件”。 […]
聚类或聚类分析是一种无监督学习问题。它通常用作数据分析技术,用于发现数据中有趣的模式,例如根据客户行为对客户进行分组。有许多聚类算法可供选择,没有一种聚类算法适用于所有情况。相反,它是一种好的 […]
Argmax 是您在应用机器学习中可能会遇到的一个数学函数。例如,您可能会在研究论文中看到“argmax”或“arg max”用于描述算法。您还可能被指示在您的算法实现中使用 argmax 函数。这可能是您第一次遇到 […]
梯度提升是一种强大的集成机器学习算法。它在结构化预测建模问题(如表格数据上的分类和回归)中很受欢迎,并且通常是在 Kaggle 等机器学习竞赛的获胜解决方案中使用的主要算法或主要算法之一。有许多梯度提升的实现 […]