您的机器学习算法是否得到了不同的结果?也许您的结果与教程不同,您想了解原因。也许您的模型每次训练时都会做出不同的预测,即使每次都在相同的数据集上进行训练。这是可以预期的,甚至可能是 […]

您的机器学习算法是否得到了不同的结果?也许您的结果与教程不同,您想了解原因。也许您的模型每次训练时都会做出不同的预测,即使每次都在相同的数据集上进行训练。这是可以预期的,甚至可能是 […]
分类算法学习如何为示例分配类别标签,尽管它们的决策可能显得不透明。理解分类算法决策的一种流行诊断方法是决策边界。这是一个图,显示了已拟合的机器学习算法如何在输入特征空间中预测一个粗糙的网格。决策 […]
计算学习理论,或称统计学习理论,是指用于量化学习任务和算法的数学框架。这些是机器学习的子领域,机器学习从业者不必深入了解即可在广泛的问题上取得良好成果。尽管如此,这是一个[…]
数据可视化可以洞察数据集中变量的分布和关系。这种洞察有助于在建模前选择数据准备技术以及可能最适合数据的算法类型。Seaborn 是一个 Python 数据可视化库,它运行在 […]
不平衡分类是指类别标签的分布不相等的预测任务。大多数不平衡分类示例都侧重于二元分类任务,但许多不平衡分类的工具和技术也直接支持多类别分类问题。在本教程中,您将了解如何使用 […]
XGBoost 是梯度提升在分类和回归问题上的高效实现。它既快速又高效,在各种预测建模任务中表现良好,甚至可能是最好的,并且是 Kaggle 等数据科学竞赛获胜者的最爱。XGBoost 也可用于时间序列 […]
k 折交叉验证过程是估计机器学习算法或配置在数据集上的性能的标准方法。k 折交叉验证过程的单次运行可能会导致模型性能的估计出现偏差。数据不同的分割可能会导致非常不同的结果。重复的 k 折交叉验证提供了 […]
k 折交叉验证过程是估计机器学习算法在数据集上的性能的标准方法。k 的常见值是 10,但是我们如何知道这种配置适合我们的数据集和算法呢?一种方法是探索不同的 k 值对 […]
k 折交叉验证过程用于估计机器学习模型在对训练期间未使用的数据进行预测时的性能。该过程可用于在数据集上优化模型超参数,以及在比较和选择数据集模型时使用。当使用相同的交叉验证过程和 […]
留一法交叉验证(LOOCV)过程用于估计机器学习算法在用于对未用于训练模型的数据进行预测时的性能。这是一个计算成本高昂的过程,尽管它能提供可靠且无偏的模型性能估计。尽管使用简单 […]