高斯过程分类器是一种分类机器学习算法。高斯过程是高斯概率分布的推广,可用作复杂非参数机器学习算法在分类和回归中的基础。它们是一种核模型,类似于 SVM。与 SVM 不同的是,它们能够预测高度 [...]

高斯过程分类器是一种分类机器学习算法。高斯过程是高斯概率分布的推广,可用作复杂非参数机器学习算法在分类和回归中的基础。它们是一种核模型,类似于 SVM。与 SVM 不同的是,它们能够预测高度 [...]
半径邻近分类器是一种分类机器学习算法。它是 k-近邻算法的扩展,该算法使用新示例半径内的所有示例进行预测,而不是 k 个最近的邻居。因此,基于半径的邻居选择方法更适用于稀疏数据,可防止远处的示例 [...]
线性判别分析是一种线性分类机器学习算法。该算法涉及基于每个输入变量观测值的特定分布为每个类开发概率模型。然后通过计算新示例属于每个类的条件概率并选择具有最高概率的类来对新示例进行分类。 [...]
对测试集进行爬坡是一种在不接触训练集甚至不开发预测模型的情况下,在机器学习竞赛中获得良好或完美预测的方法。作为一种机器学习竞赛的方法,它理应受到批评,并且大多数竞赛平台都会施加限制来阻止它,这一点很重要。尽管如此,[...]
训练到测试集是一种过拟合,其中模型被准备好,在给定测试集上获得良好的性能,但以增加泛化误差为代价。这是一种在机器学习竞赛中常见的过拟合,其中提供完整的训练数据集,并且只有 [...]
许多计算密集型机器学习任务可以通过将工作分配给多个 CPU 核心来并行化,这被称为多核处理。可以并行化的常见机器学习任务包括训练模型(如决策树的集成)、使用重采样程序(如 k 折交叉验证)评估模型以及调整模型超参数(如 [...]
AutoML 提供了工具,只需很少的用户干预即可自动为数据集发现良好的机器学习模型管道。它非常适合刚接触机器学习的领域专家或希望为预测建模任务快速获得良好结果的机器学习从业者。有可用的开源库可用于使用流行的机器学习 [...]
机器学习模型选择和配置可能是应用机器学习中最具挑战性的部分。必须进行对照实验,以发现哪种方法最适合给定的分类或回归预测建模任务。鉴于大量的数据准备方案、学习算法和模型超参数,这可能会让人不知所措,其中 [...]
机器学习模型具有必须设置的超参数,才能将模型定制为适合您的数据集。通常,超参数对模型的一般影响是已知的,但如何为给定数据集最好地设置超参数以及相互作用的超参数组合却充满挑战。通常存在一般的启发式方法或规则 [...]
自动化机器学习(AutoML)是指在用户极少干预的情况下,自动发现预测建模任务的良好模型的技术。HyperOpt 是一个用于大规模 AutoML 的开源库,而 HyperOpt-Sklearn 是 HyperOpt 的一个包装器,它支持流行的 Scikit-Learn 机器学习库的 AutoML,包括数据准备套件 [...]