许多计算密集型的机器学习任务可以通过将工作分配给多个 CPU 核心来实现并行化,这被称为多核处理。可以并行化的常见机器学习任务包括训练模型(如决策树的集成)、使用 k 折交叉验证等重采样程序评估模型以及调整模型超参数(如 […]

许多计算密集型的机器学习任务可以通过将工作分配给多个 CPU 核心来实现并行化,这被称为多核处理。可以并行化的常见机器学习任务包括训练模型(如决策树的集成)、使用 k 折交叉验证等重采样程序评估模型以及调整模型超参数(如 […]
AutoML 提供工具,只需很少的用户干预即可自动发现适用于数据集的良好机器学习模型管道。它非常适合不熟悉机器学习的领域专家或希望快速为预测建模任务获得良好结果的机器学习从业者。现有开源库可用于将 AutoML 方法与流行的 Python […]
机器学习模型的选择和配置可能是应用机器学习中最具挑战性的方面。必须进行受控实验,以便发现最适合特定分类或回归预测建模任务的方法。考虑到需要处理大量数据准备方案、学习算法和模型超参数,这可能会让人不知所措 […]
机器学习模型具有超参数,您必须进行设置才能根据您的数据集定制模型。模型的超参数的普遍影响通常是已知的,但如何最好地为给定数据集设置超参数和相互作用的超参数组合是一个挑战。通常存在一般的启发式方法或规则 […]
自动化机器学习 (AutoML) 指的是在用户很少参与的情况下,自动为预测建模任务发现高性能模型的技术。HyperOpt 是一个用于大规模 AutoML 的开源库,HyperOpt-Sklearn 是 HyperOpt 的一个包装器,它通过 HyperOpt 为流行的 Scikit-Learn 机器学习库(包括数据准备套件 […]
自动化机器学习 (AutoML) 指的是在用户很少参与的情况下,自动为预测建模任务发现高性能模型的技术。TPOT 是一个用于在 Python 中执行 AutoML 的开源库。它利用流行的 Scikit-Learn 机器学习库进行数据转换和机器学习算法,并使用遗传编程随机全局 […]
自动化机器学习 (AutoML) 指的是在用户很少参与的情况下,自动为预测建模任务发现高性能模型的技术。Auto-Sklearn 是一个用于在 Python 中执行 AutoML 的开源库。它利用流行的 Scikit-Learn 机器学习库进行数据转换和机器学习算法,并使用贝叶斯优化搜索程序 […]
超参数优化是指执行搜索以发现导致模型在特定数据集上获得最佳性能的一组特定模型配置参数。有许多方法可以执行超参数优化,尽管现代方法(如贝叶斯优化)快速而有效。Scikit-Optimize 库是一个 […]
机器学习模型的性能可以根据模型的偏差和方差来表征。高偏差模型对将输入映射到数据集中的输出的潜在函数的形式做出强假设,例如线性回归。高方差模型是 […]
分类算法学习如何为示例分配类标签,尽管它们的决策可能看起来不透明。理解分类算法决策的一个流行诊断是决策边界。这是一个图,显示了拟合的机器学习算法如何在输入特征空间中以粗糙网格进行预测。决策 […]