作者归档 | Jason Brownlee

thomas-lipke-oIuDXlOJSiE-unsplash

如何在 Python 中生成随机数

随机性的使用是机器学习算法配置和评估的重要组成部分。从人工神经网络中权重的随机初始化,到将数据随机划分为训练集和测试集,再到随机梯度下降中训练数据集的随机洗牌,生成随机数以及 […]

继续阅读
Statistics for Evaluating Machine Learning Models

评估机器学习模型的统计方法

Tom Mitchell 1997 年的经典著作《机器学习》提供了一章专门介绍用于评估机器学习模型的统计方法。统计学提供了一套重要的工具,用于机器学习项目的每个步骤。如果没有统计方法,从业者无法有效地评估机器学习模型的技能。不幸的是,统计学是 […]

继续阅读
Controlled Experiments in Machine Learning

机器学习中的受控实验

系统性实验是应用机器学习的关键部分。鉴于机器学习方法的复杂性,它们抵制形式化的分析方法。因此,我们必须通过经验来了解算法在我们特定问题上的行为。我们通过受控实验来实现这一点。在本教程中,您将发现受控实验扮演的重要角色 […]

继续阅读
Statistical Significance Tests for Comparing Machine Learning Algorithms

用于比较机器学习算法的统计显著性检验

在应用机器学习中,比较机器学习方法和选择最终模型是一项常见操作。模型通常使用重采样方法(如 k 折交叉验证)进行评估,从这些方法中计算出平均技能得分并直接进行比较。虽然简单,但这种方法可能会产生误导,因为很难知道平均值之间的差异 […]

继续阅读
A Gentle Introduction to the Chi-Squared Test for Machine Learning

机器学习卡方检验简明入门

在应用机器学习中,一个常见的问题是确定输入特征是否与要预测的结果相关。这就是特征选择问题。在分类问题中,当输入变量也是分类变量时,我们可以使用统计检验来确定输出变量是否与 […]

继续阅读
A Gentle Introduction to Statistical Sampling and Resampling

统计抽样与重抽样入门

数据是应用机器学习的货币。因此,有效地收集和使用数据非常重要。数据采样是指用于从领域中选择观测值以估计总体参数的统计方法。而数据重采样是指经济地使用已收集的数据集来改进 […]

继续阅读

Machine Learning Mastery 是 Guiding Tech Media 的一部分,Guiding Tech Media 是一家领先的数字媒体出版商,专注于帮助人们了解技术。访问我们的公司网站以了解更多关于我们的使命和团队的信息。