Controlled Experiments in Machine Learning

机器学习中的受控实验

系统性实验是应用机器学习的关键部分。鉴于机器学习方法的复杂性,它们难以进行正式的分析。因此,我们必须通过经验来了解算法在我们特定问题上的行为。我们通过控制实验来做到这一点。在本教程中,您将了解控制实验所起的重要作用 […]

继续阅读
Statistical Significance Tests for Comparing Machine Learning Algorithms

用于比较机器学习算法的统计显著性检验

比较机器学习方法和选择最终模型是在应用机器学习中常见的操作。模型通常使用重采样方法(例如 k 折交叉验证)进行评估,通过这种方法计算出平均技能分数并直接进行比较。虽然简单,但这种方法可能具有误导性,因为很难知道平均值之间的差异 […]

继续阅读
A Gentle Introduction to the Chi-Squared Test for Machine Learning

机器学习卡方检验简明入门

应用机器学习中的一个常见问题是确定输入特征是否与要预测的结果相关。这就是特征选择问题。在分类问题中,当输入变量也是分类变量时,我们可以使用统计检验来确定输出变量是否与 […]

继续阅读
A Gentle Introduction to Statistical Sampling and Resampling

统计抽样与重抽样入门

数据是应用机器学习的货币。因此,有效收集和使用数据至关重要。数据采样是指从领域中选择观测值的统计方法,目的是估计总体参数。而数据重采样是指经济地使用收集到的数据集来改进 […]

继续阅读
Line Plot of the Chi-Squared Probability Density Function

统计数据分布入门

数据样本会形成一个分布,迄今为止最知名的分布是高斯分布,通常称为正态分布。该分布提供了一个参数化的数学函数,可以用来计算样本空间中任何单个观测值的概率。该分布描述了分组或密度 […]

继续阅读
Example of a Box and Whisker Plot

Python 数据可视化方法简介

有时,如果不以图表和图形等可视化形式查看数据,数据就无法理解。能够快速地为自己和他​​人可视化数据样本,是在应用统计学和应用机器学习中都非常重要的技能。在本教程中,您将发现五种 […]

继续阅读

Machine Learning Mastery 是 Guiding Tech Media 的一部分,Guiding Tech Media 是一家领先的数字媒体出版商,专注于帮助人们了解技术。访问我们的公司网站以了解更多关于我们的使命和团队的信息。