作者归档 | Jason Brownlee

Line Plot of the Chi-Squared Probability Density Function

统计数据分布入门

数据样本会形成一个分布,其中最著名的分布是高斯分布,通常称为正态分布。该分布提供了一个参数化的数学函数,可用于计算来自样本空间的任何单个观测值的概率。该分布描述了分组或密度 […]

继续阅读
Example of a Box and Whisker Plot

Python 数据可视化方法简介

有时,数据在可视化形式(如图表和绘图)出现之前是无法理解的。能够快速地为自己和他人可视化数据样本,是在应用统计学和应用机器学习中一项重要的技能。在本教程中,您将发现五种类型 […]

继续阅读
Scatter Plot of Dataset With Linear Model and Prediction Interval

机器学习的预测区间

从机器学习的角度来看,预测是一个单点,它隐藏了该预测的不确定性。预测区间提供了一种量化和传达预测不确定性的方法。它们不同于置信区间,置信区间则试图量化总体参数(如均值或标准差)的不确定性 […]

继续阅读
Confidence Intervals for Machine Learning

机器学习的置信区间

机器学习的很大一部分涉及估计机器学习算法在未见过的数据上的性能。置信区间是一种量化估计不确定性的方法。它们可用于为从独立观测样本中估计出的总体参数(例如均值)添加界限或可能性 […]

继续阅读
A Gentle Introduction to the Bootstrap Method

Bootstrap 方法入门

Bootstrap 方法是一种重采样技术,用于通过有放回抽样数据集来估计总体的统计量。它可用于估计汇总统计量,例如均值或标准差。它在应用机器学习中用于估计机器学习模型在对数据进行预测时的技能 […]

继续阅读
A Gentle Introduction to k-fold Cross-Validation

k折交叉验证入门详解

交叉验证是一种用于估计机器学习模型技能的统计方法。它在应用机器学习中常用于比较和选择用于特定预测建模问题的模型,因为它易于理解、易于实现,并且与 […] 相比,其技能估计的偏差通常较低。

继续阅读

Machine Learning Mastery 是 Guiding Tech Media 的一部分,Guiding Tech Media 是一家领先的数字媒体出版商,专注于帮助人们了解技术。访问我们的公司网站以了解更多关于我们的使命和团队的信息。