Scatter Plot of Dataset With Linear Model and Prediction Interval

机器学习的预测区间

从机器学习的角度来看,预测是一个单一的点,它掩盖了该预测的不确定性。预测区间提供了一种量化和传达预测不确定性的方法。它们与置信区间不同,置信区间旨在量化总体参数(如均值或标准差)的不确定性 […]

继续阅读
Confidence Intervals for Machine Learning

机器学习的置信区间

机器学习的很大一部分涉及估计机器学习算法在未见过的数据上的性能。置信区间是量化估计不确定性的一种方法。它们可用于为来自独立观测样本估计出的总体参数(如均值)添加边界或置信度 […]

继续阅读
A Gentle Introduction to the Bootstrap Method

Bootstrap 方法入门

Bootstrap 方法是一种重采样技术,通过有放回地对数据集进行抽样来估计总体统计量。它可以用来估计诸如均值或标准差之类的汇总统计量。在应用机器学习中,它用于估计机器学习模型在对数据进行预测时的技能 […]

继续阅读
A Gentle Introduction to k-fold Cross-Validation

k折交叉验证入门详解

交叉验证是一种用于估计机器学习模型技能的统计方法。在应用机器学习中,它常用于比较和选择适用于给定预测建模问题的模型,因为它易于理解、易于实现,并且其技能估计的偏差通常较低 […]

继续阅读
A Gentle Introduction to Statistical Hypothesis Tests

统计假设检验入门

数据必须经过解释才能增加意义。我们可以通过假设一种特定的结果结构来解释数据,并使用统计方法来确认或拒绝该假设。该假设称为假设,用于此目的的统计检验称为统计假设检验。每当我们想做出声称 […]

继续阅读
A Gentle Introduction to Normality Tests in Python

Python 正态性检验简明入门

在处理样本数据时,一个重要的决策点是是使用参数统计方法还是非参数统计方法。参数统计方法假设数据具有已知且特定的分布,通常是高斯分布。如果数据样本不是高斯分布,那么参数统计检验的假设就会被违反,需要使用非参数 […]

继续阅读
A Gentle Introduction to Nonparametric Statistics

非参数统计简明介绍

统计学和统计方法领域有很大一部分是针对具有已知分布的数据。我们已经知道或可以轻松识别其分布的数据样本称为参数数据。在常见情况下,参数一词通常用于指从高斯分布中抽取的数据 […]

继续阅读

Machine Learning Mastery 是 Guiding Tech Media 的一部分,Guiding Tech Media 是一家领先的数字媒体出版商,专注于帮助人们了解技术。访问我们的公司网站以了解更多关于我们的使命和团队的信息。