存档 | 统计学

Scatter Plot of Dataset With Linear Model and Prediction Interval

机器学习的预测区间

从机器学习的角度来看,预测是一个隐藏着预测不确定性的单个点。预测区间提供了一种量化和传达预测不确定性的方法。它们不同于置信区间,置信区间则旨在量化总体参数(例如均值或标准差)的不确定性。 […]

继续阅读
Confidence Intervals for Machine Learning

机器学习的置信区间

机器学习的很大一部分涉及估计机器学习算法在未见过的数据上的性能。置信区间是一种量化估计不确定性的方法。它们可用于为从独立观测样本中估计出的总体参数(如均值)添加边界或似然。 […]

继续阅读
A Gentle Introduction to the Bootstrap Method

Bootstrap 方法入门

Bootstrap 方法是一种重采样技术,用于通过有放回地抽取数据集来估计总体的统计量。它可用于估计均值或标准差等汇总统计量。在应用机器学习中,它用于估计机器学习模型在数据上进行预测时的技能。 […]

继续阅读
A Gentle Introduction to k-fold Cross-Validation

k折交叉验证入门详解

交叉验证是一种用于估计机器学习模型技能的统计方法。在应用机器学习中,由于它易于理解、易于实现,并且得出的技能估计的偏差通常较低,因此常用于比较和选择针对特定预测建模问题的模型。[…]

继续阅读
Introduction to Use Parametric Statistical Significance Tests in Python

如何在 Python 中计算参数统计假设检验

参数统计方法通常是指那些假定数据样本具有高斯分布的方法。在应用机器学习中,我们需要比较数据样本,特别是样本的均值。也许是为了查看一种技术在处理一个或多个数据集时是否比另一种技术表现更好。为了量化这个问题并解释结果, […]

继续阅读
Introduction to Nonparametric Statistical Significance Tests in Python

如何在 Python 中计算非参数统计假设检验

在应用机器学习中,我们经常需要确定两个数据样本是否具有相同或不同的分布。我们可以通过统计显著性检验来回答这个问题,这些检验可以量化样本具有相同分布的可能性。如果数据不具有熟悉的高斯分布,那么我们必须诉诸于非参数 […]

继续阅读
A Gentle Introduction to Statistical Hypothesis Tests

统计假设检验入门

数据必须被解释才能增加意义。我们可以通过假设一个特定的结果结构并使用统计方法来确认或拒绝该假设来解释数据。该假设称为假设,用于此目的的统计检验称为统计假设检验。每当我们想提出主张时 […]

继续阅读
A Gentle Introduction to Normality Tests in Python

Python 正态性检验简明入门

在使用样本数据时,一个重要的决策点是是否使用参数统计方法或非参数统计方法。参数统计方法假定数据具有已知且特定的分布,通常是高斯分布。如果数据样本不是高斯的,那么参数统计检验的假设就会被违反,因此需要使用非参数 […]

继续阅读
A Gentle Introduction to Nonparametric Statistics

非参数统计简明介绍

统计学和统计方法很大一部分致力于处理具有已知分布的数据。我们已经知道或可以轻松识别其分布的数据样本称为参数数据。通常,参数用于指代来自高斯分布的数据,在常见 […]

继续阅读

Machine Learning Mastery 是 Guiding Tech Media 的一部分,Guiding Tech Media 是一家领先的数字媒体出版商,专注于帮助人们了解技术。访问我们的公司网站以了解更多关于我们的使命和团队的信息。