在使用 p 值解释统计假设检验的结果时,这很常见,如果不是标准的话。并非所有统计检验的实现都会返回 p 值。在某些情况下,您必须使用替代方法,例如临界值。此外,在估计来自总体的观测的预期区间时,例如在 […] 中,也会使用临界值。
在使用 p 值解释统计假设检验的结果时,这很常见,如果不是标准的话。并非所有统计检验的实现都会返回 p 值。在某些情况下,您必须使用替代方法,例如临界值。此外,在估计来自总体的观测的预期区间时,例如在 […] 中,也会使用临界值。
数据样本会形成一个分布,其中最著名的分布是高斯分布,通常称为正态分布。该分布提供了一个参数化的数学函数,可用于计算来自样本空间的任何单个观测值的概率。该分布描述了分组或密度 […]
有时,数据在可视化形式(如图表和绘图)出现之前是无法理解的。能够快速地为自己和他人可视化数据样本,是在应用统计学和应用机器学习中一项重要的技能。在本教程中,您将发现五种类型 […]
统计假设检验可用于指示两个样本之间的差异是否是由于随机机会造成的,但不能说明差异的大小。一系列被称为“新统计”的方法正越来越多地被使用,以替代或补充 p 值,以量化 […] 的幅度。
为数据设置上限和下限可能很有用。这些界限可用于帮助识别异常值并设定期望值。对总体观测值的界限称为容差区间。容差区间来自估计统计学的领域。容差区间是 […]
从机器学习的角度来看,预测是一个单点,它隐藏了该预测的不确定性。预测区间提供了一种量化和传达预测不确定性的方法。它们不同于置信区间,置信区间则试图量化总体参数(如均值或标准差)的不确定性 […]
机器学习的很大一部分涉及估计机器学习算法在未见过的数据上的性能。置信区间是一种量化估计不确定性的方法。它们可用于为从独立观测样本中估计出的总体参数(例如均值)添加界限或可能性 […]
Bootstrap 方法是一种重采样技术,用于通过有放回抽样数据集来估计总体的统计量。它可用于估计汇总统计量,例如均值或标准差。它在应用机器学习中用于估计机器学习模型在对数据进行预测时的技能 […]
交叉验证是一种用于估计机器学习模型技能的统计方法。它在应用机器学习中常用于比较和选择用于特定预测建模问题的模型,因为它易于理解、易于实现,并且与 […] 相比,其技能估计的偏差通常较低。
统计学领域很大一部分关注的是假设高斯分布的方法:熟悉的钟形曲线。如果您的数据具有高斯分布,则参数化方法功能强大且易于理解。这激励我们尽可能使用它们。即使您的数据没有高斯分布 […]