作者归档 | Jason Brownlee

Introduction to Use Parametric Statistical Significance Tests in Python

如何在 Python 中计算参数统计假设检验

参数统计方法通常指那些假设数据样本具有高斯分布的方法。在应用机器学习中,我们需要比较数据样本,特别是样本的均值。也许是为了看看一种技术在一种或多种数据集上是否比另一种技术表现更好。为了量化这个问题和解释结果,[...]

继续阅读
Introduction to Nonparametric Statistical Significance Tests in Python

如何在 Python 中计算非参数统计假设检验

在应用机器学习中,我们经常需要确定两个数据样本是否具有相同或不同的分布。我们可以使用统计显著性检验来回答这个问题,这些检验可以量化样本具有相同分布的可能性。如果数据不具有熟悉的高斯分布,那么我们必须诉诸非参数[...]

继续阅读
A Gentle Introduction to Statistical Hypothesis Tests

统计假设检验入门

数据必须经过解释才能有意义。我们可以通过假设一个特定的结果结构并使用统计方法来确认或拒绝该假设来解释数据。该假设称为假设,用于此目的的统计检验称为统计假设检验。每当我们想做出声明[...]

继续阅读
A Gentle Introduction to Normality Tests in Python

Python 正态性检验简明入门

在使用数据样本时,一个重要的决策点是是使用参数还是非参数统计方法。参数统计方法假设数据具有已知且特定的分布,通常是高斯分布。如果数据样本不是高斯分布,则参数统计检验的假设被违反,非参数[...]

继续阅读
A Gentle Introduction to Nonparametric Statistics

非参数统计简明介绍

统计学和统计方法领域有很大一部分致力于处理分布已知的 数据。我们已经知道或可以轻松识别其分布的数据样本称为参数数据。通常,参数一词用于指来自高斯分布的数据,在常见[...]

继续阅读
Statistics Books for Machine Learning

机器学习统计学书籍

统计方法应用于应用机器学习项目的每一步。这意味着掌握统计学关键发现的基础知识和相关统计方法的工作知识非常重要。不幸的是,许多计算机科学和软件工程学位课程都不包含统计学。即使[...]

继续阅读
A Gentle Introduction to the Central Limit Theorem for Machine Learning

机器学习中心极限定理入门指南

中心极限定理是统计学和机器学习中经常被引用但又被误解的支柱。它经常与大数定律混淆。尽管对于初学者来说,该定理可能显得晦涩难懂,但它对于我们如何以及为何能够推断机器学习模型的性能具有重要意义,例如[...]

继续阅读
A Gentle Introduction to the Law of Large Numbers in Machine Learning

机器学习中的大数定律入门简介

我们有一种直觉,认为更多的观察结果更好。这与我们收集更多数据,我们的数据样本将更能代表问题域的想法相同。统计学和概率论中有一个定理支持这种直觉,它是这两个[...] 的支柱。

继续阅读
Line plot of Gaussian distributions with low and high variance

计算正态汇总统计量的温和介绍

数据样本是从所有可能观察结果或由过程生成的所有可能观察结果中取出的快照。有趣的是,许多观察结果都符合一种称为正态分布或更正式的高斯分布的常见模式或分布。关于高斯分布,人们了解很多,并且[...]

继续阅读
Scatter plot of the test correlation dataset

如何在 Python 中计算变量间的相关性

是否曾查看您的数据并认为缺少了什么,或者它向您隐藏了什么?这是一份深入指南,用于揭示数据集中变量之间的隐藏联系和未知关系。您为什么应该关心?线性回归等机器学习算法不喜欢意外。发现和量化[...] 至关重要。

继续阅读

Machine Learning Mastery 是 Guiding Tech Media 的一部分,Guiding Tech Media 是一家领先的数字媒体出版商,专注于帮助人们了解技术。访问我们的公司网站以了解更多关于我们的使命和团队的信息。