作为一名机器学习从业者,掌握统计学基础知识是必不可少的。这本书《All of Statistics》专门为那些对数据挖掘和机器学习感兴趣的计算机科学本科生提供了概率和统计学基础。因此,它经常被推荐为一本 […]
作为一名机器学习从业者,掌握统计学基础知识是必不可少的。这本书《All of Statistics》专门为那些对数据挖掘和机器学习感兴趣的计算机科学本科生提供了概率和统计学基础。因此,它经常被推荐为一本 […]
假设检验的统计功效是在存在真实效应时检测到该效应的概率。功效可以针对已完成的实验进行计算和报告,以说明人们对研究结果的结论可能有多大信心。它也可以 […]
统计假设检验会根据一个假设(例如变量之间没有关联或组之间没有差异)来报告观察结果的可能性。如果关联或差异具有统计学意义,假设检验不会对效应的大小进行评论。这突出表明需要标准化的计算和报告方法 […]
相关性是衡量两个变量之间关联程度的指标。当两个变量都具有众所周知的高斯分布时,它很容易计算和解释。当我们不知道变量的分布时,我们必须使用非参数秩相关方法。在本教程中,您将发现用于量化 […]的秩相关方法。
统计学书籍浩如烟海;您从何处着手?选择一本入门统计学书籍的一个大问题是,一本书可能存在两个常见问题之一。它可能是一本数学教科书,其中包含每种统计方法的推导、特例和证明,而对 […]的思路却很少。
随机性的使用是配置和评估机器学习算法的重要组成部分。从人工神经网络权重的随机初始化,到将数据随机划分为训练集和测试集,再到随机打乱随机梯度下降中的训练数据集,生成随机数和 […]
Tom Mitchell 1997 年的经典著作《Machine Learning》中专门有一个章节介绍用于评估机器学习模型的统计方法。统计学提供了机器学习项目每个步骤的重要工具集。没有统计学方法的帮助,机器学习从业者就无法有效地评估机器学习模型的技能。不幸的是,统计学是一门 […]
机器学习从业者传统上注重算法,并务实地关注结果和模型技能,而非模型可解释性等其他方面。统计学家以应用统计学和统计学习的名义从事着非常相似的建模问题。他们拥有数学背景,更侧重于 […]
统计学是一套工具,可用于回答有关数据的重要问题。您可以使用描述性统计方法将原始观测值转化为您可以理解和共享的信息。您可以使用推断性统计方法从少量数据推断到整个领域。在这篇文章中, […]
统计学和机器学习是两个非常密切相关的领域。事实上,两者之间的界限有时非常模糊。尽管如此,有些方法明显属于统计学领域,它们不仅有用,而且在机器学习项目上工作时至关重要。可以公平地说 […]