应用机器学习需要管理不确定性。机器学习项目中的不确定性来源有很多,包括特定数据值中的方差、从域中收集的数据样本,以及由此类数据构建的任何模型的不足之处。管理预测中机器学习固有的不确定性 [...]

应用机器学习需要管理不确定性。机器学习项目中的不确定性来源有很多,包括特定数据值中的方差、从域中收集的数据样本,以及由此类数据构建的任何模型的不足之处。管理预测中机器学习固有的不确定性 [...]
概率是量化不确定性的数学领域。它无疑是机器学习领域的支柱,许多人建议在开始之前将其作为先修科目。这是误导性的建议,因为概率对于实践者来说,一旦他们有了应用机器学习的背景,理解起来会更有意义 [...]
机器学习是一个计算机科学领域,关注开发能够从数据中学习的系统。与统计学和线性代数一样,概率是支持机器学习的另一个基础领域。概率是量化不确定性的数学领域。机器学习的许多方面都是不确定的,包括最关键的问题观测 [...]
朴素分类器是一种简单的分类模型,它对问题几乎没有或完全没有假设,其性能为在数据集上评估的所有其他模型提供了基准。有不同的策略可以用于朴素分类器,并且有些策略比其他策略更好,具体取决于 [...]
在统计学和机器学习中,对变量进行线性变换或映射是很常见的。例如,对特征变量进行线性缩放。我们直观地认为,缩放值的均值与原始变量值均值的缩放值相同。这使得 [...]
如何在 Python 中对概率预测进行评分,并培养对不同指标的直觉。预测分类问题的概率而不是类别标签,可以为预测提供额外的细微差别和不确定性。增加的细微差别允许使用更复杂的指标来解释和评估预测的概率。总的来说,用于 [...]
对于分类问题,与其直接预测类别值,不如预测观测值属于每个可能类别的概率可能更方便。预测概率提供了一些灵活性,包括如何解释概率、呈现带有不确定性的预测,以及提供更细致的方式来评估模型技能。预测 [...]
对于分类问题,与其直接预测类别,不如预测观测值属于每个类别的概率可能更灵活。这种灵活性来自于概率可以通过不同的阈值来解释,这使得模型的使用者可以权衡模型错误所涉及的关注点, [...]
我最近通过电子邮件收到了以下问题:Jason,你好,一个快速的问题。类别不平衡的情况:90 个赞成,10 个反对。在这种情况下,我们如何计算随机猜测的准确性?我们可以使用一些基本概率来回答这个问题(我打开了 Excel 并输入了一些数字)。让我们 [...]