作者归档 | Vinod Chugani

lan-deng-eAWFUVw9OX0-unsplash

填补空白:机器学习中插补技术的比较指南

在我们之前对 Lasso、Ridge 和 ElasticNet 等正则化回归模型进行的探讨中,我们展示了这些模型在处理多重共线性方面的有效性,使我们能够利用更广泛的特征来提升模型性能。在此基础上,我们现在将解决数据预处理中的另一个关键问题——处理缺失值。缺失数据会严重影响 […]

继续阅读
ryan-stone-sOLbaTbs5mU-unsplash

在大数据集中检测和克服完全多重共线性

统计学家和数据科学家面临的一个重大挑战是多重共线性,特别是其最严重的形式——完全多重共线性。这个问题常常在拥有大量特征的大型数据集中 undetected 潜伏,可能伪装自己并扭曲统计模型的結果。在本帖中,我们将探讨检测、处理和优化受此影响的模型的方法 […]

继续阅读
quinten-de-graaf-L4gN0aeaPY4-unsplash

管道的力量

机器学习项目通常需要执行一系列数据预处理步骤,然后是学习算法。单独管理这些步骤可能既麻烦又容易出错。这就是 sklearn pipeline 发挥作用的地方。本文将探讨 pipeline 如何自动化机器学习工作流程中的关键方面,例如数据预处理、特征工程、 […]

继续阅读
joakim-aglo-rr-euqNcCf4-unsplash

捕捉曲线:多项式回归的高级建模

在机器学习中分析变量之间的关系时,我们常常发现直线无法完全解释。这时就需要引入多项式变换,为我们的回归模型增加层次,而不会增加计算的复杂性。通过将我们的特征转换为其多项式对应项——平方、立方及其他高次项——我们赋予了线性模型 […]。

继续阅读
zac-durant-_6HzPU9Hyfg-unsplash

解释线性回归模型中的系数

线性回归模型是机器学习的基础。仅仅拟合一条直线并读取系数就能告诉我们很多信息。但是,我们如何从这些模型中提取和解释系数,以了解它们对预测结果的影响呢?本文将通过探讨各种场景来演示如何解释系数。我们将探讨 […]。

继续阅读

Machine Learning Mastery 是 Guiding Tech Media 的一部分,Guiding Tech Media 是一家领先的数字媒体出版商,专注于帮助人们了解技术。访问我们的公司网站以了解更多关于我们的使命和团队的信息。