在建模时,清理数据样本很重要,以确保观测值能最好地代表问题。有时,数据集可能包含超出预期范围且与其他数据不同的极端值。这些被称为异常值,通常机器学习建模和模型技能在一般情况下会 […]
在建模时,清理数据样本很重要,以确保观测值能最好地代表问题。有时,数据集可能包含超出预期范围且与其他数据不同的极端值。这些被称为异常值,通常机器学习建模和模型技能在一般情况下会 […]
随机性是机器学习的重要组成部分。随机性被用作准备数据和学习映射输入数据到输出数据以进行预测的算法的工具或特征。为了理解机器学习中统计方法的必要性,您必须了解随机性的来源 […]
在为您的预测建模问题开发了机器学习模型之后,您如何知道模型的性能是否良好?这是初学者经常问我的问题。作为初学者,您经常寻求这个问题的答案,例如,您希望有人告诉您一个 […]
当模型测试结果比训练结果差时该怎么办。评估机器学习模型的程序是先在训练数据上拟合和评估它们,然后验证模型在保留的测试数据集上是否具有良好的技能。通常,您会在评估模型在训练 […]
您使用的数据以及如何使用它,很可能会决定您的预测建模问题的成功程度。数据和问题框架可能是您项目中杠杆最大的地方。选择错误的数据或错误的问题框架可能导致模型性能不佳 […]
您是否有一些问题,例如:我的问题最适合什么数据?什么算法最适合我的数据?如何最好地配置我的算法?为什么机器学习专家不能给您一个直接的答案?在这篇文章中,我想帮助您了解为什么没有人 […]
您用于机器学习的开发环境可能与您用于解决预测建模问题的机器学习方法同等重要。我一周会收到几次这样的问题:您的机器学习开发环境是什么?在这篇文章中,您将发现开发 […]
如何使用 scikit-learn 模型在 Python 中预测分类或回归结果。一旦您在 scikit-learn 中选择并拟合了最终的机器学习模型,您就可以使用它来对新的数据实例进行预测。初学者之间对于如何做到这一点存在一些困惑。我经常看到这样的问题:如何 […]
因此,您正在处理一个机器学习问题。我想真正弄清楚您现在所处的位置。让我做一些猜测…… 1) 您有一个问题,所以您有一个需要解决的问题。也许是您的问题,一个想法,一个问题,或者您想解决的事情。 […]
机器学习是一个庞大且跨学科的研究领域。您可以取得令人印象深刻的机器学习成果,并找到解决极具挑战性问题的方案。但这只是更广泛的机器学习领域中一个很小的分支,通常称为预测建模或预测分析。在这篇文章中,您将发现如何改变 […]