32 个可用于改进预测的技巧、窍门和 hacks。机器学习中最有价值的部分是预测建模。这是对历史数据进行训练并在新数据上进行预测的模型的开发。在预测建模方面,首要问题是:如何 […]

32 个可用于改进预测的技巧、窍门和 hacks。机器学习中最有价值的部分是预测建模。这是对历史数据进行训练并在新数据上进行预测的模型的开发。在预测建模方面,首要问题是:如何 […]
时间序列预测是一个困难的问题。与分类和回归不同,时间序列数据还增加了一个时间维度,该维度对观测值施加了排序。这会将行变成一个序列,需要仔细和特定的处理。在这篇文章中,您将发现用于 R 中时间序列分析和预测的顶级书籍。这些 […]
让混淆矩阵不再令人困惑。混淆矩阵是一种总结分类算法性能的技术。如果每类的观测值数量不相等,或者数据集中有超过两类,仅凭分类准确率可能会产生误导。计算混淆矩阵可以为您提供 […]
分步用 Python 从零开始编写堆叠集成。集成方法是在您的机器学习问题上改进预测性能的绝佳方法。堆叠泛化(或简称堆叠)是一种集成技术,它使用一个新模型来学习如何最好地组合在您的数据集上训练的两个或多个模型的预测。在 […]
决策树可能存在高方差问题,这使得其结果对使用的特定训练数据很敏感。通过从训练数据样本中构建多个模型(称为 bagging)可以减少这种方差,但树之间高度相关。随机森林是 bagging 的一个扩展,它除了基于多个 […]
决策树是一种简单而强大的预测建模技术,但它们容易出现高方差。这意味着对于不同的训练数据,树的结果可能非常不同。一种使决策树更鲁棒并获得更好性能的技术称为自助聚合(bootstrap aggregation),简称 bagging。在本教程中,您将发现 […]
决策树是一种强大的预测方法,并且非常受欢迎。它们之所以受欢迎,是因为最终模型易于被从业者和领域专家理解。最终的决策树可以确切地解释为什么会做出某个特定的预测,使其在实际应用中极具吸引力。决策树也为 […]
反向传播算法用于经典的前馈人工神经网络。它是用于训练大型深度学习网络的仍然有效技术。在本教程中,您将了解如何使用 Python 从零开始为神经网络实现反向传播算法。完成本教程后,您将了解:如何进行前向传播 […]
K-近邻算法的一个限制是,您必须保留大量训练示例的数据库才能进行预测。学习向量量化(Learning Vector Quantization)算法通过学习一个更小的、能最好地代表训练数据的模式子集来解决这个问题。在本教程中,您将发现如何实现学习向量量化 […]
感知器算法是最简单的一种人工神经网络。它是一个单神经元模型,可用于二分类问题,并为以后开发更大的网络奠定基础。在本教程中,您将了解如何使用 Python 从零开始实现感知器算法。完成之后 […]