时间序列预测可以被构建为一个监督学习问题。将时间序列数据重新构建,可以让你接触到针对你的问题的一整套标准线性与非线性机器学习算法。在本帖中,你将发现如何将你的时间序列问题重新构建为一个监督学习问题,用于 […]
时间序列预测可以被构建为一个监督学习问题。将时间序列数据重新构建,可以让你接触到针对你的问题的一整套标准线性与非线性机器学习算法。在本帖中,你将发现如何将你的时间序列问题重新构建为一个监督学习问题,用于 […]
时间序列预测是机器学习中一个常常被忽视的重要领域。它之所以重要,是因为有许多预测问题都涉及到时间成分。这些问题之所以被忽视,是因为正是这个时间成分使得时间序列问题更难处理。在本帖中,你将发现时间 […]
机器学习可以应用于时间序列数据集。这些问题是预测数值或分类值,但数据行是按时间顺序排列的。使用机器学习进行时间序列预测时遇到的一个问题是,难以找到高质量的标准数据集进行练习。在本帖中, […]
机器学习播客现在已经普及开来。现在有足够多的人对这个小众的极客话题感兴趣,以至于有了专门讨论预测建模的方方面面的播客。现在是开始并在这个令人惊叹的领域工作的最佳时机。在本帖中,我想 […]
在应用机器学习方面取得进步的关键在于在大量不同的数据集上进行练习。这是因为每个问题都是不同的,需要细微不同的数据准备和建模方法。在本帖中,你将发现 10 个可以用于练习的顶级标准机器学习数据集。让我们开始吧。更新 2018 年 3 月:已添加 […]
32 个技巧、窍门和窍门,可用于做出更好的预测。机器学习最有价值的部分是预测建模。这是对经过历史数据训练并在新数据上进行预测的模型进行开发。在预测建模方面,最重要的问题是:如何 […]
时间序列预测是一个难题。与分类和回归不同,时间序列数据还增加了时间维度,这使得观测值具有排序。这会将行变成一个序列,需要仔细和专门的处理。在本帖中,你将发现用于 R 中的时间序列分析和预测的顶级书籍。这些 […]
让混淆矩阵不那么令人困惑。混淆矩阵是一种总结分类算法性能的技术。如果每个类别的观测值数量不相等,或者你的数据集中有两个以上的类别,那么仅凭分类准确率可能会产生误导。计算混淆矩阵可以为你提供 […]
分步从零开始用 Python 实现堆叠集成。集成方法是提高机器学习问题预测性能的绝佳方式。堆叠泛化或堆叠是一种集成技术,它使用一个新模型来学习如何最好地组合在你的数据集上训练的两个或多个模型的预测。在 […]
决策树可能会受到高方差的影响,这使得它们的结果对所使用的具体训练数据非常敏感。通过从训练数据的样本中构建多个模型(称为装袋)可以减少这种方差,但树之间高度相关。随机森林是装袋的扩展,除了基于多个 […]