入门应用机器学习可能很难,尤其是在处理真实世界数据时。机器学习教程通常会建议或要求您在拟合机器学习模型之前以特定方式准备数据。一个很好的例子是对分类数据使用独热编码。为什么需要独热编码? […]

入门应用机器学习可能很难,尤其是在处理真实世界数据时。机器学习教程通常会建议或要求您在拟合机器学习模型之前以特定方式准备数据。一个很好的例子是对分类数据使用独热编码。为什么需要独热编码? […]
入门应用机器学习可能会让人感到困惑。有太多术语要使用,而且许多术语可能没有一致使用。如果您来自另一个可能使用与机器学习相同术语的学科领域,情况尤其如此,但它们 […]
您需要的数据量取决于问题的复杂性和您选择的算法的复杂性。这是事实,但如果您处于机器学习项目的关键阶段,则无济于事。我经常收到的一个常见问题是:我需要多少数据? […]
随机梯度下降是训练深度学习模型的主要方法。梯度下降有三种主要变体,选择哪种可能会令人困惑。在这篇文章中,您将发现一般情况下您应该使用的一种梯度下降类型以及如何配置它。完成此 […]
序列预测与传统的分类和回归问题不同。它要求您考虑观测值的顺序,并使用具有记忆能力的模型,如长短期记忆 (LSTM) 循环神经网络,这些模型可以学习观测值之间的任何时间依赖性。应用 LSTM 来学习如何 […]
序列预测是一个涉及使用历史序列信息来预测序列中下一个值或值的问题。序列可以是像句子中的字母这样的符号,也可以是像价格时间序列中的值这样的实值。在时间序列的上下文中,序列预测可能最容易理解 […]
验证数据集是为训练模型而保留的数据样本,用于在调整模型超参数时估计模型性能。验证数据集不同于测试数据集,测试数据集也从模型训练中保留,但用于提供无偏的 […]
机器学习算法无法直接处理分类数据。分类数据必须转换为数字。当您处理序列分类问题并计划使用深度学习方法(如长短期记忆循环神经网络)时,这一点适用。在本教程中,您将学习如何转换您的输入或 […]
时间序列数据集可能包含趋势和季节性,在建模之前可能需要将其删除。趋势可能导致均值随时间变化,而季节性可能导致方差随时间变化,这两者都将时间序列定义为非平稳。平稳数据集是指均值和 […]
在训练神经网络(如长短期记忆循环神经网络)时,您的序列预测问题的数据可能需要进行缩放。当网络在具有值范围(例如,数量级从十到百)的未缩放数据上拟合时,大型输入可能会减慢 […]