您需要了解您的算法在未见过的数据上的表现如何。评估算法表现的最佳方法是为已知道答案的新数据进行预测。次佳方法是使用统计学中的称为重采样方法的巧妙技术,这些技术可让您 [...]
您需要了解您的算法在未见过的数据上的表现如何。评估算法表现的最佳方法是为已知道答案的新数据进行预测。次佳方法是使用统计学中的称为重采样方法的巧妙技术,这些技术可让您 [...]
您用于训练机器学习模型的特征数据对您能达到的性能有很大影响。不相关或部分相关的特征可能会对模型性能产生负面影响。在这篇文章中,您将发现可用于准备 Python 中的机器学习数据的自动特征选择技术 [...]
许多机器学习算法都对您的数据做出了假设。通常,最好以一种方式准备您的数据,以便最好地向您打算使用的机器学习算法展示问题的结构。在这篇文章中,您将发现如何为机器学习准备数据 [...]
人工神经网络是一个迷人的研究领域,尽管初学者可能会觉得它令人生畏。在描述该领域使用的数据结构和算法时,会用到很多专业术语。在这篇文章中,您将获得关于多层 [...] 领域使用的术语和流程的速成课程。
为了从机器学习算法中获得最佳结果,您必须了解您的数据。了解数据的最快方法是使用数据可视化。在这篇文章中,您将确切地发现如何使用 Pandas 在 Python 中可视化您的机器学习数据。让我们开始吧。更新于 2018 年 3 月:添加了 [...]
为了获得最佳结果,您必须了解您的数据。在这篇文章中,您将发现 7 个可以在 Python 中使用的技巧,以更多地了解您的机器学习数据。让我们开始吧。更新于 2018 年 3 月:添加了下载数据集的备用链接,因为原始数据集似乎已被删除。 [...]
Keras 是一个 Python 深度学习库,它提供了对 TensorFlow 等强大数值库的简单便捷的访问。大型深度学习模型需要大量的计算时间来运行。您可以在 CPU 上运行它们,但这可能需要数小时或数天才能得到结果。如果您有 [...]
在开始您的机器学习项目之前,您必须能够加载您的数据。机器学习数据最常见的格式是 CSV 文件。在 Python 中加载 CSV 文件有很多方法。在这篇文章中,您将发现可以使用 [...] 的不同方法来加载。
Python 中两个顶级的数值平台 Theano 和 TensorFlow 为深度学习研究和开发提供了基础。两者都是功能强大的库,但直接使用它们来创建深度学习模型可能会很困难。在这篇文章中,您将发现 Keras Python 库,它提供了一个简洁的 [...]
scikit-learn 库是 Python 中领先的机器学习库。在线文档相当不错,但有时可能会感觉零散或受限于狭窄的示例。在这篇文章中,您将发现 Trent Hauck 的《Scikit-Learn Cookbook》一书,它提供了一个桌面参考,以补充在线文档并帮助您 [...]