您需要了解您的算法在未见过的数据上的表现如何。评估算法性能的最佳方法是为已知答案的新数据进行预测。第二种最佳方法是使用统计学中的巧妙技术,称为重采样方法,这些方法可以让您 […]

您需要了解您的算法在未见过的数据上的表现如何。评估算法性能的最佳方法是为已知答案的新数据进行预测。第二种最佳方法是使用统计学中的巧妙技术,称为重采样方法,这些方法可以让您 […]
用于训练机器学习模型的特征数据对您能达到的性能有巨大影响。不相关或部分相关的特征会负面影响模型性能。在这篇文章中,您将发现可用于准备 Python 机器学习数据的自动特征选择技术 […]
许多机器学习算法都对您的数据做出假设。通常,最好以某种方式准备数据,以最佳方式向您打算使用的机器学习算法展示问题的结构。在这篇文章中,您将发现如何准备您的机器学习数据 […]
为了从机器学习算法中获得最佳结果,您必须了解您的数据。了解您的数据的最快方法是使用数据可视化。在这篇文章中,您将确切地发现如何使用 Pandas 在 Python 中可视化您的机器学习数据。让我们开始吧。更新于 2018 年 3 月:已添加 […]
为了获得最佳结果,您必须了解您的数据。在这篇文章中,您将发现可在 Python 中使用的 7 种方法来了解您的机器学习数据。让我们开始吧。更新于 2018 年 3 月:已添加数据集的备用下载链接,因为原始链接似乎已被删除。 […]
在开始您的机器学习项目之前,您必须能够加载您的数据。机器学习数据最常见的格式是 CSV 文件。在 Python 中加载 CSV 文件有多种方法。在这篇文章中,您将发现可以使用的不同方法来加载 […]
scikit-learn 库是 Python 中机器学习的顶级库。在线文档相当不错,但有时会感觉零散或仅限于狭窄的示例。在这篇文章中,您将发现 Trent Hauck 的书《Scikit-Learn Cookbook》,它提供了一个桌面参考来补充在线文档并帮助您 […]
scikit-learn 库是日常机器学习和数据科学中最受欢迎的平台之一。原因在于它构建于 Python 之上,而 Python 是一种功能齐全的编程语言。但是,如何开始使用 scikit-learn 进行机器学习?Kevin Markham 是一位数据科学培训师,他创建了一系列 9 […]
您不需要成为一名 Python 开发者就可以开始使用 Python 生态系统进行机器学习。作为一名已经掌握一种或多种编程语言的开发者,您可以非常快速地学会一门新语言,例如 Python。您只需要了解一些 […]
Python 生态系统正在不断发展,并可能成为机器学习的主导平台。采用 Python 进行机器学习的主要理由是它是一种通用编程语言,可用于研究、开发和生产。在这篇文章中,您将发现用于机器学习的 Python 生态系统。让我们开始吧 […]