在构建机器学习模型之前,您需要将数据加载到内存中。在本文中,您将了解如何使用 scikit-learn 在 Python 中加载机器学习数据。让我们开始吧。2018年3月更新:由于原始数据集似乎已被删除,因此添加了下载数据集的备用链接。打包的数据集 [...]

在构建机器学习模型之前,您需要将数据加载到内存中。在本文中,您将了解如何使用 scikit-learn 在 Python 中加载机器学习数据。让我们开始吧。2018年3月更新:由于原始数据集似乎已被删除,因此添加了下载数据集的备用链接。打包的数据集 [...]
Data Origami 是 Cameron Davidson-Pilon 创建的一个新网站,提供数据科学屏幕录制。这是一个很棒的想法和一个很棒的网站。Cameron 好心地给了我访问该网站的权限,以便我可以对其进行评论。我观看了所有我能看的视频,并写下了我所有的笔记,等等 [...]
Julia Evans 最近发表了一篇题为“机器学习不是 Kaggle 竞赛”的文章。这是一篇有趣的文章,因为它指出了一个重要的事实。如果您想使用机器学习解决业务问题,那么在 Kaggle 竞赛中表现出色并不能很好地证明您的技能。理由是所需的工作 [...]
无论您的技能水平如何,在线社区在机器学习中都非常有价值。原因在于,就像编程一样,您永远不会停止学习。您不可能什么都知道,总有新的算法、新的数据和新的组合需要发现和练习。社区有帮助。您可以得到问题的答案,通过回答别人的问题来学习 [...]
R 是一个强大的数据分析和机器学习平台。它是我进行竞赛和咨询工作的主要工具。原因是它提供了大量强大的算法,所有这些都在一个平台上。在本文中,我想介绍一些您可以用来入门的资源 [...]
David Mimno 是康奈尔大学信息科学系的助理教授。他拥有自然语言处理 (NLP) 的背景和兴趣,特别是主题建模。值得注意的是,他是基于 Java 的 NLP 库 MALLET 的首席维护者。我最近偶然发现 David 的一篇博文,标题是“给机器学习学生的建议 [...]
在选择和准备建模数据之前,您需要了解您有什么。如果您使用 Python 堆栈进行机器学习,那么您可以使用 Pandas 库来更好地了解您的数据。在本文中,您将发现一些快速肮脏的配方 [...]
如果您使用 Python 堆栈来学习和应用机器学习,那么您将想要使用的用于数据分析和数据处理的库是 Pandas。本文将简要介绍 Pandas 库,并引导您开始使用。让我们开始吧。数据 [...]
您必须亲自动手。您可以阅读所有博文和观看所有视频,但除非您开始实践,否则您不会真正开始掌握机器学习。scikit-learn Python 库非常容易上手。尽管如此,我还是看到很多 [...]
什么是最好的机器学习算法?我经常收到这个问题。甚至每天都有。有时这是一个普遍的问题。我认为人们想确保他们正在学习唯一真正的机器学习算法,而不是浪费时间学习其他任何东西。大多数其他时候,它是关于特定的 [...]