学习和实践机器学习的一个有价值的练习是研究其他人如何应用方法和解决问题。这很有价值,因为你可以了解新的流程、软件、图表和算法。但最宝贵的部分在于对机器学习问题解决方法的新思考方式 […]
学习和实践机器学习的一个有价值的练习是研究其他人如何应用方法和解决问题。这很有价值,因为你可以了解新的流程、软件、图表和算法。但最宝贵的部分在于对机器学习问题解决方法的新思考方式 […]
您是一名 Java 程序员,并希望开始或练习机器学习?编写利用机器学习的程序是学习机器学习的最佳方式。您可以从头开始编写算法,但如果您利用现有的开源库,可以取得更大的进步。在 […]
机器学习模型是参数化的,因此它们的行为可以针对特定问题进行调整。模型可以有很多参数,找到最佳参数组合可以被视为一个搜索问题。在本帖中,您将使用 scikit-learn 发现如何在 Python 中调整机器学习算法的参数 […]
并非所有数据属性都生而平等。对于数据集中的属性或列而言,越多并不总是越好。在本帖中,您将在使用 scikit-learn 库创建机器学习模型之前,发现如何选择数据中的属性。让我们开始吧。更新:有关功能选择的最新教程 […]
在构建模型之前,必须准备好数据。数据准备过程可以包括三个步骤:数据选择、数据预处理和数据转换。在本帖中,您将发现两种简单的数据转换方法,您可以在 Python 中使用 scikit-learn 将它们应用于您的数据。让我们开始吧。更新:请参阅此帖以了解 […]
在构建机器学习模型之前,您需要将数据加载到内存中。在本帖中,您将了解如何在 Python 中使用 scikit-learn 为机器学习加载数据。让我们开始吧。更新 2018 年 3 月:添加了下载数据集的备用链接,因为原始链接似乎已被删除。打包数据集 […]
Data Origami 是 Cameron Davidson-Pilon 的一个新网站,提供数据科学屏幕录像。这是一个很棒的想法,也很酷的网站。Cameron 好心地给了我网站的访问权限,以便我进行评论。我观看了所有我能看的视频,并写下了我所有的笔记,并且 […]
Julia Evans 最近发表了一篇题为“机器学习不是 Kaggle 竞赛”的帖子。这是一个有趣的帖子,因为它指出了一个重要的事实。如果你想用机器学习解决业务问题,在 Kaggle 竞赛中表现出色并不代表你有相应的技能。其原理是,所需的工作 […]
无论您的技能水平如何,在线社区在机器学习中都非常有价值。原因在于,就像编程一样,您永不停止学习。您不可能什么都知道,总有新的算法、新的数据和新的组合可以发现和练习。社区很有帮助。您可以得到问题的解答,也可以通过回答别人的问题来学习 […]
R 是一个强大的数据分析和机器学习平台。它是我的主要工作平台,用于竞赛和咨询工作。原因在于,在同一平台上提供了大量强大的算法。在本帖中,我想指出一些您可以用来入门的资源 […]