在对您的问题中的算法进行抽样检查并调整少数表现更好的算法后,您最终需要选择一到两个最佳模型以继续进行。这个问题称为模型选择,它可能令人头疼,因为您需要在信息不完整的情况下做出选择。这就是您创建的测试工具以及 […]

在对您的问题中的算法进行抽样检查并调整少数表现更好的算法后,您最终需要选择一到两个最佳模型以继续进行。这个问题称为模型选择,它可能令人头疼,因为您需要在信息不完整的情况下做出选择。这就是您创建的测试工具以及 […]
Midwest.io 是于 2014 年 7 月 14 日至 15 日在堪萨斯城举行的一次会议。会议上,Josh Wills 发表了关于构建生产机器学习基础设施所需内容的演讲,题目为“从实验室到工厂:构建生产机器学习基础设施”。Josh Wills 是数据[…]的资深总监。
曾任 Kaggle 职员的 Jeremy Howard 于 2013 年年中在美国大学旧金山分校做了一次演讲。在这次演讲中,他谈到了诸如 Kaggle 举办的机器学习竞赛的更广泛的好处。在这篇文章中,您将发现我从这次演讲中提取的 5 个要点,它们将激励您 […]
预测模型所做的预测并不重要,重要的是对这些预测的使用。Jeremy Howard 是竞争性机器学习平台 Kaggle 的总裁兼首席科学家。2012 年,他在 O’reilly Strata 会议上发表了关于他所称的“传动系统方法”的演讲,用于构建“数据产品” […]
David Kofoed Wind 在 Kaggle 博客 No Free Hunch 上发表了一篇文章,题为“向最佳者学习”。在这篇文章中,David 总结了与参与竞争性机器学习和在其中取得好成绩相关的 6 个关键领域,并引用了表现最佳的 Kaggle 用户的名言。在这篇文章中,您将发现[…]中取得好成绩的关键启发式方法。
如果您可以使用预测模型来查找数据中不存在但可能很有价值的新属性组合,那会怎样?在《应用预测建模》的第 10 章中,Kuhn 和 Johnson 提供了一个案例研究,正是这样做的。这是一个引人入胜且富有创意的例子,说明了如何使用预测[…]
在他们的著作《应用预测建模》中,Kuhn 和 Johnson 早期就对模型预测准确性与模型解释性之间的权衡进行了评论。对于给定的问题,明确模型的优先级是准确性还是可解释性至关重要,以便可以明确而非隐式地进行这种权衡。在这[…]
项目布局对于机器学习项目和软件开发项目一样至关重要。我将其视为语言。项目布局可以整理思路,并为您提供想法的背景,就像知道事物的名称是您思考的基础一样。在这篇文章中,我想强调一些考虑因素 […]
在我参与数据挖掘和机器学习竞赛期间,我一直在考虑自动化我的参与。也许这表明我更想解决构建工具的问题,而不是想解决当前的问题。在处理数据集时,我通常会花 […]
BigML 是一家来自美国俄勒冈州科瓦利斯的崭新而有趣的人工智能即服务公司。在之前的帖子中,我们回顾了 BigML 服务、其主要功能以及您可以在业务、业余项目或向客户展示时使用该服务的方式。在这[…]