这是 Kevin Dalias 的客座文章。我最近有机会参加了在圣克拉拉举行的 Strata 2014 大会,这是我第一次参加这个会议,我努力参加了尽可能多的会议,以了解如今数据科学的真正驱动力。当然,我听了很多[…]
这是 Kevin Dalias 的客座文章。我最近有机会参加了在圣克拉拉举行的 Strata 2014 大会,这是我第一次参加这个会议,我努力参加了尽可能多的会议,以了解如今数据科学的真正驱动力。当然,我听了很多[…]
Phil Brierley 赢得了 Heritage Health Prize Kaggle 机器学习竞赛。Phil 接受了机械工程师的培训,并且在他的公司 Tiberius Data Mining 中拥有数据挖掘方面的经验。他现在主要使用 R,并在 Another Data Mining Blog 上写博客。2013 年 10 月,他在墨尔本 R 用户特别兴趣小组[…]
当您为分类问题构建模型时,您几乎总是希望将该模型的准确性视为所有预测中正确预测的数量。这就是分类准确性。在之前的帖子中,我们已经研究了如何评估模型在未见过的[…]
这是 Artem Yankov 的项目聚焦。您能自我介绍一下吗?我叫 Artem Yankov,在过去 3 年里一直在 Badgeville 担任软件工程师。我在那里使用 Ruby 和 Scala,尽管我之前的经验包括使用各种语言,例如:汇编、C/C++、Python、Clojure 和 JS。我[…]
数据挖掘的承诺是算法会处理数据并发现您可以利用的有趣模式。这方面的典范是购物篮分析(Wikipedia 称之为亲和力分析)。给定一堆交易记录,发现可以用于商店的有趣购买模式,例如优惠[…]
这是 Konstantin Slisenko 的项目聚焦,他是一位程序员和机器学习爱好者。您能自我介绍一下吗?我叫 Konstantin Slisenko,来自白俄罗斯。我毕业于白俄罗斯国立信息学和无线电电子大学。我目前正在攻读硕士学位。我是一名 Java 开发人员,在 JazzTeam 公司工作。我喜欢[…]
在处理问题时,您总是希望充分利用手头的数据。您希望获得尽可能高的准确性。通常,最大的收获在于更好地理解您正在解决的问题。这就是为什么我强调您在前期花费大量时间来定义您的[…]
当我刚开始接触机器学习时,我是手工实现算法的。这非常缓慢。当时我是一名糟糕的程序员。我试图从书中理解算法、如何在问题中使用它们以及如何编写代码——所有这些都同时进行。这[…]
当您开始使用 Weka 时,您可能会感到不知所措。有太多的数据集、太多的过滤器和太多的算法可供选择。选择太多了。您可能要做的事情太多了。结构化的流程是关键。我曾谈过流程以及像[…]
刚开始接触机器学习时,您会加载一个数据集并尝试不同的模型。您可能会想,为什么我不能用所有数据构建一个模型并在同一数据集上进行评估呢?这似乎很合理。训练模型的数据越多越好,对吗?评估模型以及[…]