O’Reilly 的书籍以实用、动手和有用而闻名。特别是“坚果书”和所谓的“动物书”。
O’Reilly 在假期期间推出了一些关于机器学习的新书。
我不想用评论来烦扰您,亚马逊有很多这类评论。在这篇文章中,我们将快速浏览这些新的机器学习书籍,看看在假期期间哪些值得阅读。
Thoughtful Machine Learning: A Test-Driven Approach
由 Matthew Kirk 撰写,于 2014 年 10 月出版。
通过从头开始实现算法来学习机器学习,并使用测试驱动开发来验证实现。
涵盖算法,如
- K-近邻分类
- 朴素贝叶斯分类
- 隐马尔可夫模型
- 支持向量机
- 神经网络
- K-均值和期望最大化聚类
- 核岭回归
令人惊讶的是,它使用 Ruby 而不是 Python(这和我为 Clever Algorithms 所做的选择一样)。
它看起来很有趣,并且可能非常适合那些有兴趣直接上手编码的人。
Data Science at the Command Line: Facing the Future with Time-Tested Tools
由 Jeroen Janssens 撰写,于 2014 年 10 月出版。
这本书教你如何使用常用(以及一些不太常用)的命令行工具来执行常见的机器学习任务。
这本书采用 Hilary Mason 和 Chris Wiggins 的 OSEMN 框架(发音为“awesome”)。有关 OSEMN 的更多信息,请参阅 Mason 和 Wiggins 2010 年的帖子“A Taxonomy of Data Science”。
- 获取数据
- 清理数据
- 探索数据
- 建模数据
- 解读数据
非常实用且动手。如果您已经花费大量时间在命令行上(您是天生的 Unix 用户)和/或您更喜欢处理大型数据集而不是内存中的样本,那么这本书可能更有用。
即将推出
我们也可以看看 O’Reilly 明年将推出什么。
Introduction to Machine Learning with Python
由 Sarah Guido 撰写,将于 2015 年 6 月出版。
这本书目前还没有太多介绍,它
还有 6 个月才出版。
它看起来像是上面“Thoughtful Machine Learning”的一个变体,带有 Python 示例。
敬请关注。
Machine Learning for Healthcare
由 John Schrom 撰写,将于 2015 年 6 月出版。
同样,在这个阶段关于这本书的内容不多。这是另一本实用的书籍,它在研究医疗保健行业的问题和案例研究的同时教授机器学习。
一个迷人的想法和一个日益热门的领域。我一直关注这本书。
经典
在谈论 O’Reilly 的机器学习书籍时,我们也应该提及一些经典的、非常值得阅读的书籍。
集体智慧编程:构建智能 Web 2.0 应用
由 Toby Segaran 撰写,于 2007 年 8 月出版。
我认为这是 O’Reilly 进军机器学习书籍的开端。它非常实用,通过一个接一个的例子,教你如何为特定且有趣的问题(主要基于网络数据)从头开始实现算法。
它经常因缺乏参考文献而受到批评,但我认为七年后,对于初学者来说,它仍然是一本极好的机器学习入门书籍。我预计它很快就会更新。
《黑客的机器学习》(Machine Learning for Hackers)
由 Drew Conway 和 John Myles White 撰写,于 2012 年 2 月发布。
它提供了对应用机器学习的精彩介绍,并提供 R 语言的实际操作示例。我很喜欢这本书。它是一本很棒的书,非常注重实践。强烈推荐。
Machine Learning for Email: Spam Filtering and Priority Inbox
同样由 Drew Conway 和 John Myles White 撰写,于 2011 年 11 月出版。
它是《Machine Learning for Hackers》的前身,非常相似,但篇幅较短,专注于处理电子邮件的示例。
我认为,如果您阅读了《Machine Learning for Hackers》,可以放心忽略这本书。
Doing Data Science: Straight Talk from the Frontline
由 Cathy O’Neil 和 Rachel Schutt 撰写。
这是另一本实用的机器学习书籍,这次是基于作者在哥伦比亚大学教授的一门课程。
每一章都涵盖了课程期间特邀讲师介绍的主题。它们大多经过深思熟虑且有趣,具有出色的广度。
我非常喜欢这本书。正如副标题和出版商所承诺的那样,它很实用,并且涉及了其他书籍没有涵盖的主题,例如成为一名优秀的数据科学家和数据科学团队所需的技能。
如果您对数据科学或应用机器学习非常认真,那么这本书值得推荐。
Agile Data Science: Building Data Analytics Applications with Hadoop
由 Russell Jurney 撰写,于 2013 年 10 月出版。
这是一本有趣的书,它涉及一系列不同的技术来完成应用数据科学的工作。它涉及 Apache Pig(用于大数据)、Python 和 D3.js(用于可视化)等技术。
有趣的是,这本书中的所有示例也都可以作为 Heroku 应用程序使用。
这是一本有趣的读物,更多地涵盖了您可以使用的各种工具以及如何使用它们,而不是机器学习本身。
总结
我们快速浏览了几本 O’Reilly 新推出的机器学习书籍。我们可以看到,出版商将数据、大数据和机器学习作为重点,提供了一个出色的解决方案,并且还有许多新书即将推出。
我们还回顾了一些 O’Reilly 提供的经典机器学习和数据科学书籍,它们可能会激发您在假期阅读的兴趣。
假期是深入学习和阅读一本实用机器学习书籍的好时机。重燃您对机器学习的热情,并为 2015 年做好准备。
选择一本书,从头到尾阅读。
您选择了哪本书?
我选择了《Data Science at the Command Line》。我几周前收到了我的副本。到目前为止,它很好。