启动机器学习:书籍评论

Louis Dorard 发布了他的书,名为《机器学习的启动》。这本书为开发人员和初创公司提供机器学习领域的入门介绍,重点关注预测 API。

我刚刚读完这本书,想分享一些我的看法。如果您有兴趣,我已经评阅了 Louis 在其网页上提供的样本,该样本涵盖了前两章。

Bootstrapping Machine Learning

机器学习的启动

概述

这本书共分为八章,如下所示。

  1. 引言
  2. 机器学习与人工智能
  3. 概念
  4. 示例
  5. 将机器学习应用于您的领域
  6. 预测 API
  7. 案例研究:优先级收件箱
  8. 总结

预测 API

Louis 在第三章中对预测 API 进行了分类。我不清楚这是他自己的分类还是该领域通用的分类,但无论如何我都觉得它很有用。他将预测 API 分类如下:

  • 专业 API:这些 API 解决特定的问题,例如对推文进行情感分析或对图像进行人脸识别。
  • 通用 API:这些是通用的机器学习 API,您上传数据集,系统就会返回预测结果。Google Prediction API 就是一个例子。
  • 算法 API:这些是通用的 API,提供算法的详细信息,例如它们的配置参数以及算法之间的选择。我认为 BigML 是这种 API(CART)的例子,但 Louis 认为 BigML 是通用 API。

Louis 认为托管预测 API 的必要性在于,如果您没有时间弄清楚机器学习算法如何工作,那么您也没有时间弄清楚如何扩展它们。我喜欢这一点,它强调了开发人员或初创公司专注于其核心产品并快速行动的必要性。

问题分解

Louis 在第四章中提供了商业和应用领域的一些机器学习问题示例。这些例子具体说明了机器学习适用的问题类型以及如何思考这些问题。Louis 提供了一个框架,让您可以以结构化的方式思考机器学习问题,我非常喜欢。总之,该框架是:

  • :这个例子涉及到谁?
  • 描述:背景是什么,我们正在尝试
  • 做什么?
  • 提出的问题:您会用通俗的英语写出预测模型应该回答的问题吗?
  • 机器学习问题类型:分类还是回归?
  • 输入:我们正在对什么进行预测?
  • 特征:我们考虑输入的哪些方面,以及在它们的表示中我们拥有哪些类型的信息?
  • 输出:预测模型返回什么?
  • 数据收集:如何获得示例输入-输出对来训练预测模型?
  • 预测的用途:何时进行预测,以及一旦获得预测该怎么办?

应用机器学习

第五章着重于将机器学习应用于您自己领域的问题。Louis 引导您了解数据收集、特征工程、数据准备、健全性检查、隐私和性能等主题。

这一章中我喜欢的一个优点是 Louis 提出的思维实验,在处理机器学习问题时,想象系统能够做出完美的预测。他用这个来建议您考虑定义成功标准、性能指标以及最重要的是:解决该问题是否能带来投资回报。他通过客户流失的具体例子来说明这一点。

优先级收件箱案例研究

Louis 在本书的第六章总结了预测 API 的状态,并触及了文本/自然语言处理、计算机视觉以及使用 BigML 和 Google Prediction API 的示例。我之前没想到目前有如此多的公司和如此多样化的预测 API。例如,Louis 链接到博文《40 多个机器学习 API 列表》。

第七章通过一个实际案例研究,介绍了如何利用 Google 基础设施和 BigML 平台来开发优先级收件箱。我最喜欢这个例子的一点是它清晰简洁。我不喜欢代码过多的例子,而这个例子对我来说是恰到好处的。

Louis 在第八章中以号召性的口吻结束了本书,呼吁采用预测 API 和机器学习即服务(MLaaS)来应对当前(并且预计会恶化)的数据科学和机器学习人才短缺问题。后面的资源推荐了书籍和课程,供读者进一步学习文本中涵盖的特定领域。

总结

我一直在深入思考商品化的机器学习。我认为这是一个只会增长的市场和采纳率。我认为好处在于如何最好地将其整合并提供给企业。

这本书内容清晰,重点突出,非常适合目标读者。它没有冗长的数学推导,也没有大量代码示例。我非常喜欢书中对两个 API——Google Prediction API 和 BigML——的清晰介绍,以及那个世界级示例的细节程度恰到好处。

您可以自己摸索如何使用这些 API,但阅读 Louis 的书的好处在于,他围绕现有的 API 阐述了解决问题和机器学习的思路。我推荐这本书给希望在 Web 应用程序中快速有效地开始使用机器学习的开发人员或初创公司。

44 对《机器学习的启动:图书评论》的回复

  1. Jesús Martínez 2018年4月6日 上午2:40 #

    精彩的书评。我一定会购买这本书,以便利用其中的一些示例来激发我开发一个利用这些 API 的副项目。感谢分享您的想法!

留下回复

Machine Learning Mastery 是 Guiding Tech Media 的一部分,Guiding Tech Media 是一家领先的数字媒体出版商,专注于帮助人们了解技术。访问我们的公司网站以了解更多关于我们的使命和团队的信息。