如何更好地进行机器学习

来自 Metacademy 的 Colorado Reed 最近写了一篇精彩的文章,题为“提升你的机器学习技能”,以回答他经常收到的问题:

如果我想“更好地”掌握机器学习,但我不知道自己想学什么,我应该怎么做?

在这篇文章中,你将发现 Colorado 推荐的总结以及他的路线图细分。

level-up machine learning

提升你的机器学习技能
照片由 Helgi Halldórsson 拍摄,部分权利保留。

在机器学习方面做得更好的策略

Colorado 是伯克利大学的博士生,也是 Metacademy 的创始人。Metacademy 是一个开源平台,专家们可以在此协作构建维基文章。目前,这些文章主要关注机器学习和人工智能。这是一个很棒的网站。

Colorado 建议,要想在机器学习方面做得更好,就应该坚持不懈地研读教科书。他评论说,通读教科书的过程就是与教科书融为一体的过程。

对于一位身处其中的博士生来说,这个策略并不令人意外,我当年可能也推荐过同样的事情。这是一个不错的建议,但我不认为它适合所有人。如果你是一个通过实践来领悟想法的程序员,那么教科书列表可能只是在你希望在某个方法上迈出下一步时有用的参考资料。

机器学习路线图

他的机器学习路线图又分为 5 个级别,每个级别都指向一本特定的教科书以供掌握。这五个级别是:

  • 0 级 (新手):阅读 数据智能:利用数据科学将信息转化为洞察力。假定你熟悉 Excel,并且最终会了解一些算法的存在以及可能的高级数据流。
  • 1 级 (学徒):阅读 使用 R 进行机器学习。学习何时应用不同的机器学习算法,并使用 R 来实现。假定你可能有一点编程、代数、微积分和概率的基础,但只需一点点。
  • 2 级 (熟练工):阅读 模式识别与机器学习。从数学角度理解机器学习算法的工作原理。解释和调试机器学习方法的输出,并掌握更深入的机器学习概念。假定你熟悉算法、精通线性代数、了解一些向量微积分和一些算法实现经验。
  • 3 级 (大师):阅读 概率图模型:原理与技术。深入学习凸优化、组合优化、概率论、微分几何等高级数学主题。精通概率图模型,了解何时使用它们以及如何解释其结果。
  • 4 级 (宗师):自由选择你喜欢的一切。回馈社区。

这是一个很好的细分,Colorado 为每个级别提供了具体的章节建议以及一个建议的毕业项目。

Colorado 将这个路线图重新发布为一篇 博客文章,并做了一些小的修改。他删除了最后一个级别,并将名称更改为:好奇者新手学徒熟练工大师。他还评论说,0 级好奇的机器学习学习者不应该阅读教科书,而应该浏览并查看一些顶级的机器学习视频。

机器学习中被忽视的主题

Scott Locklin 也阅读了这篇文章,并受到启发写下了他自己的回复,题为“被忽视的机器学习思想”(配有 Boris Artzybasheff 创作的酷炫艺术作品)。

Scott 评论说,这些建议展示了 Colorado 的偏好,并没有全面反映机器学习领域。Scott 还评论说,很少有书能很好地概述该领域,尽管他确实喜欢 Peter Flach 的书 机器学习:理解数据的算法艺术与科学,因为它也涉及一些晦涩的技术。

Scott 接着列出了一些“在书中被严重忽视的领域”。总而言之,这些领域是:

  • 在线学习:对于流数据和大数据至关重要,并提到了 Vowpal Wabbit
  • 强化学习:在机器人学背景下讨论,但很少将其与常见的机器学习联系起来。
  • 压缩”序列预测技术:在发现学习模式的同时进行压缩。提到了 CompLearn
  • 总体上的时间序列导向技术
  • 共形预测:在线学习的模型准确性估计。
  • 存在大量噪声时的机器学习:自然语言处理 (NLP) 和计算机视觉 (CV) 是通用案例示例。
  • 特征工程:对成功的机器学习绝对至关重要。
  • 总体上的无监督学习和半监督学习

这是一个很棒的列表,指出了一些确实没有得到足够关注的领域。

我会指出,我也有自己 的入门和掌握机器学习路线图。像 Colorado 一样,我的路线图也局限于分类/回归类型的监督机器学习,但它构建了促进对任何和所有感兴趣主题进行调查和采纳的过程。与其说是“阅读这些教科书”,不如说是“遵循这些流程”的方法。

暂无评论。

发表评论

Machine Learning Mastery 是 Guiding Tech Media 的一部分,Guiding Tech Media 是一家领先的数字媒体出版商,专注于帮助人们了解技术。访问我们的公司网站以了解更多关于我们的使命和团队的信息。