如何从机器学习书籍和课程中获得最大收益

市面上有很多机器学习的书籍和课程,并且免费的大学课程和电子书也呈增长趋势。拥有如此多的优质资源,可能会让人感到不知所措。甚至可能阻碍你开始学习或取得进步。

在这篇文章中,我想与你分享我的自学技巧,这些技巧使我能够一次性地接触一个资源,从中提取我认为可以学到的所有知识,并将其整合到我自己的知识库中,以便我将来能够加以利用。

How to get the most from Machine Learning Books and Courses

如何从机器学习书籍和课程中获得最大收益
图片由 MIT OEIT 提供,部分权利保留

我使用的知识库策略和技巧是在大学攻读多个学位和高等学位期间发展起来的。虽然在正式的学习环境中很有用,但我认为它们在自学环境中是无价的,因为在自学环境中,你的时间和资源会受到更大的效率压力。

知识库策略

采用 知识库 策略。知识库是你创建的用于支持记忆的材料语料库。你不必记住你所学内容的所有细节,只需记住你学过什么以及你的笔记放在哪里。

知识库策略要求你在电脑或云中创建一个目录。在该目录中,为每门完成的课程和阅读过的书籍创建一个文档,描述你从该材料中学到了什么,以及在哪里可以获取更多详细信息。对于较大的课程,你可能需要为课程的每周或模块以及每项作业创建一个子目录和一个文档。目录结构和文档的具体划分由你自行决定。

原则是,你只接触一次每个资源,并彻底处理它,以便将来需要时能最好地再次利用它。这通常意味着阅读或使用它并做清晰的笔记。

机器学习课程指南

课程可以包含视频、文本、音频和线下组成部分。你的目标是内化你在课程中接触到的材料,将其与你已有的知识联系起来,并以总结的形式捕获这种理解。

课程还可以包含额外的阅读材料和资源,以及考试、测验、教程、练习和作业。在合理范围内,这些资源也必须以类似的方式处理。它们都是帮助你吸收材料的工具,你必须通过将它们揭示的知识整合到你的知识库中来利用它们。

以下是充分利用机器学习课程的五个技巧。

定期安排

制定一个常规计划,以便你能够按照一致且定期的时间表完成课程作业。例如,每天一小时,每隔一天一次,或者每周六8小时。提前安排好时间,并有效地利用这段时间。

常规计划可以让你走得很远。当预定的时间到来时,你不希望还得思考在那段时间里要做什么。你必须提前分配好任务,以避免任何不知所措或过度思考。在每个时间段结束时,为下一个时间段分配任务,以便它们已准备就绪并等待着你。

你的时间估计将是错误的两到四倍。考虑至少将你安排的时间加倍,或者将你预先安排给这些时间的工作量减半。

创建讲义笔记

课程通常会分为模块、周或类似的日程安排。每个时间段都会有你需要内化的材料。课程很可能提供以笔记或讲义幻灯片形式的材料摘要。

从头开始创建你自己的时间段材料摘要。这需要你从你正在使用的时间段内使用的材料中记笔记,然后将其分解成逻辑结构进行总结。这可能与呈现材料的结构相同,但更多时候是不同的。之所以不同,是因为你可能已经将材料与你已有的知识联系起来,并且可以看到一种比课程提供方式更清晰地将材料呈现给自己的方式。

目标是为每个模块或周的材料创建大约一页的摘要。这会因内容量而异,但目标是将材料总结为关键概念以及连接这些概念的路径。关于这些概念的任何细节都可以在原始材料中找到,例如讲义视频或必读材料。

Guide to Machine Learning Courses

MOOC
图片由 mathplourde 提供,部分权利保留

学习小组

组建一个由同行和导师组成的学习小组。你需要和你水平相当的人,他们和你一样学习材料,这样你们可以讨论内容并确保你理解它。小组学习可以比孤立学习更有效,尤其是当你能与比你更高级或学习更快的其他人配对时。

你的学习小组还可以包括已经完成课程的人,他们可能没有与你一起学习材料,但同意在 Skype 上回答你的偶尔问题或与你讨论偶尔的概念。

利用小组来检验你的理解。我喜欢使用的一个策略是主动解释概念,即使我并不完全理解它们。我还会与小组分享我所有的笔记以供评论,我还会为小组和我自己创建练习测试。想出创造性的方法来充分利用小组环境,同时也要回馈他人。

提前完成作业

课程几乎总是有工具来评估你对材料的习得和内化。这些工具以测试、考试、教程、作业、论文和练习等形式出现。

对于在线自学和课程来说,尤其重要的是要承担作业,因为通常评估你记忆能力的机会较少。

在课程开始时就注意这些材料,并安排尽早完成它们,并经常回顾你的结果。例如,如果有一个正式的考试或测验,找到以前课程的样本考试或测验,你甚至可以在接触到所有材料之前进行练习。

如果有一个作业,尽早创建一个最小版本的提交,并在你学习更多并接触到更多课程内容时对其进行补充。你可能需要主动寻找它们,甚至向授课者索要上一年的作业。利用这个机会尽可能多地获取额外内容,它们都是你可以用来更快、更彻底地学习材料的辅助工具。

这是一项强大的技术,因为它会迫使你寻找材料来回答问题和作业细节,直到你准备好为止。这个过程的压力让你发现的东西真的会让你印象深刻。当你接触到课程中的材料时,你的理解将得到充实和完善,远远超出初学者的水平。

我在大学时经常利用小组作业来挑战自己,自己完成交付物,然后将材料教给小组的其他成员,或者作为小组进一步发展的基线。

完成额外的阅读

几乎总有额外的阅读材料需要你完成。带着热情去完成它们,并使用下面列出的过程将这些材料内化到你的知识库中。

额外的阅读材料通常是书籍章节、论文和网站。考虑自己调查额外的阅读材料来补充材料,并遵循相同的过程来内化材料。

机器学习书籍指南

机器学习书籍过去是指用于研究生研究的教科书集合。过去几年这个领域发生了很大变化,现在有一系列出色的 适合初学者的应用书籍,其中包含作业、实践技巧和项目。

我建议从应用书籍开始,随着你对该领域的理解的成熟和对更深入理解的渴望驱使你,再转向教科书。

你可以比课程更快地处理书籍,因为它们是离散的,通常涉及的材料也较少。如果你无法快速处理一本书,这很可能是你还没有准备好它的迹象。利用这个指示器,寻找弥补差距的资源。例如,如果你在某个方法的数学处理上迷失了很长时间,这很可能意味着你需要处理一些关于一般数学方法的材料,然后再处理书中特定的处理方式。

你可以将书籍用作参考,及时处理特定主题的材料。本节中的策略不适用于这种情况。与处理课程的策略一样,本节中的策略是从头到尾线性处理一本书的策略。

以下是处理机器学习书籍并将材料整合到你的知识库中的五个策略。

Reinvent Solutions to Common Problems

图片由 justgrimes 提供,部分权利保留

一次性处理

最好以比你自然阅读速度慢一些的速度来处理每一页、每一章和整本书,这样你就可以只处理一次并从中受益。

花时间仔细阅读材料,以确保你理解它,并充分内化它,这样你就不必重读它。这可能意味着当你感到疲劳时就停下来,或者等到一个安静的时间,以便你能以适当的方式对待材料。

显然,你可以再次接触这本书,但你将来对材料的引用应该是针对细微的细节,而不是一般原则,因为那些原则应该已经在你的知识库中了。

主动阅读

主动阅读与被动阅读的区别在于你正在做笔记。你是材料展开过程中的积极参与者,而不是被动地消耗它而不采取行动。

主动阅读是必不可少的,以确保你从书中获得最大收益,这样你只需要阅读一次。

章节总结

在你读完每一章后,创建一个一页的章节总结。

我通常在阅读时做大量的笔记,但只有这些笔记的重点才会成为章节总结的一部分。我喜欢单页总结的想法,受限的范围迫使简洁的写作。

书籍总结

一旦你完成了书中所有章节的总结,就创建一个关于整本书的一页总结。这必须包括对书中关键材料的简要总结,可能涉及每一章。

我也喜欢包含一两句话关于作者创作这本书的动机或定位。这有助于我在脑海中和知识库中为这本书定位,以便在我需要参考它时。

进一步阅读

机器学习是一门技术性很强的学科,几乎所有的书籍都会有参考文献或进阶阅读材料。仔细审查参考文献,并记下每一项你希望在后续阅读的内容,以及为什么。

将此列表与你处理过的书籍材料一起包含在内。如果你正在寻找要阅读的内容,或者想深入研究某个特定的方法或技术,它们在将来会很有用。

扩展

如果你想加速你在机器学习或任何技术领域的学习,保留和维护一个个人知识库的想法非常强大。

以下是一些你可能会觉得有用的附加通用技巧

  • 论文存档:你最终会找到并阅读大量关于机器学习的论文。这包括会议论文、期刊论文、学位论文和技术报告。收集这些材料、它们的详细信息和链接,以便我能够快速再次引用它们。处理论文
  • 主动消费:以与处理书籍章节相同的方式,使用主动阅读过程来处理博客文章和研究论文。如果材料是垃圾(通常它们可能都是),就停止阅读,并在你的知识库中记下这一点。
  • 算法描述:维护一个 算法描述 的语料库。使用一个模板,通过 handful (5-10) 个关于算法的关键问题来正式描述一个算法。将你使用模板描述的算法一起维护。你将很快建立自己的算法百科全书。

总结

在这篇文章中,我们回顾了一种为高效自学机器学习领域而建立知识库的策略。然后,我们回顾了五种可以用来通过完成在线课程和阅读书籍来建立这个知识库的策略。

这是一个全面的过程,其中许多方法是为了作为顾问或作为正式研究计划的一部分而开发的,因为我整天都在做这些。选择你喜欢的知识库策略的元素并坚持下去。

在很短的时间内,你将能够快速区分好书与坏书,或者好论文与坏论文。此外,你将深刻理解你自己的学习风格,并且对更正式的培训计划的需求会减少,因为你将能够自己设计一个培训计划来执行。

下次上课、看视频或读书时,你会使用哪个技巧?你有没有什么技巧认为可以纳入知识库策略?请留言分享你的经验。

8 条对如何充分利用机器学习书籍和课程的回复

  1. Kushaj 2017年6月12日 下午3:15 #

    感谢您运营这个博客。我带着疑问而来,阅读后疑问已澄清。
    谢谢

  2. Jesús Martínez 2018年2月25日 上午10:03 #

    非常好的策略。感谢分享!

    我倾向于写很多笔记,并使用大量的颜色。这真的能帮助我将某些概念与特定的颜色联系起来。例如,如果我学习卷积神经网络,我可能会用红色表示滤波器大小,用蓝色表示步长,用黄色表示填充。这会使过程稍微慢一些,但我发现它确实有效!

  3. Penelope Smith 2018年8月29日 下午12:47 #

    这真是关于机器学习的非常有用的信息。知道获得好的算法描述是个好主意,这很重要。当你需要启动某项工作时,这一点值得注意。

  4. Jithendra Yenugula 2020年1月11日 下午4:41 #

    我通常在阅读机器学习书籍时会写很多笔记。有时,我只是复制书中的行并粘贴到我的草稿中。我目前正在阅读《用 Scikit-Learn 和 TensorFlow 进行机器学习实战》。
    但最后制作一页总结的观点真的很酷!我会尝试一下。感谢您运营这个博客。

发表回复

Machine Learning Mastery 是 Guiding Tech Media 的一部分,Guiding Tech Media 是一家领先的数字媒体出版商,专注于帮助人们了解技术。访问我们的公司网站以了解更多关于我们的使命和团队的信息。