DeepLearning.AI 卷积神经网络课程(评论)

Andrew Ng 以他在 Coursera 上提供的斯坦福机器学习课程而闻名。

2017 年,他还在 Coursera 上发布了一个关于深度学习的五部分课程,题为“深度学习专业化”,其中包括一个关于计算机视觉深度学习的模块,题为“卷积神经网络”。

本课程为那些已经熟悉深度学习基础知识的从业者提供了 计算机视觉 应用的深度学习方法的出色入门。它没有过多地关注数学,也没有包含任何代码。相反,它旨在培养对该领域主要技术的感觉。

在这篇文章中,您将发现 Andrew Ng 教授的关于计算机视觉深度学习的卷积神经网络课程的细分和评论。

阅读本文后,你将了解:

  • 该课程实际上是 deeplearning.ai 提供的更广泛的深度学习课程中的一个子课程。
  • 该课程不免费,需要在 Coursera 上订阅和注册,尽管所有视频都可以在 YouTube 上免费观看。
  • 该课程为熟悉深度学习基础知识的开发人员提供了计算机视觉深度学习的绝佳入门。

使用我的新书《计算机视觉深度学习启动您的项目,其中包括分步教程和所有示例的 Python 源代码文件。

让我们开始吧。

概述

本教程分为五个部分;它们是:

  1. 深度学习专业化概述
  2. 卷积神经网络课程细分
  3. YouTube 上的课程视频
  4. 讨论与评测

深度学习专业化概述

Andrew Ng 是一位著名的机器学习研究员,他因将他的 斯坦福机器学习 课程公开发布,后来又为普通从业者量身定制并在 Coursera 上提供而闻名。

他还是 Coursera 的联合创始人,曾任 Google Brain 主管和百度首席科学家。

2017 年,他推出了一个名为 deeplearning.ai 的新网站,通过他的 Coursera 平台(需要订阅)提供深度学习培训,面向普通从业者(例如开发人员)的 课程

完整的课程分为五个子课程;它们是:

  • 课程 1:神经网络和深度学习
  • 课程 2:改进深度神经网络
  • 课程 3:构建机器学习项目
  • 课程 4:卷积神经网络(我们的重点)
  • 课程 5:序列模型

这些课程以视频教程形式呈现,由 Andrew 以与他著名的机器学习课程相同的实践风格进行讲解。

该课程专为深度学习领域的初学者开发人员设计。

卷积神经网络课程细分

值得注意的是,计算机视觉深度学习子课程题为“卷积神经网络”。

Convolutional Neural Networks - Computer Vision

卷积神经网络——计算机视觉

本课程旨在教开发人员卷积神经网络的工作原理以及如何将其用于标准计算机视觉任务。

本课程将教您如何构建卷积神经网络并将其应用于图像数据。得益于深度学习,计算机视觉的工作效果比两年前好得多,这使得许多令人兴奋的应用成为可能,从安全的自动驾驶,到准确的人脸识别,再到放射学图像的自动读取。

关于本课程,Coursera

它分为四周;它们是:

  • 第一周:卷积神经网络基础
  • 第二周:深度卷积模型:案例研究
  • 第三周:物体检测
  • 第四周:特殊应用:人脸识别和神经风格迁移

每周分为 10 到 12 个主题,每个主题都通过一个简短的视频进行讲解,持续几分钟到不超过 15 分钟。

大多数主题都以实用的方式呈现,很少涉及数学。所包含的少量数学主要集中在计算损失函数或计算模型中的参数(权重)数量等主题上。

除了缺乏数学之外,该课程也没有提供代码,而是专注于帮助学习者培养对所讨论技术的直觉。

第一周。第一周专门介绍用于计算机视觉问题的主要神经网络类型:卷积神经网络或 CNN。主题侧重于卷积层的工作原理、滤波器、填充、步幅以及相关的池化层。

第二周。第二周重点关注开发有效 CNN 模型的重要里程碑,例如用于数字识别的 LeNet 以及为 ImageNet 开发的一系列模型,例如 AlexNet、ResNet 和 Inception。在讨论每个里程碑时,以解释模型为何有效以及如何更普遍地使用该技术的方式描述模型设计的创新。本周以数据准备结束,包括数据增强和迁移学习

第三周。第三周重点关注目标检测,介绍了图像分类、图像定位和地标检测等更简单的问题。这些是计算机视觉深度学习的“杀手级应用”,并逐步介绍了 YOLO 方法的重要子技术,并构建成一个完整的运作系统。

第四周。最后,最后一周以人脸检测和识别结束,构建了此类系统所需的技术,包括一次性学习、Siamese 网络和合适的损失函数。本周分为两部分,第二部分侧重于神经风格迁移,这是一种纯粹的审美技术,但非常有趣。

想通过深度学习实现计算机视觉成果吗?

立即参加我为期7天的免费电子邮件速成课程(附示例代码)。

点击注册,同时获得该课程的免费PDF电子书版本。

YouTube 上的课程视频

课程主题的完整细分如下。

  • 第一周:卷积神经网络基础
    • 计算机视觉
    • 边缘检测示例
    • 更多边缘检测
    • 填充
    • 步幅卷积
    • 体积上的卷积
    • 卷积网络的一层
    • 简单卷积网络示例
    • 池化层
    • CNN 示例
    • 为什么是卷积?
    • Yann LeCun 访谈
  • 第二周:深度卷积模型:案例研究
    • 为什么要看案例研究?
    • 经典网络
    • ResNets
    • ResNets 工作原理
    • 网络中的网络和 1x1 卷积
    • Inception 网络动机
    • Inception 网络
    • 使用开源实现
    • 迁移学习
    • 数据增强 (Data Augmentation)
    • 计算机视觉现状
  • 第三周:物体检测
    • 物体定位
    • 地标检测
    • 目标检测
    • 滑动窗口的卷积实现
    • 边界框预测
    • 交并比
    • 非极大值抑制
    • 锚框
    • YOLO 算法
    • (可选)区域提案
  • 第四周:特殊应用:人脸识别和神经风格迁移
    • 什么是人脸识别?
    • 一次性学习
    • Siamese 网络
    • 三重损失
    • 人脸验证和二元分类
    • 什么是神经风格迁移?
    • 深度 ConvNets 在学习什么?
    • 代价函数
    • 内容代价函数
    • 风格代价函数
    • 一维和三维泛化

值得一提的是,本课程的视频也已通过 YouTube 提供。

Convolutional Neural Networks Taught by Andrew Ng

Andrew Ng 教授的卷积神经网络

课程的 YouTube 播放列表也可用,尽管第三周的一些视频顺序不对

视频的命名约定是 C4WnLnn,其中 Wn 指的是周数 (1-4),Lnn 指的是讲座编号(例如 01 到 12)。请注意第三周视频的顺序;您可能需要手动在播放列表中跳转。

播放列表中缺少两个视频;它们是:

请注意,第一周包含对卷积神经网络发明者 Yann LeCun 的视频采访。这是名为“深度学习英雄访谈”的视频系列的一部分,该系列也可在 YouTube 上观看。

您可以在几个小时内轻松观看所有视频。

讨论与评测

我通过 YouTube 观看了所有视频(两倍速),并做了大量笔记。

这是一门很棒的课程,我认为它在培养对所涵盖主题的直觉方面做得非常出色,包括 CNN、里程碑模型、目标检测、人脸识别和风格迁移。

对卷积层以及填充、步幅等相关主题的介绍可能是我见过的最清晰的演示之一。我还发现第二周和第三周关于里程碑 CNN 模型和目标检测非常清晰。第四周还不错,开头很好,但当我们深入研究神经风格迁移时就变得非常混乱。

如果您已经熟悉 CNN 的基础知识,就像许多深度学习从业者一样,那么我建议您重点关注第三周和第四周。第三周尤其精彩,深入探讨了目标检测这个杀手级应用的元素,以及解决它的具有挑战性的 YOLO 方法。

YOLO 是一个重要的主题,但如果侧重于更简单(更容易实现的方法),例如 Fast 或 Faster R-CNN,它可能会被简化。

我发现自己观看了课程的几乎每一分钟,只跳过了一些混乱的数学描述。事实上,深入解释损失函数可能是课程中最不有趣且可能不需要的部分。

我从未发现视频是教授数学的有效媒介。它需要慢慢来,有清晰的 (LaTeX) 方程、解释和工作代码。

如果您是计算机视觉深度学习的新手,但熟悉深度学习的基础知识,那么我推荐这门课程,特别是观看视频。您可以轻松地一两次完成它们。

进一步阅读

如果您想深入了解,本节提供了更多关于该主题的资源。

总结

在这篇文章中,您发现了 Andrew Ng 教授的关于计算机视觉深度学习的卷积神经网络课程的细分和评论。

具体来说,你学到了:

  • 该课程实际上是 deeplearning.ai 提供的更广泛的深度学习课程中的一个子课程。
  • 该课程不免费,需要在 Coursera 上订阅和注册,尽管所有视频都可以在 YouTube 上免费观看。
  • 该课程为熟悉深度学习基础知识的开发人员提供了计算机视觉深度学习的绝佳入门。

你有什么问题吗?
在下面的评论中提出你的问题,我会尽力回答。

立即开发用于视觉的深度学习模型!

Deep Learning for Computer Vision

在几分钟内开发您自己的视觉模型

...只需几行python代码

在我的新电子书中探索如何实现
用于计算机视觉的深度学习

它提供关于以下主题的自学教程
分类物体检测(YOLO和R-CNN)人脸识别(VGGFace和FaceNet)数据准备等等……

最终将深度学习引入您的视觉项目

跳过学术理论。只看结果。

查看内容

对《DeepLearning.AI 卷积神经网络课程(评论)》的 8 条回复

  1. JG 2019 年 3 月 18 日晚上 6:52 #

    感谢您分享其他教程资源。这让你变得更棒。

    我相信您很快就会将这些新学到的直观想法添加到您非常有用的、完全编码的教程解释中!

  2. Ginette 2019 年 3 月 18 日晚上 11:16 #

    这很有趣。我最近读了一篇文章,它改变了我对这个领域的一些看法,它谈论了深度学习及其在当今世界的重要性,我认为这非常有争议,我想知道您对此的看法。

    https://www.linkedin.com/pulse/deep-learning-ai-bubble-bursting-samer-l-hijazi/

  3. Alok 2019 年 3 月 20 日晚上 8:45 #

    感谢 Jason 对这门课程的评论。我一直在考虑是否应该投资学习这门课程。阅读您的想法非常有动力。

    我有一个问题/请求——您是否可以发布一些您在观看视频时所做的笔记。我正在努力提高我的笔记能力,很高兴能看到一些示例。

    • Jason Brownlee 2019 年 3 月 21 日上午 8:06 #

      谢谢。

      嗯,不太行,我的笔记是我自己和我已经知道的速记,别人看不懂。抱歉。

  4. Alok 2019 年 3 月 20 日晚上 8:47 #

    另外,我想补充一点,如果选择“旁听课程”选项,每个人都可以在 Coursera 本身免费学习该课程。

    这是我喜欢 Coursera 平台的原因之一

发表回复

Machine Learning Mastery 是 Guiding Tech Media 的一部分,Guiding Tech Media 是一家领先的数字媒体出版商,专注于帮助人们了解技术。访问我们的公司网站以了解更多关于我们的使命和团队的信息。