什么是深度学习?

目前人工智能领域发生了很多事情。你们中的一些人可能想知道机器是如何做到它们能做到的。它们如何识别图像、理解语音,甚至回复我的请求???

欢迎来到深度学习的世界。 

深度学习是机器学习的一个子领域,它关注受大脑结构和功能启发而创建的算法,这些算法被称为人工神经网络。

是的,我明白,这听起来非常技术化和令人不知所措,对吧? 

如果你刚开始接触深度学习领域,或者你很久以前对神经网络有一些经验,你可能会感到困惑。我知道我最初很困惑,许多在1990年代和2000年代早期学习和使用神经网络的同事和朋友也一样困惑。

该领域的领导者和专家对什么是深度学习有自己的看法,这些具体而细致的观点为深度学习的全部内容提供了很多启示。

但深度学习到底是什么?它到底是什么?深度学习对当今的先驱者和思想领袖意味着什么?如果你正在思考这些问题,那么你就来对地方了。 

本文将通过听取该领域一系列专家和领导者的意见来探讨深度学习是什么。

如果你真的渴望学习深度学习,请从我的新书《用Python进行深度学习》开始你的项目,其中包括分步教程和所有示例的Python源代码文件。

用我的新书用Python进行深度学习》启动你的项目,其中包括分步教程和所有示例的Python源代码文件。

让我们开始吧。

What is Deep Learning?

什么是深度学习?
图片由Kiran Foster拍摄,保留部分权利。

吴恩达论深度学习的精髓

吴恩达以其在该领域的贡献而闻名,他是DeepLearning.AI和其他平台(如Coursera)的创始人,并正式创立了Google Brain。这最终导致了深度学习技术在大量Google服务中的产品化。

吴恩达经常发表关于深度学习的文章和演讲,这使他成为那些希望了解更多该领域的人的绝佳起点。

在深度学习的早期阶段,吴恩达在传统人工神经网络的背景下描述了深度学习。在2013年题为“深度学习、自学和无监督特征学习”的演讲中,他将深度学习的理念描述为

利用大脑模拟,希望能够

——使学习算法变得更好、更容易使用。

——在机器学习和人工智能领域取得革命性进展。

我相信这是我们迈向真正人工智能的最佳途径。

后来他的评论变得更加细致。

随着时间的推移,吴恩达对深度学习的见解变得更加精炼和细致。

根据吴恩达的说法,深度学习的核心是现代计算能力的可用性以及可用于训练大型神经网络的大量数据。在2015年ExtractConf的一次题为“数据科学家应该了解的深度学习”的演讲中,他讨论了为什么现在是深度学习起飞的时候,他评论道:

我们现在拥有的超大型神经网络和……我们可访问的巨量数据

他还评论了规模在深度学习世界中的重要性。随着我们构建更大的神经网络并用越来越多的数据训练它们,它们的性能会持续提升。与许多性能会达到瓶颈的传统机器学习方法不同,深度学习表现突出。 

构建更大的神经网络并提供更多的数据将带来效率的提升。 

吴恩达指出

对于大多数旧一代学习算法的变体……性能会趋于平稳。……深度学习……是第一类……可扩展的算法。……随着你输入更多数据,性能会不断提高

这是他幻灯片中一个很好的漫画解释

Why Deep Learning?

为什么选择深度学习?
幻灯片作者:Andrew Ng,保留所有权利。

吴恩达强调的另一个重点是深度学习中监督学习的重要性。在2015年的ExtractConf会议上,他指出:

今天深度学习的几乎所有价值都通过监督学习或从标记数据中学习获得

在2014年斯坦福大学题为“深度学习”的讲座中,他表达了类似的观点:

深度学习之所以如此流行,原因之一就是它在监督学习方面表现出色

吴恩达经常提到,随着该领域日益成熟以处理大量未标记数据,我们应该并且将会看到更多来自无监督学习方面的好处。

Jeff Dean:Google 深度学习基础设施的架构师

Jeff Dean是Google系统和基础设施团队的驱动力,现已被任命为Google首席科学家,他在Google内部深度学习的规模化和采用方面发挥了关键作用,甚至可能为此负部分责任。Jeff参与了Google Brain项目以及大型深度学习软件DistBelief(后来是TensorFlow)的开发。

在2016年题为“深度学习用于构建智能计算机系统”的演讲中,Jeff也发表了类似的评论,认为深度学习实际上就是大型神经网络。

当你听到深度学习这个词时,只需将其视为一个大型深度神经网络。深度通常指的是层数,因此这是一种在媒体上流行的术语。我通常将它们视为深度神经网络。

他曾多次进行此演讲,在同一演讲的修改版幻灯片中,Jeff强调了神经网络的可扩展性,表明结果会随着更多数据和更大模型而变得更好,这反过来又需要更多的计算来进行训练。

看起来吴恩达和Jeff Dean肯定有过同样的对话。

Results Get Better With More Data, Larger Models, More Compute

更多数据、更大模型、更多计算带来更好的结果
幻灯片作者:Jeff Dean,保留所有权利。

深度学习:分层特征学习的艺术

深度学习模型的另一个特点是它们能够从原始数据中自动提取特征,也称为特征学习

Yoshua Bengio:先驱的视角

Yoshua Bengio是深度学习领域的另一位重要人物。他最初对大型神经网络能够实现的自动特征学习能力很感兴趣。

在他的2012年论文《无监督和迁移学习的深度表示学习》中,Bengio评论道:

深度学习算法试图利用输入分布中未知的结构,以发现良好的表示,通常在多个层次上,其中更高级别的学习特征由更低级别的特征定义

随后,他在2009年题为“学习人工智能的深度架构”的技术报告中进一步阐述了这一思想,强调了特征学习中层次结构的重要性。

深度学习方法旨在学习特征层次结构,其中层次结构中更高级别的特征由更低级别特征的组合构成。自动学习多个抽象级别的特征使系统能够直接从数据中学习将输入映射到输出的复杂函数,而无需完全依赖人工设计的特征。

Bengio与Ian Goodfellow和Aaron Courville合著了一本书,名为《深度学习》,该书根据模型的架构深度定义了深度学习。

概念的层次结构允许计算机通过将复杂概念分解为更简单的概念来学习它们。如果我们绘制一张图表,显示这些概念是如何相互构建的,那么这张图表将是深层的,具有许多层。因此,我们将这种人工智能方法称为深度学习。

这本书已成为该领域的权威资源,将多层感知器作为深度学习中的核心算法,表明深度学习已有效地整合了人工神经网络。

Peter Norvig:Google 对深度和抽象的看法

深度学习模型的典型例子是前馈深度网络或多层感知器(MLP)。

Peter Norvig,Google 的研究总监,以其关于人工智能的教科书《人工智能:一种现代方法》而闻名。

在2016年题为“深度学习与可理解性对比软件工程与验证”的演讲中,Norvig与Bengio对深度学习的观点产生了共鸣。他将深度学习定义为侧重于通过使用更深的网络结构所允许的抽象能力。

一种学习方式,其中你形成的表示具有多个抽象层次,而不是直接的输入到输出

“深度学习”一词的演变。为什么不直接称之为“人工神经网络”?

人工神经网络领域的先驱Geoffrey Hinton与人共同发表了第一篇关于训练多层感知器网络的反向传播算法的论文。

2006年,Hinton与人合著了《深度信念网络的快速学习算法》,其中“深度”一词表示具有多层网络,特别是受限玻尔兹曼机。

使用互补先验,我们推导出一个快速的贪婪算法,可以逐层学习深度、有向信念网络,前提是顶层和第二层形成一个无向联想记忆。

这篇论文,连同 Geoff 合著的另一篇题为《深度玻尔兹曼机》的关于无向深度网络的开创性论文,受到了社区的广泛好评,因为它们被证明是网络贪婪逐层训练的成功范例,允许前馈网络拥有更多层。

在另一篇合著文章“使用神经网络降低数据维度”中,“深度”一词持续用于描述他们开发比以前典型的网络层数多得多的网络的方法。

我们描述了一种有效的权重初始化方法,它允许深度自动编码器网络学习低维代码,该代码作为降低数据维度的工具比主成分分析效果更好。

呼应吴恩达关于计算能力、使用大量数据集和最佳权重初始化融合的观点,文章传达了:

自20世纪80年代以来,通过深度自动编码器进行反向传播对于非线性降维将非常有效,只要计算机足够快,数据集足够大,并且初始权重足够接近一个好的解决方案。所有这三个条件现在都已满足。

2016年,在皇家学会的演讲中,主题为“深度学习”,Geoff评论道,深度信念网络是2006年深度学习的开端。这项成功,尤其是在语音识别方面,促使神经网络和语音识别领域在2009年题为“使用深度信念网络进行声学建模”的论文中引起了关注,并取得了最先进的成果。 

正是这些成果使得语音识别和神经网络社区注意到了“深度”一词作为对以前神经网络技术的区分,这可能导致了名称的改变。

皇家学会演讲中对深度学习的描述非常以反向传播为中心,正如你所期望的那样。有趣的是,Hinton给出了反向传播(即“深度学习”)在20世纪90年代未能普及的4个原因。前两点与吴恩达关于数据集太小和计算机太慢的评论高度吻合。

What Was Actually Wrong With Backpropagation in 1986?

1986年的反向传播到底出了什么问题?
幻灯片作者:Geoff Hinton,保留所有权利。

深度学习作为跨领域的可扩展学习

深度学习特别擅长处理输入和输出通常是模拟数据的情景。这意味着,深度学习并非依赖于表格格式的少量数量值,而是在处理图像中的像素数据、文本数据文档或音频数据文件时表现出色。

Yann LeCun:卷积神经网络(CNN)的远见者

目前担任Meta公司副总裁兼首席人工智能科学家的Yann LeCun,是擅长图像数据中物体识别的网络架构——卷积神经网络(CNN)之父。这项技术已经并将继续取得巨大成功,因为与多层感知器前馈神经网络一样,该技术随着数据和模型大小的增加而扩展,并且可以通过反向传播进行训练。

这使得他对深度学习的定义偏向于开发非常大的CNN,这些CNN在照片中的物体识别方面取得了巨大成功。

在2016年劳伦斯利弗莫尔国家实验室题为“加速理解:深度学习、智能应用和GPU”的演讲中,LeCun将深度学习描述为追求分层表示,并进一步指出它是一种构建物体识别系统的可扩展方法。

深度学习 [是] ……一个由所有可训练模块组成的管道。……之所以“深”,是因为在识别对象的过程中有多个阶段,而所有这些阶段都是训练的一部分

Deep Learning = Learning Hierarchical Representations

深度学习 = 学习分层表示
幻灯片作者:Yann LeCun,保留所有权利。

Jurgen Schmidhuber:长短期记忆网络(LSTM)的创新者

我们邀请另一位创始人加入讨论,他就是Jurgen Schmidhuber,他因创造了长短期记忆网络(LSTM)(一种循环神经网络)而闻名。

施密德胡伯在他的2014年论文《神经网络中的深度学习:概述》中表达了他对将该领域标记为“深度学习”的保留意见。他评论了该领域命名的问题以及深度学习与浅层学习的区别。他还饶有兴致地从问题复杂度而不是用于解决问题的模型的角度来描述深度。

浅层学习在何种问题深度下结束,深度学习又从何处开始?与深度学习专家的讨论尚未对此问题给出明确的答案。[…],出于本次概述的目的,我姑且定义:深度 > 10 的问题需要非常深度学习。

Demis Hassabis 和 DeepMind 的崛起

Demis HassabisDeepMind的远见者,该公司后来被Google收购。他开创性地将深度学习和强化学习融合在一起。这一结合突破能够处理复杂学习问题,例如游戏对弈,最著名的例子就是用AlphaGo玩雅达利游戏和围棋。

为了与命名保持一致,他们将他们的新技术称为深度Q网络(Deep Q-Network),结合了深度学习(Deep Learning)和Q学习(Q-Learning),随后将这个广阔的领域称为“深度强化学习”(Deep Reinforcement Learning)。

在他们2015年发表在《自然》杂志上的论文《通过深度强化学习实现人类水平的控制》中,他们评论了深度神经网络的重要性以及它如何在他们的突破中发挥了关键作用,并强调了分层抽象的必要性。

为了实现这一点,我们开发了一种新颖的代理,即深度Q网络(DQN),它能够将强化学习与一类被称为深度神经网络的人工神经网络结合起来。值得注意的是,深度神经网络的最新进展,其中使用多层节点来构建逐渐更抽象的数据表示,使得人工神经网络可以直接从原始感官数据中学习物体类别等概念。

现在,为了汇集伟大的思想,Yann LeCun、Yoshua Bengio和Geoffrey Hinton在《自然》杂志上发表了一篇具有里程碑意义的论文,题为《深度学习》。在文章开头,他们给出了一个清晰的深度学习定义,强调了多层方法。

深度学习允许由多个处理层组成的计算模型学习具有多个抽象级别的数据表示。

随后,这种多层方法被描述为表示学习和抽象。

深度学习方法是具有多个表示层次的表示学习方法,通过组合简单但非线性的模块来获得,每个模块将一个层次的表示(从原始输入开始)转换为更高、稍微更抽象的层次的表示。[……]深度学习的关键之处在于这些特征层不是由人类工程师设计的:它们是使用通用学习过程从数据中学习的。

虽然这是一个很好的通用描述,但这个全面的描述概括了大多数人工神经网络算法的精髓,为一个好的结尾提供了注脚。

总结

在这篇文章中,你发现深度学习就是在大数据上使用非常大的神经网络,需要更大的计算机。

尽管Hinton及其合作者发表的早期方法侧重于贪婪分层训练和自动编码器等无监督方法,但现代最先进的深度学习则侧重于使用反向传播算法训练深度(多层)神经网络模型。最流行的技术是

  • 多层感知器网络。
  • 卷积神经网络。
  • 长短期记忆循环神经网络。

我希望这已经澄清了什么是深度学习,以及领先的定义如何在同一个概念下融会贯通。

如果您对深度学习或本文有任何疑问,请在下方评论中提出您的问题,我将尽力回答。

295条对什么是深度学习?的回应

  1. Gibachan 2016年8月16日上午7:24 #

    如果深度学习是如此优秀的算法,你认为其他较旧的算法(如支持向量机)不再能有效解决我们的问题了吗?

    • Jason Brownlee 2016年8月16日上午8:59 #

      我认为支持向量机和类似技术仍然有它们的地位。看起来深度学习技术的利基市场是当你处理原始模拟数据时,比如音频和图像数据。

    • Tooba 2017年2月17日上午2:43 #

      首先,我要感谢你的努力。这是我读过的关于深度学习最好的博客之一。
      我想问你,如果我们需要从图像中提取广告牌等数据,你认为SVM或CNN哪个更好,或者你心中有没有比这两种更好的算法?

      • Swapnil Pote 2017年3月17日上午1:22 #

        与支持向量机相比,卷积神经网络在图像分类中会给出更好的结果。

        • Ibrahim Amer 2017年9月6日晚上10:11 #

          如果数据足够,CNN 会比 SVM 好很多。CNN 更好的原因是它作为自动特征提取器工作,你不需要费心进行特征选择,也不用担心提取的特征是否能与模型配合。CNN 提取所有可能的特征,从边缘等低级特征到人脸和物体等高级特征。

    • Dudley Jude 2018年3月23日下午4:35 #

      作为一名成人教育讲师(成人教育学),我如何在传统课堂环境中应用深度学习?

    • Mike Rauner 2020年11月4日上午1:41 #

      为了回答你的问题,我建议你阅读这篇文章——https://www.simplilearn.com/tutorials/deep-learning-tutorial/deep-learning-frameworks,因为它清楚地解释了深度学习算法

      • Jason Brownlee 2020年11月4日上午6:44 #

        感谢分享。

        它总结了深度学习库,而不是算法。

  2. Alan Beckles 医学博士 2016年8月16日上午11:12 #

    卷积神经网络能否执行医疗诊断等任务,或者是否应该

    与强化学习等其他技术结合,以

    优化性能?

    • Jason Brownlee 2016年8月16日上午11:20 #

      通常,卷积神经网络在处理图像数据方面非常出色。

      医学诊断似乎是一个非常宽泛的领域。您可能需要缩小范围,并在选择特定算法之前清楚地定义和阐明您的问题。

  3. Alan Beckles 医学博士 2016年8月16日下午12:03 #

    心电图判读可能是一个适合CNN的好问题,因为它们是图像。另一个项目是开发一个心血管疾病顾问,类似于Shortliffe和Buchanan在大约40年前在斯坦福大学开发的基于规则的传染病顾问MYCIN。

  4. napoleon Boakye 2016年9月9日上午1:24 #

    那么杰森,“深度学习”之后的下一个发现是什么?

    • Jason Brownlee 2016年9月9日上午7:22 #

      没想法,拿破仑。深度学习有足够的潜力让我们忙碌很长一段时间。

      • salma 2018年6月6日上午3:20 #

        先生,请告诉我CNN是如何从图像中提取特征的……

  5. napoleon Boakye 2016年9月12日上午8:13 #

    好的

  6. Francesco D'Amore 2016年9月14日下午11:04 #

    很好的概述。

    看看这个

    http://deeplearning4j.org/

    这会是一个很好的深度学习工具吗?

  7. Jason Wills 2016年10月4日下午10:10 #

    您好,深度学习可以应用于股票市场吗?
    我的意思是:它不仅仅是使用旧数据图表并使用旧模型,而且还能写出第二天如何给出数字预测?

    • Jason Brownlee 2016年10月5日上午8:28 #

      嗨,杰森,深度学习可能适用于股票市场。

      我不是金融专家,所以我无法为您提供专家建议。您可以尝试一下。

      您可能对这篇关于使用深度学习进行时间序列预测的文章感兴趣。
      https://machinelearning.org.cn/time-series-prediction-with-deep-learning-in-python-with-keras/

      • Jason Wills 2016年10月5日下午2:16 #

        感谢您的回复,我阅读了您的一些文章,您的工作给我留下了深刻的印象。我自己刚开始了解这个领域,而您在这方面有很多经验。我希望如果您有一些关于金融特别是股票市场的经验……请帮助我提供一些参考资料,让我自己学习,或者像您提到的那样找到“Tribute”:)

  8. maisie Badami 2016年10月15日下午4:47 #

    喜欢它,感谢您的概述,解答了我很多问题

    我正在尝试为我的硕士-博士提案在深度学习医学诊断领域寻找一个主题,只是想知道目前这个领域有什么热门话题?以及我如何才能更多地了解深度学习的这个特殊领域

    • Jason Brownlee 2016年10月17日上午10:18 #

      我很高兴它很有用,梅西。

      我建议与医学诊断人员讨论那些有大量数据可供访问的重大开放问题。

    • Radya 2019年2月24日中午12:39 #

      嗨,梅西
      我正在为我的硕士论文寻找关于CNN和医学诊断中深度学习的一些信息
      所以如果有什么有用的,请帮助我,因为我是这个领域的新手

      • Jason Brownlee 2019年2月24日上午9:10 #

        听起来是个很棒的领域。

        也许可以从回顾该主题的近期论文开始?

        • Radya 2019年2月26日上午9:19 #

          我已经开始了,但这似乎有点难
          我正在寻求建议,以便继续下去

  9. neha rahman 2016年10月20日上午5:15 #

    我正在寻找这方面的M技术论文……帮助我探索新领域……。

    • Jason Brownlee 2016年10月20日上午8:40 #

      嗨,Neha,与您讨论研究课题想法的最佳人选是您的导师。祝您好运。

  10. Abbey 2016年11月14日上午4:39 #

    嗨,Jason,

    非常感谢您的帖子。我正在尝试解决社交媒体上嵌入的短文本消息(即缩写、符号等)相关的一个开放问题。例如,“bf”可以解释为“男朋友”或“最好的朋友”。输入可以表示为字符,但如何将其编码为神经网络的输入,使其能够学习并同时输出目标。请帮助。

    此致
    Abbey

    • Jason Brownlee 2016年11月14日上午7:46 #

      阿比,这个问题很有趣。

      我建议首先收集一个高质量的消息和预期翻译数据集。

      然后我建议将单词编码为整数,并使用词嵌入将整数向量投影到更高维空间。

      告诉我进展如何。

  11. Sam Wilson 2017年1月5日上午4:14 #

    嗨,谢谢您的精彩概述。

    您认为CNN在发展中国家可以在哪些领域使用?
    由于原始数据似乎比发达国家少,我无法想到CNN在发展中国家有任何用途。

    • Jason Brownlee 2017年1月5日上午9:41 #

      对不起,山姆,我不知道。

      CNN在许多具有空间结构(或可以转换为空间结构)的问题上都是最先进的。

      任何与图像相关的东西都是一个很好的开始,文本和时间序列等领域也很有趣。

    • Danie Truter 2017年3月21日上午1:10 #

      嗨……我是一个发展中国家的普通开发者,我的看法是“是的”……如果你能找到一种方法将所有这些“不相关”的数据整合在一起,那么你就可以帮助收集这些数据,让发展中国家更容易避免犯发达国家同样的错误……从而降低“成为”一个发达国家的成本,而无需付出高昂的代价……“研究”存在……实施才是问题……

  12. Muhammad Faisal 2017年2月26日中午12:42 #

    你好 Jason,

    一篇为初学者写得非常好、解释得很清楚的文章。
    我想问一个问题,请告诉我一个在计算机视觉领域中,浅层学习(传统机器学习)远优于深度学习的具体例子。

    • Jason Brownlee 2017年2月26日上午5:30 #

      好问题,我暂时不确定。计算机视觉并非我的专业领域。

  13. priyanka yemul 2017年3月13日下午9:23 #

    这篇文章对于学习深度学习很有用。好文章

  14. Chris Jarvis 2017年3月14日上午8:36 #

    深度学习的精彩总结——我正在做一篇关于将人工智能应用于解决工程问题的本科毕业论文/学位论文。

  15. Danie Truter 2017年3月21日上午1:01 #

    嗨……我只是一个普通的开发人员,但我发现这篇文章信息量很大……

    请允许我问一个问题

    如果“互联网”和“线路速度”足够快,这意味着这些算法可以自行学习,还是“程序”目前在学习阶段仅限于人类交互?

    所以我的实际问题是:我认为“数据”是可用的 -> “互联网”,但是我们(人类目前)是否已经拥有通过这些算法来“理解”数据的计算能力,并且软件的开发方式是否能够忽略人类的批准?

    • Jason Brownlee 2017年3月21日上午8:42 #

      给定问题所需的学习数据因问题而异。数据来源以及数据从来源传输到学习算法的方式也因问题而异。

  16. Cyriac Peter 2017年3月22日上午5:56 #

    杰森博士,这是一个非常有用的汇编。我今天研究了很多,以了解深度学习到底是什么。我必须说所有文章都很有帮助,但您的文章让我对今天的研究感到满意。再次感谢。

    根据我目前的阅读,我觉得预测分析是机器学习的核心,而深度学习是一种预测分析方法,其准确性随着数据和训练的增加而提高。想听听您对此的看法。

  17. Tran Anh Tuan 2017年3月30日下午6:23 #

    这篇文章对于我这样的机器学习初学者来说非常有趣和有用。

    我正在考虑一个为我的DIY四旋翼无人机设计一个稳定控制器的项目(只是为了我的爱好)。您有什么关于如何以及从何开始的建议吗?像SVM这样的算法可以用于这个特定目的吗?微控制器(如Arduino)能够处理这个问题吗?

    提前感谢你

  18. Murali 2017年4月19日下午8:39 #

    你好
    深度学习适合使用数据挖掘算法预测糖尿病等疾病吗?
    如果适合,请给我一些在此方面工作的想法

    • Jason Brownlee 2017年4月20日上午9:24 #

      它可能不错,但尝试一系列算法,看看哪个最适合您的问题。

      请看这篇文章
      https://machinelearning.org.cn/a-data-driven-approach-to-machine-learning/

      • arif 2017年5月7日下午6:29 #

        嗨,杰森,你还好吗?我读了你的文章,它帮助了我,评论区也很有帮助。
        请问深度神经网络中最新的算法是哪一个?

        我需要您关于神经网络的帮助。我正在研究神经网络,谢谢。

        • Jason Brownlee 2017年5月8日上午7:43 #

          深度学习算法有很多。

          最流行的是用于表格数据的MLP,用于图像数据的CNN和用于序列数据的LSTM。

  19. arif 2017年5月8日下午3:09 #

    谢谢杰森,在研究方面你建议我使用哪种算法?

  20. arif 2017年5月12日上午1:25 #

    杰森,我想在医疗领域工作或将其应用于医疗领域

  21. shivam tripathi 2017年5月15日上午3:44 #

    深度学习是机器学习中过拟合问题的解决方案吗?

    • Jason Brownlee 2017年5月15日上午5:54 #

      不,深度学习方法也可能像其他任何方法一样过拟合。

  22. Mani 2017年5月19日下午4:32 #

    感谢这篇精彩的文章。根据产品描述对产品进行分类的最佳方法是什么?

    • Jason Brownlee 2017年5月20日上午5:35 #

      或许可以使用LSTM或CNN,或者两者结合使用。

  23. Tofa 2017年5月26日下午6:30 #

    你解释了很多不必要的观点,这使得理解深度学习究竟是什么变得困难,而且不必要的解释让我读这份文档感到无聊。

  24. Anthony 2017年6月6日下午7:19 #

    Jason,
    您认为深度学习的未来是什么?
    您认为一种新算法需要多少年才能流行起来?

    • Jason Brownlee 2017年6月7日上午7:12 #

      嗨,安东尼,

      没有一种算法,而是一个算法群体,其中包括主要算法:MLP、LSTM和CNN。

      我不知道我们将走向何方,抱歉。

  25. Dubem 2017年6月16日下午10:02 #

    我是一名计算机科学专业的学生,将就深度学习进行一次研讨会,我对此一无所知……我能获得一些可以帮助我的文章吗?

  26. Neel 2017年6月26日下午3:00 #

    嗨,杰森,我一直在参考您的一些博客进行我的机器学习工作。您的博客的一个显著特点是简洁,这让我经常光顾这里!这非常有帮助。:)谈到深度学习与传统机器学习,普遍的看法是深度学习在其特征抽象能力方面超越了人类。这是真的吗?
    另外,您能告诉我为什么深度学习在不同数据集上未能超越许多传统机器学习算法,尽管深度学习在特征抽象方面被认为优于其他算法?

    • Jason Brownlee 2017年6月27日上午8:27 #

      深度学习在特征提取方面表现出色,进而对所谓的“模拟数据”(例如图像、文本、音频等)进行最先进的预测。

      它也可以用于表格数据(例如数字电子表格),但这不是它的最佳应用领域,并且通常会被其他方法(如梯度提升)超越。

      没有一种算法可以统治所有算法,只有针对不同问题的不同算法,我们的工作是发现哪种算法在给定问题上表现最佳。

      • Neel 2017年6月28日下午8:17 #

        感谢您的回复,杰森!我感谢您的澄清。

  27. Yukin 2017年7月27日下午6:29 #

    我想知道,如果我在我的训练模型中使用卷积神经网络,我可以说它是深度学习吗?

  28. Suchithra 2017年8月4日下午1:43 #

    先生,这是关于深度学习的精彩综述。

    我的问题是深度神经网络和CNN有什么区别。

    深度学习适用于定量数据(表格数据)吗?

    我为大量定量数据构建了一个深度神经网络模型,并获得了比传统神经网络方法更好的结果。
    先生,这意味着什么?

    我的深度学习技术正确吗?

    • Jason Brownlee 2017年8月4日下午3:45 #

      CNN是一种神经网络。它可以变得很深。因此,它是一种深度神经网络。

      是的,神经网络要求所有输入数据都是表格形式(向量化)。

      我无法知道您的模型是否正确。请仔细评估它并将其与其他模型进行比较。

  29. mera 2017年8月17日下午11:29 #

    如果我们使用分层训练算法,例如我们使用带有瓶颈(隐藏层,10,2,10)的无监督学习自动编码器进行训练,然后使用相同自动编码器架构(隐藏层,10,2,10)的监督学习来调整无监督模型参数(权重,偏差)。这些训练过程是分开进行的。

    现在,无监督自动编码器用作降维并提取特征。监督模型是否以相同的方式工作并提取特征,或者只是在无监督学习中执行此步骤

    • Jason Brownlee 2017年8月18日上午6:20 #

      监督模型将解释特征并使用它们进行预测。

  30. jayaram 2017年9月23日下午3:57 #

    我可以说深度学习 == CNN 吗?深度学习有类型吗?

    • Jason Brownlee 2017年9月24日上午5:14 #

      CNN是深度学习的一种类型。RNN和MLP也是。

  31. Sudha 2017年9月23日下午8:15 #

    先生,这是对深度学习的很好的介绍。我计划用深度学习诊断心脏病来攻读博士学位。我有特征数据。我不知道如何对这些数据进行分类。您能推荐一些使用TensorFlow进行数值数据分类的材料吗?

  32. mhamed kassem 2017年10月3日下午11:28 #

    嗨,我开始我的毕业项目,我正在创建一个基于医疗传感器数据构建的医疗系统,我希望使用深度学习来根据这些数据检测疾病或健康状况,但我不知道应该从哪里开始深度学习
    您能帮我完成它吗?

  33. Cathy 2017年10月5日上午9:37 #

    嗨,杰森,谢谢您的精彩概述。请问如何应用深度学习预测药物不良反应,尤其是在药物相互作用方面?

  34. Sudha 2017年10月21日下午7:48 #

    嗨,杰森,您能告诉我有哪些无监督深度学习算法吗?请提供一些学习链接。

    • Jason Brownlee 2017年10月22日上午5:18 #

      抱歉,我没有关于无监督学习算法的资料,我觉得它们在实践中没什么用。

  35. naivebae 2017年10月31日下午2:56 #

    “更大的模型”是什么意思?模型中有更多的方程吗?模型中有更多的变量吗?有更多的for循环吗?模型到底是如何“更大”的?“不是很大的模型”的例子是什么?为什么它更差?在这个领域,“模型”一词到底是什么意思?我对此仍然不清楚。例如,到底是什么特征使某个东西成为“模型”,为什么像一个通过连续除法判断整数是否为素数的循环这样的通用编程算法不是一个“模型”?对我来说,那听起来像是一个判断数字是否为素数的“模型”,那么在这个领域,“模型”是什么意思?使某个东西成为“模型”的固有属性是什么?模型是一种算法吗?它是面向对象设计中的一个类吗?什么是“模型”,什么是“更大的模型”?

    • Jason Brownlee 2017年10月31日下午2:59 #

      一个评论问题太多了,抱歉。

      • naivebae 2017年10月31日下午4:30 #

        好的,让我们从这个领域中“模型”一词的确切含义开始。因为我仍然完全不清楚那是什么意思。如果我编写一些代码来解决一个问题,我怎么知道我是否“构建了一个模型”?

        • Jason Brownlee 2017年11月1日上午5:43 #

          模型通常指的是在数据上运行训练算法后得到的权重和结构。

          它是一个可以在新数据上进行预测的“程序”。

          • naivebae 2017年11月1日上午7:55 #

            那么,您在这篇文章中提到的“更大模型”是什么?训练算法中是否有更多的权重和更多的结构?这是如何实现的?您是否插入了更多的方程、更多的变量和决策参数/等等?您如何知道要插入哪些附加方程和参数,以及您如何知道这些是正确的而不是其他的?或者“更大模型”仅仅是指在更多整体数据上运行,并且训练算法与每个训练示例具有相同数量的方程/变量/计算?

          • Jason Brownlee 2017年11月1日下午4:13 #

            “更大模型”指的是更深(更多层)或更宽(每层更多神经元),最终具有更强的表示能力。

  36. Sukesh Kumar Ranjan 2017年11月3日上午9:10 #

    对学生学习深度学习基础知识的最佳总结。谢谢你,Jason

  37. Souha 2017年11月8日下午8:01 #

    非常感谢。这是关于深度学习的非常好的总结。
    请问能否提供一些深度学习中使用的算法?

    • Jason Brownlee 2017年11月9日上午9:57 #

      要重点关注的三个是:多层感知器、卷积神经网络和长短期记忆网络。

  38. chithambaram 2017年11月21日下午7:48 #

    深度学习如何应用于音乐?计算机是否有可能分析现有音乐来创作新音乐?如果可以,应该使用哪种算法?

  39. Javed Iqbal 2017年11月21日下午8:38 #

    尊敬的Jason Brownlee博士,我真的觉得这对于这个领域的新手来说非常有用和有帮助。

  40. Hamed 2017年12月6日下午4:46 #

    我对机器学习和神经网络很熟悉。我的专长是优化,我对这个领域很感兴趣。您认为一个好的起点是什么?我更喜欢通过实践来学习它,看看它在不同情况下是如何工作的。

    • Jason Brownlee 2017年12月7日上午7:50 #

      我有一些关于如何入门的建议,可能会有所帮助
      https://machinelearning.org.cn/start-here/#deeplearning

      • Hamed 2017年12月7日下午1:14 #

        非常感谢 🙂

        • Precious 2020年7月17日上午3:06 #

          深度学习的客观研究是什么

          • Jason Brownlee 2020年7月17日上午6:24 #

            有些人对该方法的局限性及其突破感兴趣,例如学者。

            有些人对解决难题的更好方案感兴趣,例如工程师。

            我在这里关注后者。

  41. JD Maloy 2017年12月8日上午7:50 #

    你认为深度学习系统能以类似于小孩子的方式被“教会阅读”吗?也就是说
    1. 每页单词的视觉输入
    2. 这些单词被朗读时协调(即同步)的声音输入
    3. 根据需要通过“阅读”同一本书多次来重复/加强
    4. 通过“阅读”各种书籍来扩展数据集

    …最终目标和测试是向系统展示一本它以前从未“见过”的书,并让它通过合成语音“阅读”那本书。

    (不用管翻页的机器人技术,我们可以把那部分留给人工协助。)

    • Jason Brownlee 2017年12月8日下午2:27 #

      可以构建这种形式的通用系统,但我不确定“像个孩子”的部分。

  42. nazek hassouneh 2017年12月11日上午4:08 #

    我是nazek hassouneh
    我是一名硕士生,我的论文是关于深度学习的
    我有一个带有类别标签的数据集
    我将使用深度学习进行分类
    数据集是excel格式,将转换为CSV格式
    数据集有49个属性和131,000条记录
    我该如何使用深度学习,我需要教程
    我需要适合这个数据集的特定神经网络

  43. Alexander 2018年1月23日下午11:05 #

    深度学习中非常有用的文章

  44. Tyler 2018年1月27日下午11:10 #

    谢谢Jason。一如既往的精彩文章。

  45. Mat Rawsthorne 2018年1月29日上午6:21 #

    嗨 Jason
    喜欢您关于机器学习和自然语言处理的文章!如果这是一个愚蠢的问题,请原谅,但深度学习模型中的额外层会使它们更透明还是更不透明?我正在考虑在论坛交流中寻找有益评论的模式——我能否识别出发现的特征(例如,作为一系列IFTTT规则),或者它们只会作为一系列因子权重出现?
    我是新手,所以非常欢迎任何指导
    继续努力
    最好的祝福
    Mat

    • Jason Brownlee 2018年1月29日上午8:20 #

      层增加了抽象层,这使得模型更加复杂/不透明。

  46. Mat Rawsthorne 2018年1月29日下午10:17 #

    谢谢Jason。我看到人们在提高深度学习的透明度方面取得了进展 https://arxiv.org/abs/1710.09511
    我正在学习您的NLP速成课程以了解更多信息

  47. Alaa 2018年2月6日下午11:36 #

    嗨..
    这是我见过最棒的博客,非常感谢您的所有努力,祝您一切顺利????
    我是一名硕士生,我的论文是关于乳腺癌诊断的,我想知道深度学习算法是否适合我的论文
    如果答案是肯定的,哪一个最好
    我非常困惑,请帮帮我????

  48. Imtiyaz 2018年2月22日下午10:37 #

    非常好。我想在旅游业中使用深度学习。我可以设法获取游客数据。
    你能告诉我如何在旅游业中使用深度学习吗?

    谢谢

  49. Kelemu 2018年2月28日上午4:23 #

    感谢您分享这些富有启发性的想法,尤其是对于像我们这样资源匮乏的国家。我正在尝试完成我的论文,主题是“通过深度学习进行自动驾驶汽车的物体检测”,您建议哪种方法来完成我的论文?

  50. anna 2018年3月2日下午1:26 #

    对像我这样的初学者非常有帮助。现在我正在做一项研究,题目是“深度学习方法在心脏病分析中的应用”。我应该使用哪种合适的技术?

    • Jason Brownlee 2018年3月2日下午3:24 #

      谢谢。

      也许可以尝试一系列方法,看看哪种最适合您的特定数据集。

  51. hans 2018年3月7日上午5:51 #

    非常感谢Jason的宝贵信息,我有一个关于特征提取的问题;
    我知道特征选择,但是深度学习的属性“特征提取”是什么意思。

  52. Jomy 2018年3月8日下午9:13 #

    想了解更多关于深度神经网络及其变体的信息。请问如何学习?

  53. Fabio 2018年3月15日上午2:39 #

    你好 Jason,

    我是一名博士生,正在研究一个利用大数据的去中心化IDS(入侵检测系统)平台,并且我正在使用机器学习算法来检测一些基于签名的攻击。

    我正在研究深度学习是否是检测非签名攻击(异常)的好AI方法。我使用神经网络训练了一个特定节点来检测特定的基于签名的攻击,但我对深度学习是新手,不确定如何将其应用于我的模型。

    多层感知器、卷积神经网络或长短期记忆网络算法是否适用于检测海量原始数据的异常?

    提前感谢,文章很棒,非常有用。

    • Jason Brownlee 2018年3月15日上午6:33 #

      我建议测试一套方法,看看哪种最适合您的特定数据集。

  54. AJITH L M 2018年4月15日下午4:44 #

    如果我是新手,我应该从哪里开始,尽管我读完了整篇文章,但我很难理解一些技术术语?那么,如果我从零开始,我应该从哪里开始呢?
    谢谢你

  55. Shreenivas Londhe 2018年4月30日下午12:30 #

    深度学习在回归问题中的应用如何?它能用于像单变量模式下的海浪预测问题吗?

    • Jason Brownlee 2018年5月1日上午5:30 #

      可能有用。不妨尝试一下,看看结果如何。

  56. Hazem 2018年5月1日下午10:59 #

    谢谢您,Jason Brownlee博士
     感谢您所做的巨大努力
    我有几个问题,希望能像我们以前那样广泛讨论
    CNN是深度神经网络之一,它可以非常深,但我的问题是,在代码中,如何区分它是普通神经网络还是深度神经网络,因为这两种情况都可以使用它

    我实现了一个深度学习应用程序,可以预测我的客户是否会继续使用他的服务

    代码

    import theano
    import theano
    import tensorflow

    # 导入库
    import numpy as np
    import matplotlib.pyplot as plt
    import pandas as pd
    # 导入数据集
    dataset = pd.read_csv(‘C:/Python34/Churn_Modelling.csv’)
    X = dataset.iloc[:, 3:13].values
    y = dataset.iloc[:, 13].values

    from sklearn.preprocessing import LabelEncoder, OneHotEncoder
    labelencoder_X_1 = LabelEncoder()
    X[:, 1] = labelencoder_X_1.fit_transform(X[:, 1])
    labelencoder_X_2 = LabelEncoder()
    X[:, 2] = labelencoder_X_2.fit_transform(X[:, 2])

    onehotencoder = OneHotEncoder(categorical_features = [1])
    X = onehotencoder.fit_transform(X).toarray()
    X = X[:, 1:]

    # 将数据集分割为训练集和测试集
    from sklearn.model_selection import train_test_split
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.4)

    # 特征缩放
    from sklearn.preprocessing import StandardScaler
    sc = StandardScaler()
    X_train = sc.fit_transform(X_train)
    X_test = sc.transform(X_test)

    # 导入 Keras 库和包
    import keras
    来自 keras.models import Sequential
    from keras.layers import Dense

    # 初始化神经网络
    classifier = Sequential()

    # 添加输入层和第一个隐藏层
    classifier.add(Dense(activation=”relu”, kernel_initializer=”uniform”, units=7, input_dim=11))
    # 添加第二个隐藏层
    classifier.add(Dense(activation=”relu”, kernel_initializer=”uniform”, units=7))
    # 添加输出层
    classifier.add(Dense(activation=”sigmoid”, kernel_initializer=”uniform”, units=1))

    # 编译神经网络
    classifier.compile(optimizer = ‘adam’, loss = ‘binary_crossentropy’, metrics = [‘accuracy’])

    # 拟合模型
    classifier.fit(X_train, y_train, batch_size = 50, nb_epoch = 500)

    # 预测测试集结果
    y_pred = classifier.predict(X_test)
    y_pred = (y_pred > 0.5)

    # 创建混淆矩阵
    from sklearn.metrics import confusion_matrix
    cm = confusion_matrix(y_test, y_pred)

    数据集

    这个应用程序是在互联网上找到的,它的代码是(我能否指定哪些函数(代码)使其成为深度学习)

    您已经为自己实现了一个应用程序来学习上帝,名为《您的第一个Python机器学习项目》

    哪些函数让我知道这个代码是深度学习还是机器学习

     过去,可以在多层感知器(MLP)中放置许多层并使用大量数据

    MLP现在是深度学习算法之一
     你完成的代码有什么深奥的学习

    抱歉耽搁了,我想向我解释一下,这个应用程序是使用深度学习算法实现的,而这个算法应用程序没有使用深度学习

  57. Hazem 2018年5月2日下午2:00 #

    对不起,Jason博士,我催促您了
    我还想要一小段代码,展示深度学习与传统学习的区别

    • Jason Brownlee 2018年5月3日上午6:30 #

      在深度学习的背景下,“传统学习”是什么?

  58. Hazem 2018年5月3日下午3:34 #

    我指的是传统学习,即我们不使用深度但用法相似的算法
    就像RNN是在深度学习思想产生之前使用的
    但我的意思是,代码将如何区分RNN和DNN,因为RNN和许多之前的算法都是深度学习算法

    感谢您的耐心

    • Jason Brownlee 2018年5月4日上午7:33 #

      一般来说,现在任何神经网络都可以被称为深度学习。除了营销之外,我看不出有什么实际区别。

  59. ilham 2018年5月20日下午1:32 #

    亲爱的Jason先生,我有一点不明白。文章中说,深度学习的性能随着数据量的增加而提高,而其他旧算法则倾向于达到一个平台期。您能详细解释并举例说明这个平台期吗?

    最初我以为平台期是因为更多的数据会导致过拟合,但经过一些浏览我发现更多的数据会降低过拟合的几率。是特征的数量,而不是数据量导致过拟合。我能想到的唯一可能导致平台期的是启发式算法,它会产生更多的局部最小值,算法可能会卡在那里。

  60. Rayan 2018年6月10日下午6:51 #

    谢谢约翰。我觉得这篇文章非常有用。
    我现在确信我知道什么是深度学习了。

  61. Deepansh Agrawal 2018年6月23日下午8:15 #

    一篇非常好的博客,约翰。我是深度学习领域的新手,这篇博客对我帮助很大。

    谢谢

    • Jason Brownlee 2018年6月24日上午7:31 #

      我很高兴它有所帮助,另外,我的名字是“Jason”。

  62. Amit 2018年7月27日下午7:50 #

    我们能否使用深度学习检测任何网络上的恶意软件感染/DDoS/暴力破解攻击?

  63. Sama 2018年8月2日下午11:13 #

    您好,我想了解使用PAC贝叶斯的深度学习方法有哪些。然后将它们与其他类型的方法进行比较。

    您能为我澄清这个问题吗?

  64. shano 2018年8月13日上午12:37 #

    https://www.technoonews.com/2018/08/what-is-neural-network.html
    技术爱好者

  65. Sean King 2018年9月29日上午3:00 #

    我的大脑刚刚爆炸了。

  66. Karthik Mudlapur 2018年10月21日下午10:56 #

    精彩的阅读,这篇文章给了我在这个领域撰写硕士论文的良好开端。谢谢。

  67. Preethi S 2018年10月23日下午7:24 #

    嗨,先生,
    我是Preethi,正在使用Visual Studio C++。我的研究问题与分类和预测有关。现在我正尝试在我的问题中使用深度概念(稀疏自编码器),但我没有找到任何C++的自编码器包。我找到了很多Python包,但我必须使用VS C++。OpenCV提供了CNN的模块,但没有提供自编码器的模块。
    您能给我推荐一些可以在VS C++中使用的包吗?

    期待您的回复。

    • Jason Brownlee 2018年10月24日上午6:27 #

      抱歉,我不熟悉用于深度学习的C++库。

  68. Dr. Upasana Sharma 2018年11月13日下午6:07 #

    关于深度学习的非常有用的文章

  69. Ankit Sethia 2018年11月23日上午12:21 #

    请详细解释深度学习中的卷积网络模型。

  70. Aarvish 2018年11月27日下午6:04 #

    粒子群优化算法和蚁群算法这些人工智能范畴下的算法是否与深度学习方法或机器学习中的无监督学习技术有关?

    • Jason Brownlee 2018年11月28日上午7:38 #

      不完全是,它们是优化算法。

      神经网络是函数逼近算法。

  71. Kumar 2019年1月8日下午5:25 #

    这篇文章让我对深度学习有了很大的了解。目前正在进行数据挖掘研究。您能建议我如何将深度学习应用于癌症分类吗?目前我正在应用布谷鸟搜索优化算法。

  72. Jack Liu 2019年1月17日下午9:41 #

    嘿,我想知道你对人工智能在医疗保健中的实施有何看法

  73. Md. Abbas Ali Khan 2019年1月24日 下午3:52 #

    嗨,
    我是初学者,想建立一个CVML - 计算机视觉和机器学习实验室。我需要哪些工具和要求?

  74. Tingting 2019年1月29日 上午3:57 #

    谢谢你,Jason。这篇文章写得很好,信息量很大。

  75. Amit Jindia 2019年1月31日 下午10:46 #

    谢谢。这篇文章信息量很大。

  76. Izzy 2019年2月24日 上午9:54 #

    你好 Jason,谢谢你这篇富有启发性的文章。

    我理解的是,隐藏层充当了从数据中学习特征的角色。它们通过
    通过连续对输入数据应用非线性变换(使用激活函数),将其映射到新的空间:特征空间,从而实现这一目标。
    在分类任务中,在这种特征空间中,类别变得更容易(线性)分离。
    那么回归任务呢?在用于回归的深度神经网络模型中,隐藏层的功能是什么?

    提前感谢您!

    • Izzy 2019年2月24日 上午10:15 #

      我想说:在回归任务中,输入数据会进行非线性变换到特征空间,然后可以在该新特征空间中应用线性回归来近似数值目标变量。

    • Jason Brownlee 2019年2月25日 上午6:34 #

      不完全是,模型可以学习类别的非线性分离。

      同样的思想,但它学习的是输入和输出值之间关联的非线性拟合。

  77. Izzy 2019年2月25日 下午11:11 #

    好的,谢谢你的回复。
    我说的这个情况适用于SVR吗?

    • Jason Brownlee 2019年2月26日 上午6:22 #

      不完全是,SVM 可以有非线性核。

      • Izzy 2019年3月6日 上午5:04 #

        是的,当然。是非线性核使得输入数据能够进行非线性变换到特征空间。
        这与深度神经网络隐藏层中的激活函数原理不是一样的吗?

  78. Tejas B 2019年2月26日 上午7:12 #

    你好 Jeson

    这是关于深度学习迷你课程的。我已经做了一些研究,阅读了一些关于深度学习的材料,对于深度学习迷你课程 - 第一课 - 任务,以下是所要求的详细信息

    深度学习方法在自然语言处理领域的10个令人印象深刻的应用

    1. 文本摘要

    https://arxiv.org/pdf/1707.02268.pdf

    2. 视频流中人脸的鲁棒实时检测、跟踪和姿态估计

    https://ieeexplore.ieee.org/abstract/document/1334689

    3. 用于图像识别的深度残差学习

    http://openaccess.thecvf.com/content_cvpr_2016/html/He_Deep_Residual_Learning_CVPR_2016_paper.html

    4. 街景图像中的多位数字识别

    https://arxiv.org/abs/1312.6082

    5. 使用深度学习自动统计卫星图像中的鲸鱼数量

    https://www.biorxiv.org/content/10.1101/443671v1.abstract

    6. 基于深度学习算法的短期建筑冷负荷预测方法

    https://www.sciencedirect.com/science/article/pii/S0306261917302921

    7. 像素级图像融合的深度学习:最新进展与未来展望

    https://www.sciencedirect.com/science/article/pii/S1566253517305936

    8. 在自然环境中阅读文本

    https://link.springer.com/article/10.1007/s11263-015-0823-z

    9. 通过联合学习对齐和翻译的神经机器翻译

    https://arxiv.org/abs/1409.0473

    10. 在大型放射学数据库上交错文本/图像深度挖掘,用于自动图像解释

    http://www.jmlr.org/papers/volume17/15-176/15-176.pdf

    正在进行第二课。感谢您提供这些信息。

    非常感谢!!

    谢谢

  79. Nadjema bouaroui 2019年3月6日 上午9:07 #


    你能帮我完成我的硕士论文吗
    研究深度学习近似的性质

  80. Mohanish 2019年3月14日 上午1:34 #

    嗨,先生,我有一个问题,就是如何使用OpenCV和Python训练cifar 10数据集,使其在训练后生成xml文件。
    我的目标是“使用OpenCV和Python检测物体”。
    由于我是这个领域的新手,所以请多多包涵。

    • Jason Brownlee 2019年3月14日 上午9:26 #

      抱歉,我没有关于这个主题的教程,将来可能会涉及到。

  81. shivan 2019年4月21日 上午8:52 #

    你好亲爱的

    我的论文(医学图像分析中的深度学习)该如何开始

    谢谢

    • Jason Brownlee 2019年4月21日 上午9:07 #

      也许从这里开始
      https://machinelearning.org.cn/start-here/#dlfcv

      • shivan 2019年4月21日 上午10:22 #

        一般来说,我应该先从计算机视觉开始,然后更具体的主题是医学图像分析,对吗……谢谢

        • Jason Brownlee 2019年4月22日 上午6:14 #

          我建议你直接开始你的项目,而不是通过学习科目来为项目做准备。

          也许最合适的方法将是深度学习模型,例如预训练的卷积神经网络。

  82. Sami 2019年4月22日 下午10:33 #

    大家好,我的论文题目是“基于深度迁移学习的唇裂面部美学评估”,我如何使用深度学习和迁移学习模型并将其结合起来,开发一个唇裂面部美学测量系统,请帮帮我,我真的很担心。

  83. Andrews 2019年4月26日 上午1:14 #

    谢谢您的信息,现在我明白了

  84. Osahon Okoro 2019年5月6日 下午6:41 #

    谢谢 Jason。

    这篇文章真的让我对深度学习有了更清晰的认识。我不知道您是否能为我的硕士论文提供帮助。我打算使用深度学习从可穿戴设备获取收缩压和舒张压数据,然后通过CNN进行处理,以生成更准确的输出值。
    CNN将在并行架构上运行以适应处理能力。

    作为一家ICT公司的顾问,我还想知道您是否愿意接受该公司的咨询合同?如果您有兴趣,可以通过我的电子邮件联系我。

  85. James Lee 2019年5月22日 下午6:41 #

    一直在阅读大量关于机器学习/深度学习、人工智能的资料,思考如何利用它们来提升我的营销策略。可能需要一个技术人员来真正实现,但我只是想对这个主题有一个很好的理解,然后我看到了您的文章。很棒的文章!

  86. BHAVI 2019年6月19日 上午3:34 #

    你好 James……你的文章总是很有帮助。你能告诉我……我们如何利用给定的数据集训练DQN模型吗?

    • Jason Brownlee 2019年6月19日 上午8:16 #

      我希望将来能涵盖这个主题。

      • BHAVI 2019年6月19日 下午2:51 #

        我正在等待您的教程……因为它们是最棒的

  87. Harvey Jones 2019年6月21日 下午11:00 #

    感谢这篇文章。我又读了几篇文章,决定在Tensorflow中进行深度学习。

  88. Mik 2019年6月24日 下午1:40 #

    嗨,jason
    深度学习的哪个部分需要仔细思考才能改进深度学习?
    是权重选择方法,还是神经网络的结构(层数和每层神经元数量,或它们之间的关系)……?
    是哪个部分???

  89. safeharbourship 2019年7月3日 下午9:16 #

    深度学习本身就是一个深入的话题,你阐述得非常出色。请继续分享此类话题。

  90. Temesgen 2019年7月9日 下午3:56 #

    我的论文(比特币价格预测中的深度学习)该如何开始

  91. Valarmathi Srinivasan 2019年7月22日 下午4:02 #

    你好,先生,

    想知道 CNN 中如何提取特征

  92. Ezz 2019年7月26日 下午11:44 #

    你好。作为机器学习新手,这个网站看起来很有前景。谢谢。
    我正在考虑在结构化和已标记的(可能是JSON格式的)但非常大的文本数据集上使用 Google AutoML (https://cloud.google.com/automl-tables/docs/),以编码一些近乎主观的决策,这些决策可能可以通过显式编码实现,但会相当复杂。
    如果能够训练一个机器学习模型,并在人工指导下完成,可能会更优雅和可扩展。
    如果这听起来可行,我应该从“机器学习R语言入门”开始,至少使用其中提到的“浅层”机器学习算法来熟悉该领域,还是深度学习可能更有益,但对于新手来说仍然是一个易懂的主题?
    最终我想在应用程序中运用它。

  93. Luciana Silva 2019年9月20日 上午6:17 #

    你好。你的文章真的很好。我学到了很多关于机器学习的知识。我想知道当数据集未标记或部分标记时,深度学习是否能够处理分类问题。

    • Jason Brownlee 2019年9月20日 下午1:32 #

      谢谢!

      是的,这听起来像半监督学习。

      我建议在您的问题上测试一系列方法,以发现哪种方法效果最好,包括深度学习技术。

  94. Andy 2019年10月19日 上午7:50 #

    Jason,
    我是一名计算机科学学生,修过其他深度学习课程,但目前深入课程的材料对我来说很有挑战性。我理解概念,但在给定时间内很难完成所有部分的工作代码。

    我们刚刚学完RNN和CNN,下个月将学习强化学习和无监督学习。我将被要求使用具有独特架构的网络,并成功进行训练和测试,大多数时候使用导入的数据。我能够运行代码的不同部分,但在完美设置所有参数方面遇到很多麻烦。

    你认为你的新书会对我有帮助吗?

    • Jason Brownlee 2019年10月20日 上午6:14 #

      设置正确的参数对每个人来说都是个难题。

      原因是目前还没有很好的理论来指导如何操作——我们所拥有的最好方法是仔细的实验,这基本上意味着试错。

      我的书不是万灵药,听起来你已经从你的课程中获得了很好的指导。

      如果你需要更多关于如何配置神经网络和诊断故障的建议,这里的教程会很有帮助。
      https://machinelearning.org.cn/start-here/#better

  95. Ravita Mishra 2019年11月2日 上午1:26 #

    你好 Jason,我是研究学者 Ravita,正在研究使用深度学习技术进行可扩展和高效的职位推荐。
    我是深度学习技术的新手,哪种算法适合职位推荐。我正在使用CareerBuilder数据集。请建议我哪种算法能提供更好的准确性和可扩展性。

  96. saif hameed 2019年11月7日 下午9:19 #

    我喜欢这篇文章
    我的问题是
    我将继续攻读博士学位,并继续其他相关工作
    他研究自动图像标注,他使用了CNN
    我可以继续使用混合网络吗?比如 CNN+LSTM+MLP 或者 CNN+RNN 这种?

  97. Prasannaa 2020年1月16日 下午11:54 #

    你将如何使用深度学习实现IT服务管理问题的预测机制?

    • Jason Brownlee 2020年1月17日 上午6:01 #

      我建议为某个问题测试一系列算法,并找出最有效的算法,而不是从解决方案(深度学习)开始。

  98. Monisha R 2020年2月6日 上午6:09 #

    深度学习最近爆发式增长的原因是什么?

  99. ubie 2020年2月26日 上午6:10 #

    我想用基于ANN的布谷鸟搜索优化算法创建一个语音转文本系统。你能指导我吗?

  100. Twenty Oktavia 2020年3月11日 上午8:12 #

    说到深度学习,艾尔朗加大学进行了一项关于多投影深度学习网络在三维医学放射图像分割中的研究。想了解更多吗?请访问以下链接
    http://news.unair.ac.id/2019/12/19/multi-projection-deep-learning-network-untuk-segmentasi-pada-gambar-radiografi-medis-3d/
    谢谢你

  101. JG 2020年6月6日 下午9:22 #

    对深度学习发展主要里程碑背后的人物和概念思想进行了很好的历史回顾和研究,并提供了关键参考文献。

    我可以看到您不仅是一位优秀的机器学习/深度学习普及者,更是一位杰出的机器学习/深度学习科学研究员。

    谢谢 Jason

  102. Medium 2020年6月10日 上午7:09 #

    我快速浏览了一下信息,并计划回去重新阅读。我很好奇,我拥有HTML、CSS、Javascript、PHP和C++的经验。我还计划学习二进制、Python和汇编语言以及其他一些语言。原因是我希望构建能够跨越弱人工智能和强人工智能边界,并接近超级人工智能门槛的人工智能。为此,我计划创建一种计算机语言,但需要大量参考资料。所以,最后,我的问题是。您推荐哪种语言用于深度学习和其他编程语言?

  103. CArlos cuesta 2020年6月29日 上午9:19 #

    好文章,我读了两遍。

  104. krishnapriya 2020年7月11日 上午1:21 #

    先生,我想在机器学习领域进行疾病预测研究。我查阅了许多相关论文,其中大部分使用小数据集。

    我想增加数据集的大小,对于大数据集,哪种方法最好?机器学习可以做到吗?还是深度学习对于大数据集更容易?

  105. lakshmi 2020年7月11日 上午4:24 #

    对于更大的数据集,深度学习是否用于替代机器学习来预测心脏病?

    • Jason Brownlee 2020年7月11日 上午6:21 #

      深度学习是一种机器学习。

      您必须找出最适合您的数据集的方法。

      • Krishna Priya 2020年7月11日 下午7:04 #

        先生,不是关于不平衡数据集的问题。而是如果我们使用数千或数十万条记录,而不是数百条记录。

        • Jason Brownlee 2020年7月12日 上午5:49 #

          处理大型数据集的最佳方法是在您的数据集上表现最佳且符合项目要求的方法。

  106. Rajesh SANYAL 2020年7月28日 下午5:49 #

    我是物理系学生……我没有任何计算机语言基础……但我想学习深度学习和机器学习……我应该从哪里开始?

  107. Renisha 2020年8月2日 下午5:55 #

    你好,先生,您能提供一个使用深度学习对CSV文件形式的数据进行分类的示例吗?

  108. Adnan 2020年8月31日下午9:32 #

    嗨,先生:我需要构建一个用于检测婴儿哭声的项目……所以我需要一个用于人工智能算法中婴儿哭声的模型,您能帮我吗……

    • Jason Brownlee 2020年9月1日上午6:29 #

      抱歉,我没有处理音频数据的教程。我无法给你好的即兴建议。

  109. Saeid Rezaei 2020年9月27日下午10:54 #

    您好,Jason,感谢您精彩的博客。我这个学期选择了深度学习课程,但我对机器学习知之甚少(我计划下学期选择机器学习课程)。我想知道机器学习是深度学习的先决条件吗?还是我可以同时学习深度学习算法和模型以及其他经典机器学习算法?提前感谢您的回答

  110. Ahmed Hamed 2021年1月7日上午3:53 #

    你好 Jason,
    我可以使用深度学习算法(CNN)来解决优化问题吗?例如:我有一个n*m值的矩阵,在我的情况下,我需要从这个矩阵中选择一个值并将其他值变为“0”以最小化误差或最大化能量?有没有matlab代码可以做到这一点?

    • Jason Brownlee 2021年1月7日上午6:22 #

      我不认为这是一个深度学习问题,这听起来像是直接的线性代数。

      抱歉,我没有任何使用matlab代码的例子。

      • Ahmed Hamed 2021年1月7日下午7:17 #

        谢谢

  111. Roshan 2021年1月13日下午8:37 #

    您能提供使用sklearn数据集进行手写数字分类的MLP算法吗?

  112. Shahbaz 2021年1月31日上午5:59 #

    嗨,先生,希望您一切安好,我的老师说Python将在未来10年内退出市场,这在您的视野中是现实吗,他说JS将成为人工智能的未来语言,……您对此有何看法。

    • Jason Brownlee 2021年1月31日上午9:39 #

      也许可以问问你的老师为什么他们这样认为,然后自己做出判断。

  113. KULDEEP 2021年3月17日上午12:49 #

    (base) C:\Users\226399\Kerasprojects>python beach1.py
    数据类型:uint8
    最小值:0.000

    最大值:255.000

    归一化后
    最小值:0.000,最大值:1.000

  114. Mary Hill 2021年4月16日下午9:12 #

    感谢分享。信息丰富的文章。

  115. Alice 2021年6月29日下午7:55 #

    先生您好,我调整了一个用于面部表情识别的模型,目前平均最高准确率约为54%,但我使用了ResNet50

    您能帮我提高准确率吗……

  116. Alice 2021年7月1日下午6:32 #

    非常感谢你

  117. Kofi Antwi 2021年9月11日下午7:11 #

    我们如何引用您的2015年提取会议?我们如何引用您有用的评论?我们如何引用您在会议中使用的幻灯片节选?

    • Adrian Tam
      Adrian Tam 2021年9月14日下午1:12 #

      您是指提供网址吗?

  118. Capital Time 2021年11月24日下午7:53 #

    首先,我很欣赏您的博客;我仔细阅读了您的文章,您的内容对我来说非常有价值。我希望人们也喜欢这个博客。我希望您能凭借您的知识获得更多经验;这就是人们获取更多信息的原因。

  119. Aakash 2021年11月24日下午11:47 #

    非常好的解释.. 非常感谢您的努力!!!

    其他对学习更多数据科学感兴趣的人可以访问- learnbay.co

  120. deepika 2022年1月4日下午6:09 #

    哇,这真是一篇很棒的文章!我真的很喜欢数字世界,学习一直是我保持动力的最佳方法。继续分享!我最近从这里了解到阿姆利则数字学院,您可以学习数字营销课程,这在当今时代是一个很好的有用课程!值得一试。

    • James Carmichael 2022年1月7日上午8:16 #

      感谢您的反馈,Deepika!

  121. Camila 2022年1月14日上午12:06 #

    能给我们讲讲深度学习的面试问题吗?

  122. Fatima 2022年3月4日上午6:22 #

    您好,Jason博士,我有一个数据集。
    它是一个多类别标签分类,我想应用深度神经网络,所有数据集特征都是概率,在应用模型之前我应该如何准备数据。我的问题是:我应该应用数据归一化然后构建模型还是做其他事情?

    谢谢
    此致!

  123. wbaynews 2022年6月4日下午8:42 #

    首先,我很欣赏您的博客;我仔细阅读了您的文章,您的内容对我来说非常有价值。我希望人们也喜欢这个博客。我希望您能凭借您的知识获得更多经验;这就是人们获取更多信息的原因。

    • James Carmichael 2022年6月5日上午10:21 #

      感谢您的支持和反馈,wbaynews!

  124. Hossam 2022年7月16日下午11:33 #

    你能指出如何开始像税务欺诈分析这样的项目吗?

  125. Prabham 2022年11月4日下午10:05 #

    深度学习本身就是一个深入的话题,你阐述得很好。请继续分享此类话题。

    • James Carmichael 2022年11月5日上午8:11 #

      感谢您的支持和反馈,Prabham!我们非常感谢!

  126. Ula Yousef 2024年2月14日上午1:28 #

    感谢如此精彩的文章。
    您能给我一个清晰的解释,说明深度学习和机器学习之间的区别吗?
    他们所说的浅层学习与机器学习一样吗?

    • James Carmichael 2024年2月14日上午9:33 #

      嗨,Ula……非常欢迎!机器学习(ML)是研究能够从经验(例如描述过去的数据)中学习的系统的学科。您可以在这篇文章中了解更多关于机器学习的定义

      什么是机器学习?
      预测建模是机器学习的一个子领域,也是大多数人提到机器学习时所指的。它涉及从数据中开发模型,旨在对新数据进行预测。您可以在这篇文章中了解更多关于预测建模的信息

      预测建模入门简介
      深度学习是机器学习中人工神经网络的应用。因此,它是机器学习的一个子领域。您可以在此帖子中了解更多关于深度学习的信息

      什么是深度学习?

发表评论

Machine Learning Mastery 是 Guiding Tech Media 的一部分,Guiding Tech Media 是一家领先的数字媒体出版商,专注于帮助人们了解技术。访问我们的公司网站以了解更多关于我们的使命和团队的信息。