了解当前特别之处,对于使机器学习成为一个有吸引力的学习领域至关重要。知道它为何流行,可以像指南一样,结合该领域所做的承诺。它可以突出开放性问题和方法,这些是增长领域,以及为什么会是这样。
机器学习现在很受欢迎。这种受欢迎程度的一个例子是斯坦福大学在线机器学习课程的受欢迎程度,该课程在第一年就有数十万人表达了学习兴趣。此外,追踪搜索词受欢迎程度的Google Trends显示,机器学习的搜索量即将超过人工智能的搜索量。机器学习正在走出课本,O'Reilly和Manning等技术出版商正在为普通技术读者出版关于机器学习的书籍。
在本文中,我们将回顾导致机器学习现在如此受欢迎的各种因素。
成熟的领域
在过去十年中,机器学习领域已经取得了长足的进步,在最近几年也发生了很大变化。
机器学习起源于人工智能领域,是一系列从数据或经验中学习的方法。这个分支包括遗传算法和群体智能等领域,这些领域可以被视为从环境中学习的方法。
在20世纪90年代末和21世纪初,这些受生物启发的方法进一步分化成自己独特的领域,通常称为元启发式或计算智能,而机器学习则专注于从数据中学习的方法。
这种成熟化侧重于从统计学领域借鉴方法,重新应用方法并推广该领域方法的统计学和概率学基础。因此,机器学习的绰号正转向统计机器学习。
除了该领域身份的成熟外,该领域使用的方法也已成熟。已经开发出强大的方法,并且在统计学和概率学框架中对其原理有了很好的理解。实现这些方法的工具也在过去10到20年里不断成熟,例如R统计工作台和Weka框架。这些方法已经并将继续进入主流。
丰富的数据
现在有大量的数据,正在收集和存储的数据也在不断增长。
“信息过载”之类的说法评论了普通人可以获得的信息。电子邮件、社交网络、博客、RSS和播客向我们提供了大量信息。很难跟上。担心错过有用的内容以及寻找和跟踪最佳内容的压力非常真实。机器学习方法提供了工具来定位和推荐最相关的内容,以克服信息过载。

照片来源:k0a1a.net,保留部分权利
我们日常使用和交互的系统正在创建描述这些交互的数据。“数据排放”等说法被用来描述这些数据的创建。这些数据可能对正在收集它的组织有价值,如果数据可用,对您——数据的创建者——也有价值。机器学习提供了将从这种排放收集的数据转化为有意义的信息,以指导决策的方法。
目前正在收集和可以收集到以前没有为个人或大规模收集的数据。像Quantified Self这样的组织正在探索追踪和收集人们日常信息的各种方式,从心跳、呼吸、步数等生物信息,到对话和说的话等互动。手机上布满了传感器,可以监测周围区域的方向、位置、音频和视频。
这些数据流可以在人、地点和组织等汇合点相遇,并且可以回答以前甚至没有设想过的问题。
一个随意的例子是,您可以对某个地点(例如家庭办公室)的心理状态(例如无聊或拖延)进行建模,并触发干预措施(例如激发有针对性的行动),以优化某个目标(例如生产力)。机器学习方法提供了使用大量看似不同的数据来建模复杂问题的能力。
丰富的计算能力
计算能力是丰富的,而且很便宜。这就是为什么有如此丰富的数据,以及为什么我们有更强大的机器学习方法。

照片来源:torkildr,保留部分权利
在我有记忆以来,我一直为算法的长运行编写脚本和程序。我会认真思考我想要回答的问题(例如哪个算法更好,哪个算法参数更好,等等),编写脚本或程序来回答该问题,并在夜间运行实验,在我工作时甚至整周都在运行。
世界发生了很大变化,您现在可以以每小时几美分到几美元的价格租用非常强大的计算机,并在海量数据集上运行非常大的实验。
廉价且丰富的计算能力使您能够在托管基础设施上运行您从未考虑过在工作站或家用电脑上运行的实验。
这种丰富的计算能力也意味着您可以编写超出其预期用途的系统。过去,运行电脑游戏时所有的CPU时间都用于图形引擎。渐渐地,越来越多的计算能力可用于人工智能,使计算机控制的对手更加智能和引人入胜。这是计算能力普遍使用的一个类比。我们拥有如此多的计算能力,而且如此便宜,以至于我们主动设计系统来转移核心活动的周期,去做我们以前从未考虑过的事情。例如,对个体用户进行建模以自定义应用程序和网站的用户界面,以及在Web初创公司中运行客户行为的进阶报告,这两项行动以前通常只有大型企业才能做到。
机器学习之所以流行,是因为计算能力丰富且廉价。丰富且廉价的计算能力推动了我们正在收集的数据的丰富性以及机器学习方法能力的提高。
在本文中,您了解到机器学习之所以现在流行,有三个原因:
- 该领域在身份和方法及工具方面都已成熟。
- 有大量数据可供学习。
- 有大量的计算能力可用于运行方法。
您是否有一些想法,可以利用丰富的计算能力、数据和成熟的机器学习领域?请留下评论。
真是太疯狂了!!有没有地方可以看到所有有趣的机器学习项目列表,以及它们进展到什么程度?我对生物学感兴趣。
我喜欢用机器学习进行天气预报
事实是我需要一个完整的机器学习案例,从头到尾。到目前为止,我读了大量关于机器学习的东西,但完全不清楚它是怎样的。我很乐意有一个典型的例子——从零开始到算法(为什么选择它)到决策制定(为什么决策制定)。
有丹·阿内利的一句话说:“大数据就像青少年性爱:每个人都在谈论它,没有人真正知道如何做,每个人都认为其他人都在做,所以每个人都声称他们正在做……”
谢谢,我期待您的回复。
嗨 Eze,我这里不涉及大数据,抱歉,但我有很多端到端的实战示例。
这是 Python 的入门示例
https://machinelearning.org.cn/machine-learning-in-python-step-by-step/
这是 R 的入门项目
https://machinelearning.org.cn/machine-learning-in-r-step-by-step/
我认为如今海量数据将促进越来越多预防性系统的产生。如果我们考虑一下,我们今天的大多数系统实际上都是被动的。一个可以从海量的社交媒体数据中受益的领域是反恐或在犯罪发生前进行侦测(就像《少数派报告》一样,只是没有那些进行预测的奇怪的人,哈哈)。
您对此有何看法?
很棒的想法!
试试 Kaggle
好建议。
https://www.kaggle.com/search?q=biology
晚上好,
我认为我们可以将机器学习应用于能源领域,以监测能源效率并减少世界污染。
嗨 Oumaima…以下资源可能对您感兴趣
https://machinelearning.org.cn/how-to-develop-lstm-models-for-multi-step-time-series-forecasting-of-household-power-consumption/