Kaggle前CEO Jeremy Howard于2013年中期在旧金山大学做了一次演讲。演讲中,他谈到了诸如Kaggle之类的机器学习竞赛更广泛的好处。
在这篇文章中,您将了解我从这次演讲中提炼出的5点,它们将激励您开始参加机器学习竞赛。
旧金山大学的大数据
Howard的演讲题目是“Kaggle的Jeremy Howard谈旧金山大学的大数据”。这个标题有些误导。演讲主要关注Howard的背景,他如何接触到机器学习,以及简要谈到Kaggle。
Howard有创业背景,这次演讲很好地概述了他的背景以及他在此过程中可以分享的经验教训。
在演讲接近尾声时,Howard谈到了Kaggle及其使命,这激发了我提出的这5点。它们是:
- 精英制度:地位完全基于能力。
- 榜样:表现最好的人及其成长故事成为榜样。
- 突破极限:排行榜推动您和团队的能力。
- 创新:竞赛带来技术创新。
- 社群:志同道合的人找到彼此并分享想法。
1. 精英制度
数据科学或机器学习竞赛是一种精英制度。这意味着排名完全基于实力。
就像体育运动一样,唯一重要的是运动员取得的成绩。你的出身、性别或就读的学校都不重要。重要的是你取得什么样的成绩。
这样的系统是公平的,工作场所存在的偏见不会影响结果。该系统也是透明的,每个人都可以访问相同的原始材料(训练数据)和性能评估(排行榜)。
我们曾在之前的文章《应用机器学习是一种精英制度》中讨论过这一点。
2. 榜样
竞赛造就榜样。
竞赛结果表明,通常表现出色的是那些具有适应性工程思维、善于运用有效方法取得最佳结果的人,而不是学术界的专家。来自不同背景、有各种有趣经历的人在平台上名列前茅(前10名或前100名)。
这会产生榜样的效应。他们的故事与众不同,例如,有人仅仅在一年前才通过免费的Coursera课程接触到机器学习。这些有趣的故事吸引了人们,“他能做到,我也能做到”。
您也会看到,当一位“知名”数据科学家参加竞赛时,比如来自Netflix Prize的明星,这会引起更多的关注,“我想击败那些在Netflix Prize中表现出色的人”。
3. 突破极限
就像体育一样,排行榜可以突破您和团队能力的极限。
仅仅知道有个人拥有你不知道的知识,即使你已经尽了最大的努力,也会促使你去寻找那份额外的信息。
排行榜的实时反馈会对取得的成绩产生心理影响。这可能是有益的,也可能适得其反,就像四分钟跑完一英里一样,直到Roger Bannister打破纪录,证明这是可以做到的。
4. 创新
竞赛带来技术创新。
每一次都会打破最新的基准。这很可能是因为问题为机器学习得到了很好的定义,并且参与者不受限于某个特定领域或研究领域的现有方法。一切皆有可能。
这为解决问题提供了不同的思路,这些思路可以在实际应用中和未来的类似竞赛中得到利用,从而加速整体的进步。
5. 社群
竞赛周围会涌现出各种社群。
在分享信息方面存在一种平衡,既不分享过多导致失去竞争优势。分享对个人和群体都有益,并且似乎在每次竞赛周围都会自动发生。
志同道合的人找到彼此并组成团队,发挥各自想法的优势,并超越他们独立所能达到的境界。
社群和信息流动是优质竞赛的关键要素。它们帮助初学者入门,帮助中级学习者进步,并促进创新。
总结
在本文中,您了解了竞争性机器学习的五个好处:精英制度、榜样、突破极限、创新和社群。
这在机器学习领域并非新鲜事,竞赛已与学术会议结合近20年。新颖之处在于参与的规模和较低的入门门槛。无论您的背景如何,现在都是进入应用机器学习领域的激动人心的机会。
暂无评论。