我经常被问到一个问题:
我怎样才能用机器学习赚钱?
你可以凭借你的机器学习技能,找到一份机器学习工程师、数据分析师或数据科学家的工作。这是许多联系我的人的目标。
当然,还有其他选择。
在这篇文章中,我想重点介绍一些其他的选择,并试着激发你的思考。
鉴于现有海量的数据,机会非常多,你只需要思考并发现那些有价值的问题。这些问题,正是人们和企业愿意花钱来寻找答案的。

用机器学习赚钱
照片由 401(K) 2013 拍摄,保留部分权利
影响力优先
在我们深入探讨具体领域之前,让我们先从一些方法论开始。
与其他任何机器学习问题一样,你需要遵循应用机器学习的流程,但你选择的领域和问题必须存在一个有偿寻求答案的市场。
- 从一个领域中的问题开始(明确定义你的问题)。选择问题的依据是它在该领域的影响力。在这里,影响力可能意味着回报。用一个能做出完美预测的理想化模型进行思想实验。
- 收集解决该问题所需的数据(数据选择)。
- 清理和准备数据,使其适合建模(数据准备)。
- 对问题进行算法抽样测试。务必从最简单的模型开始,并将其用作基准。
- 调整表现最好的模型,并使用阈值处理和集成等方法,以最大限度地利用你选择的模型(改进结果)。
- 展示结果或将系统投入运营,并进行密切监控(展示结果)。
理想情况下,你解决问题的准确性越高,回报就越大(或者说,你可以下的赌注就越大)。
你的初创公司
如果你有自己的企业或网络初创公司,那么你应该认真考虑如何利用你已经在收集的数据。在网络初创公司中,运行一些数据收集服务是很常见的,比如 KissMetrics、Google Analytics 等等。这些数据如何能用来影响你的利润?
根据我的经验,这更多是数据分析工作,而非机器学习工作,但你总是可以拿出一个回归模型,看看它是否比简单的五分位数模型带来更多的提升。
我们在之前的文章中稍微讨论过这一点。尽管如此,这里还是有一些你可以研究的领域:
- 客户转化:对转化或未转化客户的特征进行建模。
- 增销和交叉销售:对接受增销或交叉销售的客户特征进行建模。
- 获客策略:根据客户的获客策略对其价值进行建模。
- 留存策略:对客户留存策略的投资回报率(ROI)进行建模。
- 客户流失:对流失或未流失客户的特征进行建模。
从对利润的影响出发,反向推导出你需要提出的问题,以便做出决策。一旦你能够回答问题并对新客户做出预测,就花时间设计和测试干预策略,以利用或影响这一预测。
开发
你可能是一名懂得如何设计、创建和发布软件的开发者或程序员。想一想,有哪些有价值的在线问题是你可以用机器学习方法来回答的。
你能做出有价值的预测或推荐吗?
我随口能想到的一些例子包括各种公开的社交媒体数据:
- Kick Starter:对一个成功或不成功的 Kick Starter 众筹项目的特征进行建模。
- 社交媒体资料:对一个成功的社交媒体资料(如访问量或页面排名)的特征进行建模,例如在 LinkedIn、Google+ 或 Facebook 上。
- 社交新闻:对在 Hacker News 或 Reddit 等社交新闻网站上发布的热门帖子的特征进行建模。
- 销售页面:对一个成功的产品销售页面(如电子商务或信息产品)的特征进行建模。
从社交媒体数据中获取洞察来赚钱是一个竞争激烈的领域。如果你想认真对待这个想法,你将需要在用于建模的特征上发挥极大的创造力。特征工程将是你的贡献,其重要性或许超过实际模型本身。
这种方法很可能需要收集和处理非结构化的数据集。这些数据集并非整洁的特征矩阵。建模过程是首先描述期望的结果,评估其预测能力,然后做出预测并提供给客户。
金融与博彩
用机器学习赚钱最显而易见的选择是金融和博彩。我对推荐这些领域持保留态度。我认为它们很可能是危险的塞壬女妖。就像捕蝇草一样,它们引诱程序员和机器学习从业者,然后将他们吞噬。

将机器学习应用于股市,但需谨慎。
照片由 Iman Mosaad 拍摄,保留部分权利。
这样做的好处是决策非常明确(哪匹马会赢,或者买卖哪只股票),而且你可以用自己的资金来支持这些决策。我建议对那些你容易理解的问题进行建模,因为一些金融工具可能非常复杂。
我曾涉足高频交易和投资组合优化。这可能很吓人,但也令人兴奋。我建议先进行一段时间的模拟交易,有很好的API可以作为你的数据源。请参阅《我是如何用机器学习和高频交易(HFT)赚到50万美元的》以及《机器学习的金融应用》。此外,你可能还想看看 Quantopian。
我没有尝试过任何博彩问题,但我使用过一些相关方法,比如评级系统,我预计这在文献中会占据重要地位。可以考虑研究赛马和赛狗、体育博彩(双人游戏)以及像扑克这样的纸牌游戏。
和自己比赛。专注于问题,收集数据,并快速定义一些基准结果。你的目标是超越自己的最佳成绩,并利用任何可能有所帮助的东西。你的目标不是要胜过领域专家,至少在很长一段时间内不是。
竞赛
你可以通过参加机器学习竞赛来赚钱。我的建议是,现金奖励不应成为参加竞赛的主要动机。直接寻找咨询客户可以赚到更多的钱。尽管如此,顶尖的参赛者仍然可以赢得现金奖励。
你可以找到机器学习竞赛的一些地方包括:
竞赛是学习、测试和提升技能的绝佳机会。这些网站上通常有很多信息共享,你可以了解到哪些算法和工具正流行。
总结
我们谈到了四个你可以考虑的领域,以便用机器学习赚钱:你自己的业务、社交数据、金融与博彩以及竞赛。
我发现最好的方法是,找到那些你可以用易于获取的数据来解决其问题的人(即咨询)。
你是否在使用机器学习赚钱?或者你对用机器学习赚钱有什么想法吗?
了解你所要涉足的特定体育项目,与掌握机器学习知识同等重要。太多机器学习从业者在对相关体育项目或更重要的博彩规则知之甚少的情况下,就贸然进入体育博彩领域。他们常常认为主要目标是选出例如赛马中最有可能获胜的马,然后着手选择他们认为对这一结果贡献最大的因素。结果他们惊讶地发现,自己的模型表现并不比市场本身好多少。他们也倾向于花更多时间在机器学习方法上,而不是实际的因素选择上,而后者实际上才是最重要的。问题在于他们的技能是机器学习,而荣誉在于展示你对机器学习的了解程度。我的建议是,先尽可能多地了解这项运动及其博彩规则,或者如果你是机器学习专家,就与懂行的人合作。
Jason,这篇文章写得很好。我完全同意 Mark Littlewood 的观点。你必须先把数据整理好,它才能发挥作用。数据是任何机器学习模型的生命。
我也是一名机器学习专家,但同时我也具备 SQL 技能和数据分析经验,我可以将这些技能融入到我的机器学习专业知识中,以发挥它们的优势。
然而,我知道机器学习是未来的一个伟大工具。即使一个人不懂数据分析,网上也有大量的资料可以帮助你获取正确的数据。有许多公共 API 可以作为重要数据的来源。
我一直对机器学习印象深刻,并且知道它的未来非常光明,那些有兴趣成为机器学习专家的人在未来将会赚大钱。
谢谢你,Ankush。
嗨,Jason !! 🙂 🙂 🙂 对于像我这样的人来说,机器学习这个话题非常有趣,我想学习它来赚很多钱。你认为用我的母语西班牙语创建一个会员网站来赚钱是个好主意吗?
我也觉得机器人技术这个话题很吸引人,你建议我做什么呢?......我基本上想开展一个在线业务并用它来赚钱......但在决定要覆盖西班牙市场的哪个主题时遇到了一些麻烦?......
所以我想问你的问题是这些,
1. 你认为会员网站是利用这些主题(机器学习、人工智能和机器人技术)赚钱的最佳选择吗?
2. 你认为最好是把我的精力集中在一个主题上,还是可以涵盖所有这些主题?
3. 博客或 YouTube 频道怎么样?
4. 在线电子书怎么样?
谢谢你的时间,非常感谢你的意见!🙂 🙂 🙂
祝你一周愉快!! 🙂 🙂
祝好,
来自多米尼加共和国
Kreemly
抱歉,我不了解会员网站。
专注于你最感兴趣的。
我不了解 YouTube 与博客的对比。
抱歉,我不了解在线电子书。
嗨,Jason,这是一篇很棒的文章。我发现它对于那些正在考虑进入机器学习领域的人非常有帮助。我是一名健康专家和流行病学家,我想知道机器学习在我这个领域的未来如何。另外,我总是被问到这样的问题,既然已经有许多统计方法可用,机器学习相比它们有什么优势?它在健康数据方面的优势是什么等等。
如果你能解答我的好奇心,我将不胜感激。🙂
感谢你这个伟大的倡议!
在一般情况下无法回答。
对于一个给定的问题,使用能给出最佳结果的方法,无论是统计方法、机器学习方法还是其他方法。
非常感谢。您能描述一下,为了学习机器学习,从初学者到专家水平,我需要了解哪些学科或主题吗?
是的,从这里开始
https://machinelearning.org.cn/start-here/
用机器学习赚钱的有趣途径。我认为就业市场足够大,但没有足够的数据科学家来填补所有职位。这是个赚钱的好方法。
同意。