真实世界机器学习问题巡览

真实世界的例子让机器学习的抽象描述变得具体。

在这篇文章中,您将踏上一次真实世界机器学习问题的巡礼。您将看到机器学习如何实际应用于教育、科学、技术和医学等领域。

列出的每个机器学习问题都包含一个指向公开可用数据集的链接。这意味着,如果您对某个具体的机器学习问题感兴趣,可以下载数据集并立即开始练习。

Real World Machine Learning

真实世界的机器学习
照片由 SMI Eye Tracking 提供,保留部分权利。

最受欢迎的 Kaggle 数据集

前10个机器学习问题的例子来自于机器学习竞赛网站 Kaggle.com。受欢迎程度是基于参赛团队的数量。

最受欢迎的研究数据集

接下来的10个机器学习问题是加州大学欧文分校机器学习库网站上最受欢迎的。该网站传统上托管机器学习研究社区使用的机器学习数据集。

结语

我们快速浏览了20个真实世界的机器学习问题。

这些是全球科学和商业组织提出或研究的实际问题。

更令人兴奋的是,这些多样化的问题都有公开可用的数据集,并且也得到了广泛的研究和理解。

这意味着您现在就可以下载数据,通过实现自己的模型来探索问题,或者重现他人论文或博客文章中的模型。

真实世界机器学习问题巡礼 的 24 条回应

  1. shivaprasad 2017年10月27日,上午3:02 #

    先生,我对这篇文章印象非常深刻,它真的帮了大忙。谢谢您,先生。

  2. Paul 2018年1月18日,上午9:10 #

    亲爱的 Jason 先生,
    成千上万的学生决定学习机器学习,但其中超过一半的人因为对这门学科复杂性的恐惧而中途放弃。但您却用如此轻松的方式出色地解释了这门学科。我只是想表达我热情的感激之情。非常感谢您帮助了我和成千上万像我一样的人。谢谢您。

  3. Aimee 2018年11月28日,上午11:57 #

    嗨,Jason!🙂

    我正计划研究上面的扑克数据集,打算尝试使用 LDA、CART,最后是使用 XGBoost 的梯度提升决策树(GBDT),但我担心分类过程,因为有些手牌可能符合多个类别。理想情况下,您希望从多种可能性中预测出最好的手牌,所以我不太确定这该怎么做。从逻辑上讲,我想,您会以某种方式确定一手牌可能符合的所有类别,然后使用值最大的类别作为最终答案,因为随着手牌变好,类别的值也会增加。对这种方法有什么建议吗?您建议尝试哪些其他模型进行多类别分类?

    谢谢!非常喜欢您的书!!!😀

    • Jason Brownlee 2018年11月28日,下午2:52 #

      听起来是个有趣的问题,抱歉,我对此不太熟悉。我不太敢提建议。

  4. Fredrick Ughimi 2019年2月13日,下午6:54 #

    太棒了!谢谢你,Jason。

  5. Santosh 2019年6月10日,上午3:48 #

    嗨,Jason,

    您的知识非常渊博,这里的细节非常出色。非常感谢。

    我正在寻找关于应用程序行为的预测模型,用来预测应用程序何时可能崩溃或何时可能开始表现异常。

    如果能在这方面提供任何帮助,那就太好了。

    • Jason Brownlee 2019年6月10日,上午7:38 #

      也许可以试试在 scholar.google.com 上搜索。

      • Santosh 2019年6月11日,上午4:10 #

        非常感谢。我到那边去搜搜看。

  6. Gunasekaran 2019年9月6日,下午2:05 #

    感谢 Jason 提供的精彩建议。我来自非计算机科学背景,听说了关于数据科学的酷炫事情,所以想学习机器学习。但基本上我只想问你几个问题。我能看到很多概念验证(POC)、研究项目和样本数据集来练习机器学习,但是
    如果我得到一份数据科学家的工作,我将从事什么级别的工作?
    是使用现有的库来构建模型,还是发明新的算法?
    如果大公司在云平台上已经有了现成的拖放式模型,那里为什么还需要数据科学家呢?

  7. Santosh 2019年9月8日,上午5:34 #

    感谢 Jason 关于机器学习的所有分享。我浏览了不同的学习资料,但没能找到关于机器学习模型如何存储已训练模型信息的内容。它是通过 Pickle 创建的二进制文件,还是有自己的数据库来记忆模式,以便对下一个数据集进行预测?

    任何学习资料都会有帮助。再次提前感谢。

    • Jason Brownlee 2019年9月9日,上午5:07 #

      不同的模型有不同的内部表示。

      例如,CART 是一个决策树,神经网络是一组权重等。

      特定于模型的表示形式被保存到文件中。

      这有帮助吗?

      • Santosh 2019年9月17日,上午1:30 #

        这帮助很大.. 谢谢。我们从哪里可以得到这种映射,因为模型一旦使用 Pickle 训练和保存后,它就存储为二进制文件。

        • Jason Brownlee 2019年9月17日,上午6:32 #

          如果您使用 pickle,那么内部表示无关紧要,因为 pickle 会处理保存和加载。

          • Santosh 2019年9月17日,下午3:41 #

            再次感谢您的分享。

          • Jason Brownlee 2019年9月18日,上午5:55 #

            不客气。

  8. J Chouinard 2021年3月3日,上午8:59 #

    谢谢你,Jason,写了这篇文章。它在深入研究机器学习之前,激励人们去了解它的不同应用。

  9. Suganya 2022年2月26日,上午2:37 #

    你好,Jason先生,非常感谢您与我们分享您的才智。上帝会因您的善行而保佑您。

    • James Carmichael 2022年2月26日,下午12:30 #

      感谢您的反馈,Suganya!

发表回复

Machine Learning Mastery 是 Guiding Tech Media 的一部分,Guiding Tech Media 是一家领先的数字媒体出版商,专注于帮助人们了解技术。访问我们的公司网站以了解更多关于我们的使命和团队的信息。