与传统软件项目相比,机器学习项目的协作方式略有不同。在机器学习项目中,工程师们处理的是数据、模型和源代码。此外,他们还需要共享特征、模型实验结果和管道。您不能简单地使用任何代码共享平台来进行机器学习项目;您[…]

与传统软件项目相比,机器学习项目的协作方式略有不同。在机器学习项目中,工程师们处理的是数据、模型和源代码。此外,他们还需要共享特征、模型实验结果和管道。您不能简单地使用任何代码共享平台来进行机器学习项目;您[…]
机器学习中的损失函数是一种数学公式,用于计算模型预测输出与实际输出之间的差异。然后,损失函数用于微调模型权重,然后检查其是否提高了模型的性能。机器学习算法的目标是[…]
如果您正在阅读本文,我假设您已经知道什么是机器学习。但为了快速回顾一下,简单来说,就是让计算机足够智能,能够完成人类曾经做过的工作,例如,通过面部识别来点名。总之,让我们转到主要讨论,我知道有很多[…]
引言 将机器学习模型部署到现实世界是部署人工智能技术和系统的关键部分。不幸的是,模型部署之路可能充满挑战。部署过程通常伴随着将训练好的模型——这是漫长的数据准备过程的成果——投入使用的相关挑战[…]
引言 在机器学习中,不完美的数据是常态而非例外。同样常见的是二分类不平衡,即训练数据中的类别仍然是多数/少数类别,或者存在中等程度的倾斜。不平衡数据可能通过产生模型选择偏差来削弱机器学习模型。因此,为了模型的性能和[…]
引言 分类算法是数据科学的核心,帮助我们对数据进行分类和组织到预定义的类别中。这些算法广泛应用于垃圾邮件检测、医疗诊断、图像识别和客户画像等领域。正因如此,数据科学新手必须了解[…]
推荐系统可能是普通大众最常见的预测模型类型。它们为亚马逊、Spotify 和 YouTube 等服务上的推荐提供了基础。对于初学者来说,推荐系统是一个庞大而艰巨的话题。数据准备技术、算法和模型评估的方法多种多样[…]
完整的机器学习书架。书籍是一项绝佳的投资。您只需花几十美元就能获得多年的经验。我热爱书籍,我阅读我能找到的所有机器学习书籍。我认为拥有良好的参考文献是获得机器学习问题答案的最快方式,而拥有[…]
机器学习播客现在已经成为现实。现在有足够多的人对这个晦涩的技术话题感兴趣,以至于有专门的播客来讨论预测建模的方方面面。现在是开始并在这个令人惊叹的领域工作的好时机。在这篇文章中,我想[…]
程序员通过从头开始实现技术来学习。这是一种学习方式,可能比其他学习方式慢,但更完整,因为所有涉及的微观决策都变得熟悉。实现是从头到尾被掌握的。在这篇文章中,我们仔细研究了 Joel Grus 的热门书籍[…]