Python会议 PyCon2014 最近举行了,会议视频已经在线了。
我一直在学习那些有趣的机器学习课程,并将在接下来的几周内分享一些。
对于刚开始接触Python中的数据科学或机器学习的人来说,Melanie Warrick 的一个精彩演讲非常值得一看,题目是《Python机器学习入门指南》。它大约有25分钟长。演讲的摘要是:
提供机器学习的介绍,以阐明它是什么,不是什么,以及它如何融入当前围绕数据分析和大数据的所有热门话题之中。
https://www.youtube.com/watch?v=uBorfxosVYs
Melanie 以一个伟大的 机器学习定义 开始,引用了 Arthur Samuel 的话:
计算机……在没有……明确编程的情况下进行学习的能力
她将机器学习定位为人工智能和数据科学中使用的工具集。同样地,她将大数据描述为超出常见技术捕获和整理能力的数据。这个定义我很赞同。尽管这次演讲是关于机器学习的介绍,但重点是机器学习在数据科学中的应用。
Melanie 将四种主要的数据科学角色描述为数据领导者、数据创意者、数据开发者和数据研究员,并使用图表指示每个角色进行的机器学习量。她还描述了一个数据科学项目的工作流程。
通过我的新书 《Python机器学习精通》,开启您的项目,书中包含分步教程以及所有示例的Python源代码文件。
她提供了一个使用 scikit-learn 在二维数据集(头部大小与大脑重量)上进行线性回归的可爱示例。她还很有用地将Python工具归类:
- 探索数据:pandas、statsmodels、matplotlib、numpy、unix
- 构建模型:scikit-learn、numpy、pandas、scipy
- 测试模型:scikit-learn、matplotlib
- 数据产品:API、Flask、Django
- 可视化:D3、Matplotplib、vincent和vega、ggplot
在结尾处还有一个关于Python和R承包的问题,她提出了一个恰当的建议:坚持使用一种语言(即Python),这样您就不需要在研究和生产之间切换语言。
该演讲 可在YouTube上观看,也可在 pyvideo存档 中找到。您可以查看 演讲的幻灯片 并从github下载 示例代码。Melanie 在 nyghtowl.io 上维护博客,您可以在 这里查看她关于该演讲的帖子。
很棒的视频,也是一篇对那些想在机器学习+Python领域入门的人有用的文章。如果您对机器学习感兴趣,应该看看我们新的文本挖掘工具包,我们正在进行私有alpha测试:http://www.monkeylearn.com/,也许我们的工具对您会有帮助。
非常棒的工具,谢谢分享。我很想试试。如果能获得私有测试版的访问权限,请告诉我。
嘿 Jason,我们非常希望得到您的反馈!我们将在几天内向您发送私有alpha版的访问权限(我们收到了您的邀请请求,所以我们有您的电子邮件)。感谢您的关注🙂
嘿 Jason,我们已向您发送了MonkeyLearn私有alpha版的邀请。如果您有任何问题,请告知我们!祝您一切顺利。
听起来很棒……我在人工智能的计算机科学课程中接触了Python及其库。学习这个主题的更多背景应该有助于理解它。
很棒的视频。感谢分享!