在线社区在机器学习中非常宝贵,无论您的技能水平如何。原因在于,与编程一样,您永不停止学习。您根本不可能知道一切,总有新的算法、新的数据和新的组合可以发现和练习。
社区是有帮助的。您可以获得问题的答案,通过回答别人的问题来学习,并通过阅读交流来发现新的领域。
机器学习社区对我的教育产生了巨大的影响,在这篇博文中,我想列出我所知道的所有在线机器学习社区,以便您也能充分利用它们。

机器学习社区
照片作者 nadineheidrich,部分权利保留
Stack Exchange
Stack Exchange 网站是问答社区,因此它们针对的是解决问题。您可以提出具体问题,回答您知道答案的问题,以及(我最喜欢的)阅读问题和答案以发现新方法和新观点。
我有四个喜欢的网站可以经常浏览
- Cross Validated:这个网站对算法和统计方法的低级问题很有用。
- Quantitative Finance:(特别是 机器学习标签)如果您在金融领域工作,或者通常在处理时间序列数据时,这个网站很有用。
- Programmers:(特别是 机器学习标签)非常适合解决具体的代码问题,例如在使用某个库或工具时遇到的问题。
- Stack Overflow:(特别是 机器学习标签)同样,与程序员网站一样,它非常适合解决机器学习实现方面的具体问题。它也是最老的网站,可以涵盖机器学习算法和库。
有一个新网站已经上线,但仍在测试阶段,所以可能无法存活。它叫做 Data Science,我发现它在应用于机器学习的通用问题(代码和数学混合)方面非常有趣。
Reddit 是一个由社区组成的社区,称为子版块(sub-reddits)。一个给定的子版块可以是一个问答网站、一个链接共享网站,或者(更典型地)两者的混合。
我常去的几个子版块包括
- Machine Learning:包含“如何开始”的混合内容以及更高级的机器学习博文链接。也适合链接到您自己的项目以获得反馈。
- Computer Vision:主要是关于计算机视觉的理论和实践问题(例如库)。
- Natural Language:专注于自然语言处理,提供很好的问题以及相关文章和博文的链接。
- Statistics:关于统计软件和方法的讨论,非常适合深入研究某个特定方法或算法。
- Data Science:主要是指向数据分析和机器学习交叉领域的文章链接。
- Big Data:专注于大数据生态系统的文章和讨论。
还有其他相关主题的子版块,但我发现它们不是很有用。
Quora
Quora 是一个问答网站,按主题划分,类似于 Reddit,但只有问题和答案。问题通常很好,答案质量很高。与 Stack Exchange 网站不同,它们通常技术性不强,不侧重于问题解决,而内容更丰富。
我常去的几个 Quora 主题包括
- Machine Learning:对于算法、流程、资源和入门方面的高层问题很有用。内容混合。
- Statistics:侧重于更深入的统计方法和算法,但也包含大量机器学习内容。
- Data Mining:很好的问题,侧重于机器学习的应用方面,但与机器学习有很大的重叠。
- Data Science:与数据挖掘和机器学习主题非常相似,问题通常是更高级别的。
还有许多其他可能有用的话题,包括但不限于 Data Analysis、Predictive Analytics、NLP 和 Computer Vision。此外,还有关于特定方法的主题,例如 SVM、Deep Learning、Classification 和 R。
其他
还有一些其他很棒的社区,我无法轻易归类。
- MetaOptimize Q+A:与 Cross Validated 类似,这是一个问答网站,非常适合关于特定算法和方法的低级问题。数学和理论方面内容丰富。
- Kaggle Forums:非常适合讨论具体的比赛和数据集,并且充满了关于特征工程、集成和优化测试用例的宝贵建议。
- DataTau:一个社交新闻网站,专注于数据和机器学习相关主题的文章链接。流量较低但链接很有用。
群组
一些社交媒体网站有机器学习群组。我使用这些的频率不高,但我提及它们是因为您可能会比我发现它们更有用。
有一些 Google+ 群组,例如关于 Machine Learning、R 和 Data Science 的群组。似乎没有权威性的群组,而是围绕不同主题存在多个竞争性的群组。
还有一些 LinkedIn 群组可能很有趣,特别是 Data Mining and Machine Learning 和 Machine Learning Connection。同样,与 Google+ 群组一样,对于给定的领域存在多个 LinkedIn 群组,没有明显的领导者。
曾经有一些我曾如饥似渴地阅读的 Usenet 群组,但现在它们似乎都已死气沉沉(或已被取代)。
线下
最后,考虑一下“现实世界”中的社区。可以看看像 Meet Up 这样的网站,搜索您所在地区关于机器学习、R、数据分析和数据科学等主题的聚会。R 用户组通常是学习和与专业人士联系的好地方。
您知道其他机器学习社区吗?请在评论中留下您的看法。
很好的收藏,谢谢 Jason。
我们开始了一份关于人工智能初创公司、新闻和行业应用的通讯。如果您加入 http://mission.ai,我们将非常高兴。
我们希望为所有参与人工智能的人创造价值。将初创公司与突破性想法和行业内的利益相关者联系起来。
Dean
感谢分享,Dean。
你好
我正在深入学习,并对研究人员进行研究。
我之前监督过我主要学习的机器学习。
这些天我正在研究在线 LDA(线性判别分析)学习,以减少特征的维度。
但是 Python scikit 提供的函数是离线 LDA,并且没有提供类似在线 SVM(如 SGD)的 LDA 函数(https://scikit-learn.cn/stable/modules/sgd.html#sgd)。
我在互联网上找不到与在线 LDA 材料相关的任何数据。
如果您知道,我将不胜感激。
谢谢。
你好 Kwak,我使用 LDA 进行多类分类,但不用作降维,抱歉。
我在这里有一些关于 LDA 的资料
https://machinelearning.org.cn/linear-discriminant-analysis-for-machine-learning/
https://www.amazon.com/gp/customer-reviews/R105LUICP3FJRZ/ref=cm_cr_getr_d_rvw_ttl?ie=UTF8&ASIN=1787128725
哦,天哪,那肯定是个坏消息!
图书《机器学习》的客户评论
实用强化学习:使用 OpenAI Gym、Python 和 Java 开发自进化、智能代理
作者将一切从其他科学家的研究方法复制粘贴。
不要购买这本书,以免浪费您的金钱。
市面上有太多垃圾了。
看看这本书的内容是否被复制粘贴。为什么 Amazon.com 允许发布这类书籍出售?
https://www.amazon.com/Practical-Reinforcement-Learning-self-evolving-intelligent/dp/1787128725/ref=sr_1_fkmr0_1?s=books&ie=UTF8&qid=1512569773&sr=1-1-fkmr0&keywords=machine+learning+by+farrukh
哇!
Nice and Simple but very useful article for Machine Learning Users/Learners.(虽然简单但对机器学习用户/学习者非常实用的文章。)
谢谢 Jason Brownlee。
不客气。
很好的收藏。谢谢。
谢谢。
有没有一个论坛可以让大家讨论这里学习到的内容?
这是我在这里回答的一个常见问题
https://machinelearning.org.cn/faq/single-faq/do-you-have-a-forum-or-slack-channel
MetaOptimize 已下线,还有 Discord、Slack 和 Gitter,它们都服务于相同的目的。
Gitter: https://gitter.im/home/explore
Slack: r/computervision 上的计算机视觉 Slack 群组
Discord: r/learnmachinelearning 官方 Discord
谢谢。
嗨,Jason,
我想训练实时视频流,每帧 8-10 秒。图像处理本身就需要 2-3 天来训练。我尝试使用 opencv 和 tensorflow 来实现,但无法做到。
您能帮帮我吗?
或许可以试试 CNN-LSTM。
https://machinelearning.org.cn/cnn-long-short-term-memory-networks/
“现实世界”?难道不是你的冰箱吗?
现实世界
https://www.urbandictionary.com/define.php?term=meatspace
感谢分享这些精彩的信息。
不客气。
嗨,布朗利,
您的文章对我的研究工作帮助很大。我有一个研究问题,您能指导我吗?那将是很大的帮助。我的问题是
如果使用不同的数据集,比较提出的技术与现有技术的最佳方法是什么?
除非使用相同的数据集,否则无法将其提出的算法与其他算法进行比较。如果使用不同的数据集,但研究问题相同,那么比较提出的技术与现有技术的最佳方法是什么?
提前感谢。
实验结果是比较算法的好方法。计算复杂度是另一种方法。
我认为您应该更新此帖子以包含网站 https://ai.stackexchange.com/。
感谢您的建议!
尊敬的先生
我对学习算法有点困惑,希望我能得到令我满意的答案。
(问题可以考虑线性回归)
我想知道算法是如何学习的。
我知道一些算法。
它们可以由一个逻辑或我们可以说的
一个数学逻辑或我们可以说的任何概念
我们想基于此工作
例如一个非常简单的例子
(在 Pyhton 中)
def see(z,y)
x=z+y
return x
print(see(2,2))
一个纯粹的逻辑答案
这不能定义为学习,
即使以后我传递
参数,它也会给出加法
和同样的事情线性回归在做(对吗)?
接受输入,根据特定条件给出答案。
LR=> h(x_i) = \beta _0 + \beta_1x_i
但是预测=>(h(x_i)) 和学习是从哪里来的?
学习应该是如果它能给出另一个答案
与我的数据集相关,而我没有在
回归内部定义它。
那么,也许有人可以说,在学习算法中
有神经网络的一部分(神经网络)
所以,首先,如果我想知道学习是如何工作的
我必须理解神经网络
所以……
致以谢意
.........
它会迭代地设计从输入到输出的映射函数的参数,从而产生最低的误差。
感谢分享机器学习社区的信息。这些资源肯定有助于学生在机器学习方面取得高水平的专业知识。
很高兴它有帮助。
嗨,Jason,
我是深度学习新手,下面这个 GPU 对深度学习好吗?
https://www.nvidia.com/en-in/geforce/graphics-cards/rtx-2080/
请尽快回复。
抱歉,我不知道,我建议使用云端的 GPU。
https://machinelearning.org.cn/develop-evaluate-large-deep-learning-models-keras-amazon-web-services/
嗨 Jason,我是机器学习新手。我只会基础的 Python 编程。您能指导我或建议我从哪里开始机器学习吗?
就在这里
https://machinelearning.org.cn/start-here/#python
太棒了。非常感谢分享机器学习社区。这正是学生/学习者们迫切需要的。
不客气。
有人能建议一个算法来提取 ICA 应用后的信号吗?我只有来自各个站点的混合信号,顺序是特定的,但在应用 ICA 后,顺序被打乱了,我很难分类哪个信号是哪个站点的。所以,有人能推荐一个可以自动完成这项工作并告诉我哪个信号是哪个站点的算法吗?
是的,请看这个
https://machinelearning.org.cn/faq/single-faq/what-algorithm-config-should-i-use
嗨 Jason
将时间序列数据(其密度随时间变化)输入深度学习网络,并在任何迭代中输入包含历史背景的数据批次,最佳格式是什么?
是考虑固定大小的数据记录还是包含可变数据记录大小的固定时间窗口更好?还是有更好的方法?
提前感谢
使用固定大小的窗口。
本篇博文将展示如何为深度学习准备时间序列数据。
https://machinelearning.org.cn/convert-time-series-supervised-learning-problem-python/
万分感谢。
不客气。
你好 Jason,感谢分享您的文章。我高度推荐您的文章。我是一名 ML 开发人员。我是一名学习者。请与我分享更多机器学习社区。我想加入这些社区或论坛。
谢谢。
好文章。这篇文章很棒。
您解决了我的问题。
我正在寻找像这样的真正群组。
感谢分享。
谢谢。
谢谢 Jason。您在机器学习方面提供的指导是顶级的,并且肯定会帮助到一些人。
仅供参考,以下是一些可以帮助广大受众探索更多机器学习课程的网站:
https://www.mooc-course.com/subject/machine-learning/
https://www.mooc-list.com/tags/machine-learning
https://www.classcentral.com/subject/machine-learning
感谢分享。
很好的概述 Jason!
我正在用荷兰语写一个博客,里面有很多详细的免费机器学习教程。对于说荷兰语的人来说,这可能不错!我们还在荷兰组织聚会。
教程示例
– 分类:https://pythoncursus.nl/machine-learning-classificatie/
– K 近邻:https://pythoncursus.nl/k-nearest-neighbor-python/
– 线性回归:https://pythoncursus.nl/linear-regression-python/
– 支持向量机:https://pythoncursus.nl/support-vector-machine/
感谢分享。
你好,Jason!希望您一切安好。
在搜索在线社区时,您应该关注几件事。
首先是您想要的学习环境的类型。您主要是想通过实践学习,还是想通过提问和获得答案来学习,或者您更喜欢动手实践的学习方法,并侧重于代码。
第二件事是专业化程度。您是想了解某个主题的所有知识,还是满足于只了解基本常识。
依我看,Quora 的活跃度已不如从前。我对机器学习也很感兴趣。如果你加入并阅读 https://www.vproexpert.com/tag/ml/ 我会很高兴。
感谢分享。
你好 Jason… 我需要对实时物体进行分类,这些物体之间只有很小的差异。如何使用机器学习来做到这一点?请推荐一些文章或链接给我…
也许这个过程可以作为第一步提供帮助
https://machinelearning.org.cn/start-here/#process
感谢回复
不客气。
你好 Jason,感谢分享如此有知识性的博客。内容写得真好,信息量很大。请继续分享。
谢谢!
感谢您的帮助,连接了那些热衷于学习机器学习的人们,
https://blog.verzeo.com/best-machine-learning-blogs-to-follow/ 其中包含了一些您推荐的博客,可以从中学习 ML 知识。希望您喜欢!
不客气。
很棒的信息
谢谢。
谢谢,这篇文章提出了机器学习社区的重要性,这真是一件大事。
不客气。
好文章
谢谢!
我很高兴能保存这个页面,您实际上在这个页面上建立了社区。
谢谢。
不错的帖子
谢谢。
很高兴发现这个页面。我必须感谢您为此付出的时间,尤其是阅读愉快!!我真的很喜欢每一部分,也已收藏您的网站以获取新信息。
谢谢你。
机器学习(Machine Literacy)是一种数据分析系统,可以自动化逻辑模型结构。它是人工智能的一个分支,其基本思想是系统可以从数据中学习、识别模式并以最少的人类干预做出决策。
https://sites.google.com/jamesknows.com/machinelearningtraininginpune/home
感谢你的反馈,Atul!
我也喜欢您的网站,因为您的博客中有各种信息。您成就了我的一天。感谢您所做的一切。我已经收藏了您网站上的更多文章。您提供了一个多么好的博客。
我刚开始接触机器学习,这个社区非常有帮助。感谢所有分享资源和回答问题的人。
感谢您的反馈!请随时向我们更新您的进展!