使用统计和因果方法的机器学习

作者 Jason Brownlee 于 2016年9月5日发布在机器学习资源 4

2014年11月，伯恩哈德·施尔科夫（Bernhard Scholkopf）因其对机器学习的贡献而荣获英国皇家学会颁发的米尔纳奖（Milner Award）。

在接受该奖项时，他发表了一个关于他统计和因果机器学习方法的通俗讲座，题为“机器学习的统计和因果方法”。

这是一个非常出色的一个小时的讲座，我强烈建议大家观看。

统计学习

在统计方面，施尔科夫谈论了经验推理和泛化。

他早期提出的一点有趣的、有启发的观点是关于困难的推理问题，这激励了他对核方法的研究。

具体来说，他引用了Sonnenburg等人2008年发表的题为“大规模多核学习”论文中提到的根据位置对DNA序列进行分类的问题。在论文中，作者们证明了算法的性能随可用数据的量的增加而提高。

大数据之需
图来自大规模多核学习

他称这是一个范式改变的事实，并将这些困难的推理问题归类为具有

他以统计学习部分的演讲结束，描述了核方法贡献的三个关键方面。

讲座的第二部分谈论了施尔科夫在因果建模方面的工作。

他描述了因果关系、因果关系图模型以及如何从数据中推断因果模型。

具体来说，他介绍了两种解决因果模型推断问题的新方法：

对我来说，这次讨论中最有趣的部分是他谈到了他通过因果模型视角看待半监督学习的工作。这来源于他2012年发表的论文“关于因果和反因果学习”。

他描述了两个例子：

关键发现是，对P(X)进行建模并添加额外数据并不能帮助解决第一个问题。我们假设P(X)与P(Y|X)无关。但在第二个案例中，对P(Y)进行建模是有益的，因为P(Y)与P(X|Y)有关。

像示例2中的问题（根据效应Y预测原因X）将从半监督学习技术中受益。我惊讶于这个发现没有被更频繁地讨论，也许这对于领域内的深入研究者来说是显而易见的。

这是一个很棒的视频，我相信它能让你对机器学习的两个重要领域产生动力。

您可以在这里再次观看视频：“机器学习的统计和因果方法”。