
精通机器学习的 10 本被低估的书籍
图片作者 | Canva
如果你接触机器学习已经有一段时间了,你可能已经注意到,有些书总是被反复推荐。例如,Géron 的《Hands-On Machine Learning》和 Goodfellow 的《Deep Learning》无疑是扎实的书籍。但其实还有很多鲜为人知的书籍,它们提供的讲解远不止表面功夫。这些书不仅告诉你该怎么做,更重要的是告诉你为什么这样做。
因此,这里列出了十本值得更多关注的被低估的书籍。有些书侧重数学,有些更侧重概念,还有一些非常实用。但它们都有一个共同点:它们能让你成为一名更优秀的机器学习实践者。
1. 《模式识别与机器学习》 (Pattern Recognition and Machine Learning) 作者:Christopher M. Bishop
这本书需要付费才能获得,你可以在这里购买,它不适合轻松阅读。它深入讲解了贝叶斯方法和图模型——这是许多主流机器学习书籍要么过度简化要么完全跳过的内容。如果你真的想理解算法做出某些预测的原因,而不是仅仅让它工作起来,Bishop 的书是无价之宝。
最佳使用方法是具备扎实的概率论基础。为了让概念更清晰,可以尝试用 PyMC3 或 TensorFlow Probability 在 Python 中实现它们。
2. 《统计学习要素》 (The Elements of Statistical Learning) 作者:Hastie, Tibshirani, & Friedman
这本书是免费的,你可以在这里获取。可以把它看作是经典统计学和现代机器学习之间的桥梁。回归、分类、支持向量机、提升——所有这些内容都有涵盖,并且在数学上是严谨的。缺点是什么?它内容非常密集。但如果你曾经觉得自己在运行模型却不真正理解它们,这本书将改变这一点。
小贴士:不要一次性读完——把它当作参考书。PDF 在线免费提供。
3. 《机器学习:概率视角》 (Machine Learning: A Probabilistic Perspective) 作者:Kevin P. Murphy
大多数机器学习书籍侧重于启发式方法。而这本书?它通过概率的视角审视一切。这意味着你将更深入地理解模型中的不确定性。此外,Murphy 对贝叶斯网络和蒙特卡洛方法进行了应有的深入讲解。
如何学习:你可以在这里购买,虽然是付费的,但你可以在 Jupyter notebook 中完成练习。Murphy 的讲解非常扎实,但通过编码实现概念会让它们更深入。
4. 《贝叶斯推理与机器学习》 (Bayesian Reasoning and Machine Learning) 作者:David Barber
如果贝叶斯推理一直让你感到困惑,这本书可能正是你所需要的。它能帮助你直观地理解贝叶斯方法以及它们如何应用于真实的机器学习问题。它还以一种真正易于理解的方式涵盖了马尔可夫链蒙特卡洛 (MCMC) 方法。你可以在这里获取。
一个常见的错误是忽视先验。这本书很好地解释了先验为何重要以及如何明智地选择它们。
5. 《从数据中学习》 (Learning from Data) 作者:Yaser S. Abu-Mostafa
大多数书籍告诉你如何应用机器学习,但这本书侧重于它为何有效。Abu-Mostafa 以一种令人难忘的方式解释了诸如偏差-方差权衡和学习理论等概念。此外,他基于本书的在线课程是最好的免费机器学习课程之一,你可以在这里找到。
最佳方法是边阅读书籍边观看课程视频。概念会更快地融入。
6. 《信息论、推理与学习算法》 (Information Theory, Inference, and Learning Algorithms) 作者:David MacKay
机器学习和信息论是相辅相成的,但大多数机器学习从业者实际上从未研究过这种联系。《MacKay 的书》从信息论的角度涵盖了压缩、纠错码和神经网络等主题。内容密集但极具洞察力。
最佳使用方法是使用 Python 实现书中的练习。编写代码会迫使你真正理解材料。
7. 《理解机器学习》 (Understanding Machine Learning) 作者:Shai Shalev-Shwartz & Shai Ben-David
许多机器学习书籍要么过于简化内容,要么让你陷入数学的海洋。这本书找到了一个折衷点。它的结构很好,能够有条理地建立你对理论和应用机器学习的理解,你可以在这里获取。
适合人群:如果你有了一些机器学习经验,但觉得理论基础不牢固,这本书会很有帮助。
8. 《机器学习数学基础》 (Mathematics for Machine Learning) 作者:Marc Peter Deisenroth, et al.
很多人在学习机器学习时遇到困难,是因为他们从未学好其背后的数学。这本书解决了这个问题,并且可以免费获取。它涵盖了线性代数、概率和优化——机器学习的核心数学工具。
最佳学习方法是边学边用 NumPy 和 TensorFlow 实现概念。当数学在实践中得以体现时,会更容易理解。
9. 《神经网络与深度学习》 (Neural Networks and Deep Learning) 作者:Michael Nielsen
如果你想对深度学习有一个直观的理解——而不用被公式淹没——这本书就是你的选择。它使用叙事风格解释了反向传播和梯度下降等核心概念。即使你已经了解深度学习,Nielsen 的讲解也可能给你带来新的视角。
额外福利:这本书可以在线免费获取。
10. 《黑客的机器学习》 (Machine Learning for Hackers) 作者:Drew Conway & John Myles White
大多数机器学习书籍要么过于理论化,要么过于注重实践。这本书找到了一个平衡点。它通过真实的案例研究,展示了机器学习如何应用于实际问题,而不仅仅是教科书上的数据集,你可以在这里获得。
最佳使用方法是修改示例代码来探索不同的方法。你尝试得越多,学得越好。
总结
没有哪一本书能教给你关于机器学习的一切。但适时阅读合适的书籍可以带来巨大的改变。这份列表中的书籍将挑战你,填补你的知识空白,并让你对机器学习的理解比大多数主流书籍都要深入。
那么,你读过这些书中的哪些?你有什么隐藏的宝藏推荐吗?让我们来聊聊吧。
参考文献
- Christopher M. Bishop,《模式识别与机器学习》 – Springer
- Hastie, Tibshirani, & Friedman,《统计学习要素》 – Stanford
- Kevin P. Murphy,《机器学习:概率视角》 – MIT Press
- David Barber,《贝叶斯推理与机器学习》 – UCL
- Michael Nielsen,《神经网络与深度学习》 – 在线
- Aurélien Géron,《Hands-On Machine Learning》 – O’Reilly
- Ian Goodfellow, Yoshua Bengio, Aaron Courville,《深度学习》 – MIT Press
- 官方 Scikit-learn 文档 – Scikit-learn.org
- 官方 TensorFlow 文档 – TensorFlow.org
暂无评论。