R 是数据分析和机器学习的强大平台。
它是我的主要工作平台,用于竞赛和咨询工作。原因是它拥有大量强大的算法,都在一个平台上。
在这篇文章中,我想分享一些你可以用来开始学习 R 机器学习的资源。
通过我的新书 《R 语言机器学习精通》,包括分步教程和所有示例的R 源代码文件,来启动你的项目。
让我们开始吧。
R 语言简介
在开始处理机器学习问题之前,你可能需要先熟悉该平台和语言。
我认为熟悉它的最佳方法是开始解决问题。真实工作的试炼会迫使你学习必须学习的知识来解决你的问题。一个好的参考资料可以帮助你回答“我该如何…”的问题。
R 语言概览
当我刚开始使用 R 时,我通读了《R 语言概览》这本书。它涵盖了从安装、基本操作、数据分析,甚至一些机器学习算法。我强烈推荐它。
我选择它是因为它是一本广泛的参考书。我想了解该平台的方方面面,这样在我遇到具体问题时,就知道该去哪里查找。
需要更多关于R机器学习的帮助吗?
参加我为期14天的免费电子邮件课程,了解如何在您的项目中使用R(附带示例代码)。
点击注册,同时获得该课程的免费PDF电子书版本。
机器学习
R 中实现了大量的机器学习算法,其中许多是由开发它们的学者及其团队实现的。仅凭这一点就足以让你开始使用 R。此外,数据处理/操作和图形工具非常强大(尽管 Python 的 SciPy 栈正在赶上)。
CRAN:机器学习和统计学习
这不是一本书,但一个很好的起点是 Torsten Hothorn 维护的 CRAN 上的机器学习和统计学习视图。它列出了你可以在机器学习中使用的绝大多数 R 包,并按算法和算法类型分组。
这是一个很好的起点,但我认为它可以做得更好的是指出规范的包,并更详细地阐述一些可用的包装器包,如 caret。
应用预测建模
Max Kuhn,这本书的作者,也是著名的 caret 包的创建者。《应用预测建模》非常实用,它在第一部分以预测分析过程和案例研究的描述开头。第二部分和第三部分介绍了回归和分类算法,最后一部分涵盖了特征选择等更高级的主题。
这是一本厚实的、极好的参考书,我非常喜欢这本书。还可以查看配套网站获取相关资源。
《统计学习导论:R语言应用》(An Introduction to Statistical Learning: with Applications in R)
这是经典《统计学习基础:数据挖掘、推理和预测》的更易于理解的版本,并且包含两位相同的作者。
《统计学习导论》以统计学习的介绍开始,并讨论了模型准确性和偏差-方差权衡等问题。第三章和第四章介绍了线性回归和一些简单的分类算法。接下来的章节介绍了交叉验证、模型选择,然后是关于非线性回归、决策树、SVM,最后是无监督方法。
这本书也可以从作者网页在线免费获取。
《R语言实用数据科学》(Practical Data Science with R)
《R 语言实践数据科学》比机器学习更侧重于数据科学。第一部分是入门,涉及将数据加载到 R。第二部分从模型评估开始,通过 k-NN、朴素贝叶斯、线性回归、聚类、关联规则和 SVM 等模型,模型复杂度逐渐增加。第三部分则涉及自文档化脚本和结果呈现等高级主题。
它提供了很好的入门和扎实的实践建议。
《R语言机器学习》(Machine Learning with R)
《R 语言机器学习》在不深入细节或理论的情况下概述了 R 语言中的机器学习。它还大量使用案例研究来演示每种算法。它以对机器学习和 R 的简要介绍以及 R 中的数据管理开始。在后续章节中,它涵盖了 k-NN、朴素贝叶斯、决策树、回归、神经网络、Apriori 和聚类。
最后几章介绍了模型评估、算法调优和其他高级主题。这本书的一个好特点是每章都提供了分步序列,围绕案例研究提供了一个可操作的框架。
R 语言数据挖掘:案例学习
在第一章快速介绍 R 语言后,《R 语言数据挖掘》呈现了许多案例研究。这些研究包括:预测藻类水华、股市回报、欺诈交易和分类微阵列样本。每项研究都探讨了各种不同的数据准备、模型构建和模型评估方法。
如果您想感受如何处理实际问题,这是一本内容密集但非常有价值的书。
R 语言数据挖掘与商业分析
《R 语言数据挖掘与商业分析》提供了使用 R 语言的示例,但与某些其他书籍相比,这些示例更侧重于商业而非科学。各章节通过小型案例研究,使用 R 语言介绍了关键的机器学习方法。本书最后通过对文本情感分析和网络数据建模的较大案例研究进行了总结。
R 语言与 Rattle 的数据挖掘:发掘数据以获得知识发现的艺术(使用 R!)
《R 语言与 Rattle 的数据挖掘》介绍了机器学习算法,但其特色是使用了 Rattle 图形界面。在第一部分关于数据加载和处理的介绍性材料之后,第二部分涵盖了标准的机器学习算法。
我喜欢其算法呈现方式的是标准化描述,包括教程、参数调整和命令摘要。我非常欣赏算法一致的结构化呈现。
总结
我们已经介绍了 7 本专注于使用 R 平台的流行机器学习书籍。
我能给出的最好的建议是:选择一本并阅读它。通读一遍,记笔记并完成练习。就像编程一样,使用 R 是一项实践技能,只有通过练习才能掌握。练习 R 语言的机器学习。
我是否遗漏了 R 语言的机器学习书籍?请留言告知。
《黑客的机器学习》这本书很好。同样基于 R。
当然,我真不敢相信我把这本书漏掉了。谢谢 yin!
又一篇很棒的文章,Jason,继续努力!
另一本我最近一直在读的好书是《数据科学实战:来自前沿的直言不讳》。
易于理解且实用,并包含大量 R 语言示例。
谢谢 Santiago 的建议。我正在订购一本。
总结得很好,Jason,一如既往的精彩。谢谢。
好文章,这些书籍对 R 程序员来说非常有帮助。
谢谢 sumendar
你好…
我正在寻找以下书籍的电子版..我需要学习来完成大学作业。如果您有任何软拷贝,请分享。
Doing Data Science: Straight Talk from the Frontline
《R语言实用数据科学》(Practical Data Science with R)
R 语言数据挖掘与商业分析
R 语言与 Rattle 的数据挖掘:发掘数据以获得知识发现的艺术(使用 R!)
ggplot2
“使用 Shiny 进行 R 网页应用开发”
作者:Chris
文本挖掘:分类、聚类和应用,作者:Ashok N. Srivastava
多元回归及以上,作者:Timothy Z
谢谢…
好帖子。
我想知道您是否知道有任何书籍能像 Andrew NG 在他著名的机器学习课程中用 Matlab 所做的那样,指导你在 R 中构建机器学习算法?
我知道有很多算法内置在包中,但鉴于 R 在线性代数方面处理得很好,如果有一本书能帮助你在其语法中建立算法的直觉,那就太好了。
我目前正在看 ISLR 这本书,我必须说,如果你想开始学习统计/机器学习,这是一本很棒的书。它与 eDX 网站上这些存档的讲座视频非常匹配;
https://class.stanford.edu/courses/HumanitiesScience/StatLearning/Winter2014/progress
其中甚至还有 R 会话,讲师会指导你完成示例。我相信该课程将于 2015 年 1 月中旬再次开始。我强烈推荐它!
好文章。也许你可以发布另一份关于 Python 机器学习的书单?
那么《机器学习要素》呢?这是《机器学习导论》的更高级版本。
Roni,
我读过 ESL。它适合研究生级别的统计学习课程。如果你的目标是应用机器学习方法,那么《应用预测建模》结合《统计学习导论》是最好的选择。
您能否推荐一些解释 R 语言中概率神经网络、学习向量量化器的书籍或资源?
我不知道,抱歉。
以下关于机器学习的书籍也很有用
机器学习:通过 R 软件概览
https://www.amazon.com/B07KQSN447
太棒了,谢谢分享!
你好,
我还想推荐以下书籍。
1. R 语言实战
2. R 语言、tidyverse 和 mlr 机器学习。
谢谢!