数据分析师和数据科学家之间有什么区别,他们一天都做些什么工作?
这些问题以及类似的问题在新的免费电子书《数据分析手册:数据分析师和数据科学家》中得到了解答。
这本电子书由 Brian Liou、Tristan Tao 和 Elizabeth Lin 创作。Brian 和 Tristan 是计算机科学 + 统计学毕业生,他们运营着博客statsguys。尽管他们有工作,但他们主动采访了行业中的数据分析师和数据科学家,询问了他们的背景、如何被聘用以及日常工作。
五大收获
这本书由 Elizabeth(设计师)精心制作,开篇就总结了采访中的五大收获。总而言之,这些是:
- 沟通能力至关重要。
- 数据收集和清理是最大的挑战。
- 数据分析师和数据科学家是不同的。
- 这个行业尚处于起步阶段。
- 好奇心胜过技术技能。
受访者
这本书有 32 页,您可以很快读完。它包含了来自 6 家公司的 7 次访谈,具体如下:
- Abraham Cabangbang 来自 LinkedIn
- Josh Wills 来自 Cloudera
- Ben Bregman 来自 Facebook
- Leon Rudyak 来自 Yelp
- Peter Harrington 来自 HG Data
- John Yeung 来自 Flurry
- Santiago Cortes 来自 HG Data
我最喜欢 Josh 的采访。他的回答清晰且有深度,我做了很多笔记。
他引用了一个精彩的说法,该说法被收录在本书的收获点之一:“数据科学家比软件工程师更懂统计学,又比统计学家更懂软件工程”。这句话非常符合我的想法。他进一步解释并评论说,当数据量大到需要考虑计算复杂性时,即数据需要工程思维来回答问题时,就需要数据科学家。
我从未听过对数据科学家这个角色如此精辟的定义。
总的来说,访谈强调了 SQL 在访问数据中的重要性,以及使用各种工具(Excel、Tableau、Micro Strategy)和语言(R 和 Python)来完成工作。许多时候,人们提到使用 PowerPoint / 幻灯片作为展示发现的媒介,而不是技术仪表盘和网页。
我推荐您下载此免费电子书,如果您对了解一线从业者的工具和考量感兴趣的话。
谢谢。我会读这本书,因为它对我来说看起来非常有趣:)