如何成为一名数据科学家

数据科学家需求量很大。本指南将告诉您数据科学职业生涯所需知道的一切,以及如何学习它。
414 位读者喜欢这篇文章。
open science beaker

Opensource.com

很久以前,我曾想成为一名进化生物学家。长话短说,我改变了主意,从博士课程中辍学,转而从事计算机科学的职业。我现在是 Red Hat 的高级软件工程师,在那里我从事各种机器学习和数据科学项目(您可以在我的博客上阅读更多关于我的旅程)。加入 Red Hat 后不久,许多人——包括三位不同的芝加哥大学研究生——向我询问了转型到数据科学职业的问题,所以我开始研究它。

现在投身数据科学的绝妙之处在于,一切(从软件到学习材料再到讨论)都非常开放,因此现在是成为自学者的最佳时机。为了帮助其他考虑从事数据科学职业的人,以下是我在实现这一飞跃中学到的知识。

开放讨论

作为热身,我推荐以下链接,以获取有关数据科学的背景信息

总的来说,数据科学社区的成员非常乐于分享他们多样化的经验和背景,这在您选择要追求哪种特定类型的数据科学时非常有帮助。

开放经验

如果您认真考虑从事数据科学职业,那么获得经验比其他任何事情都重要。我知道这个建议对于许多其他领域也适用,但由于数据科学需要如此高水平的数学和统计成熟度,因此很难向潜在雇主表明您知道如何在没有相关工作经验的情况下有效地应用这些复杂的技术。

如果您是一名学生,那么您的首要任务应该是获得实习机会。这将使最终的全职工作搜索变得容易得多。不幸的是,实习也是数据科学家追求中最不“开放”的方面,因为它们通常只对学生开放。但是,还有很多其他开放的机会可以获得经验。例如,您可以尝试开放竞赛,例如 Kaggle 上的竞赛。

还有开源软件开发。为开源项目做贡献和/或将您的个人项目放在 GitHub 上(这是我的)是展示您的数据科学专业知识的好方法。您还可以考虑无偿(“开放的心胸?”)工作。有最喜欢的当地餐厅吗?询问其管理层是否有兴趣获得免费的数据科学咨询。(我认识有人真的这样做了!)

最后,请务必创建并更新 LinkedIn 帐户(这是我的)。LinkedIn 已成为招聘人员极其有价值的工具,因此在那里被发现非常重要。

开放教育

接下来,我最喜欢的部分,开放教育。在过去几年中,出现了一个非常令人兴奋的趋势,即大型开放式在线课程 (又名 MOOC),它们基本上是由顶尖机构和公司(例如,斯坦福大学、哈佛大学、谷歌)在各种主题上提供的完整课程(包括家庭作业和考试)。有许多公司和网站提供 MOOC,但我最喜欢的一些包括:CourseraedXUdacitySaylorKhan Academy

为了指导您应该学习哪些课程,我整理了一个详细的数据科学课程,并发布了我自己的完整课程历史。您肯定需要涵盖的一些科目包括

开源软件

最后,Opensource.com 的大多数读者都会熟悉的部分:开源软件。开源软件在数据科学领域中非常丰富,但是,就像 Linux 一样,代码的免费和开放并不意味着它不如其专有对应物。事实上,开源解决方案通常是同类最佳的。

数据科学家需要了解的重要开源软件包括

开始入门

这些指南应该能让您在追求数据科学职业生涯的过程中步入正轨。如果您知道任何其他有用的数据科学资源,请务必在评论中分享。

User profile image.
Michael 目前是美国农业部农业研究服务中心的人工智能卓越中心研究员。此前,Michael 获得了奥本大学机器学习博士学位,并且曾是 Red Hat 的机器学习工程师。您可以在他的网站上了解更多关于他的信息。

1 条评论

这是一个熟悉的职业道路:在我的案例中,从动物行为学博士生到地理空间流行病学家。我比你年长,现在我似乎通过非自然选择进化成了一名官僚,当我辛勤工作的员工太忙而无法阻止我时,我忍不住编写代码。

知识共享许可协议本作品根据知识共享署名-相同方式共享 4.0 国际许可协议获得许可。
© . All rights reserved.