如何成为数据科学家

数据科学家需求量很大。本指南将告诉您数据科学职业生涯需要了解的内容,以及如何学习它。
414 位读者喜欢这个。
open science beaker

Opensource.com

曾经,我想成为一名进化生物学家。长话短说,我改变了主意,退出了博士课程,转而从事计算机科学事业。我现在是红帽公司的一名高级软件工程师,从事各种机器学习和数据科学项目(您可以在我的博客上阅读更多关于我的旅程的信息)。加入红帽公司后不久,许多人——包括三位不同的芝加哥大学研究生——询问我如何转型从事数据科学事业,所以我开始研究它。

现在进入数据科学领域最棒的一点是,一切(从软件、学习资料到讨论)都非常开放,所以现在是成为自学者的最佳时机。如果这能帮助其他考虑从事数据科学事业的人,以下是我所了解的关于如何实现飞跃的信息。

开放讨论

作为热身,我推荐以下链接,了解数据科学的背景信息:

总的来说,数据科学社区的成员非常乐于分享他们不同的经验和背景,这在您选择要追求哪种特定类型的数据科学时非常有用。

开放经验

如果您真的想从事数据科学事业,那么获得经验比任何其他事情都重要。我知道这个建议在许多其他领域也适用,但由于数据科学需要如此高水平的数学和统计成熟度,因此很难向潜在雇主表明您知道如何在没有相关工作经验的情况下有效地应用这些复杂的技术。

如果您是学生,那么您的首要任务应该是找到实习机会。这将使最终的全职工作搜索变得容易得多。不幸的是,实习机会也是数据科学家追求中最不“开放”的方面,因为它们通常只提供给学生。但是,还有很多其他开放的机会可以获得经验。例如,您可以尝试公开竞赛,例如 Kaggle 上的竞赛。

还有开源软件开发。为开源项目做贡献和/或将您的个人项目放在 GitHub 上(这是我的)是展示您数据科学专业知识的好方法。您还可以考虑公益性(“开放的心?”)工作。有您最喜欢的当地餐厅吗?询问其管理层是否对免费的数据科学咨询感兴趣。(我认识一个真正这样做了的人!)

最后,请务必创建并更新 LinkedIn 帐户(这是我的)。LinkedIn 已成为招聘人员的 极其有价值的工具,因此在那里被发现非常重要。

开放教育

接下来,我最喜欢的部分,开放教育。在过去的几年里,出现了一个非常令人兴奋的趋势,那就是大型开放式在线课程(又名 MOOC),它们基本上是由顶级机构和公司(例如斯坦福大学、哈佛大学、谷歌)提供的关于各种主题的完整课程(包括家庭作业和考试)。有许多公司和网站提供 MOOC,但我最喜欢的包括:CourseraedXUdacitySaylorKhan Academy

关于选修哪些课程的指导,我整理了一个详细的数据科学课程并发布了我自己的完整课程历史记录。 您肯定要涵盖的一些科目包括:

开源软件

最后,Opensource.com 的大多数读者都会熟悉的部分:开源软件。开源软件在数据科学中比比皆是,但就像 Linux 一样,代码免费和开源并不意味着它不如专有软件。 事实上,开源解决方案通常是同类产品中最好的。

数据科学家需要了解的重要开源软件包括:

开始

这些指南应该能让您在追求数据科学事业的道路上走上正确的道路。如果您知道任何其他有用的数据科学资源,请务必在评论中分享它们。

User profile image.
Michael 目前是美国农业部农业研究局的人工智能卓越中心研究员。 此前,Michael 获得了奥本大学的机器学习博士学位,并且曾经是红帽公司的机器学习工程师。 您可以在他的网站上了解更多关于他的信息。

1 条评论

那是一条熟悉的职业道路:从动物行为学博士生到地理空间流行病学家,就我而言。 我比你大,现在我似乎通过非自然选择进化成了一个官僚,当我的勤劳的员工太忙而无法阻止我时,我忍不住编写代码。

Creative Commons License本作品根据 Creative Commons Attribution-Share Alike 4.0 International License 许可。
© . All rights reserved.