9 个数据科学项目资源

即使是最新的工程师也可以开始朝着数据科学掌握之路前进,在这个新时代,每个级别都需要数据科学技能。
176 位读者喜欢这个。
Getting started with SQL

Opensource.com

数据科学、机器学习、人工智能和深度神经网络都是当今的热门话题(以及可能有助于这篇文章进行一些 SEO 的关键术语,除非 AI 看穿了我的尝试)。下面我分享了过去几年在数据科学项目中使用的一些常用资源。我不读很多书,所以我分享了一本书就证明了它有多重要。

这里有足够的资源让即使是最新的工程师也能开始朝着数据科学掌握之路前进,在这个新时代,每个级别都需要数据科学技能。这里有一个用于执行工作的工具,一门由著名的斯坦福大学教授教授的课程,提供实际经验的教程网站,以及一个致力于让所有人免费获得最新研究成果的网站,这样你就可以在想进一步了解的时候学习更多。

享受这段旅程!

书籍

数学杀器 (Weapons of Math Destruction) 作者:Cathy O’Neil

如果你想能够信任你的 AI 输出,那么你需要阅读这本书。它解释了偏差可能渗透到你的数据和算法中的一些不同途径,以及你可以做些什么来解决它。


在线课程

Andrew Ng 在 Coursera 上的免费机器学习课程

这门课程很容易让你在几乎没有先验知识的情况下开始学习机器学习。Andrew 是一位优秀的讲师,他提供了有用的解释来理解复杂的概念。


工具

数据集搜索 (Data Set Search),Google (测试版)

如果你想搜索大量公共数据集,包括 kaggle 中的内容,那么你需要查看 Google 的这个测试版项目。你可以使用很多你在 Google 搜索中已经习惯使用的常见高级搜索语法,例如指定要搜索的站点。 当我需要数据集时,我通常会来这里寻找。

Colaboratory,免费的 Jupyter Notebook

该工具提供了一个 Jupyter notebook 实现,允许你像其他 Google Apps 一样与他人协作。如果你手头拮据,或者只是想要一个可以从任何连接到互联网的计算机上使用的工具,那么这将对你很有帮助。 我几乎专门使用它,因为它帮助我避免了管理本地依赖项的问题。


视频

Andrej Karpathy 的斯坦福课程视频 在 YouTube 上

由 Kartik Subbarao 推荐

这些都很棒。 Andrej 以一种程序员思考事物的方式,为你提供了对神经网络的直观理解。他也有一些关于这个主题的很棒的博客文章。


网站

Arxiv.org

如果对数据科学感兴趣,每个人都应该保存这个网站。所有最新的研究都发布在这里,以确保研究人员可以在论文正式发表之前声明他们的发现是“第一个”。在数据科学中,该领域发展迅速,因此必须保持最新才能拥有最有效和高效的算法。

Kdnuggets.com

不要被这个网站的外观所迷惑,它有大量高质量的内容。它还会经作者许可重新发布其他网站的文章。 这通常有助于突出那些不一定获得那么多流量的文章。这是最好的数据科学内容网站之一。

Kaggle.com

数据科学领域的每个人都知道这个网站。该网站有很多可用的数据集,但这些数据集主要集中在数据科学竞赛和项目上。这是学习和开始与一些公共数据集交互的好方法。他们有一些项目模板可以帮助你入门并了解所有这些数据科学的东西是如何工作的。

Towardsdatascience.com

整个网站对我来说一直是一个很好的资源。他们不断提供涵盖数据科学中实践和理论主题的精彩内容。

Dan Barker
网站:http://danbarker.codes 电子邮件:dan@danbarker.codes

4 条评论

谢谢!

不客气!

回复 作者:Pablo Gilvan Borges (未验证)

很棒的书,我以为它应该在这里,但也许我和其他事情混淆了。 谢谢你把它加到这里!

回复 作者:Ray Sousa

知识共享许可协议本作品根据知识共享署名-相同方式共享 4.0 国际许可协议进行许可。
© . All rights reserved.