9 个数据科学项目资源

在这个数据科学技能在各个层面都将需要的新时代,即使是最新的工程师也可以开始走向数据科学大师之路。
176 位读者喜欢这篇文章。
Getting started with SQL

Opensource.com

数据科学、机器学习、人工智能和深度神经网络都是当今的热门话题(以及可能有助于这篇文章进行一些 SEO 的关键词,除非 AI 看穿了我的企图)。下面我分享了一些我在过去几年从事数据科学项目时经常使用的资源。我不读很多书,所以我分享了一本书就足以证明它的重要性。

这里有足够的资源,即使是最新的工程师也可以开始走向数据科学大师之路,在这个新时代,数据科学技能在各个层面都将需要。这里有一个用于执行工作的工具,一门由著名的斯坦福教授讲授的课程,提供教程的网站,为您提供真实的经验,以及一个致力于免费向所有人提供最新研究成果的网站,以便您在需要时可以了解更多信息。

享受旅程!

书籍

数学杀器 作者:Cathy O’Neil

如果您想能够信任您的 AI 输出,那么您需要阅读这本书。它解释了偏见可能渗透到您的数据和算法中的一些不同途径,以及您可以采取的措施。


在线课程

Andrew Ng 在 Coursera 上的免费机器学习课程 Coursera

这门课程让您很容易开始学习机器学习,几乎不需要任何先前的知识。Andrew 是一位优秀的讲师,他提供了有用的解释来帮助理解复杂的概念。


工具

数据集搜索,由 Google (beta) 提供

如果您想搜索大量公共数据集,包括 kaggle 中的数据集,那么您需要查看 Google 的这个测试项目。您可以使用许多常用的高级搜索语法,就像您已经习惯在 Google 搜索中使用的一样,例如指定要搜索的站点。当我需要数据集时,我就会来这里寻找。

Colaboratory,一个免费的 Jupyter Notebook

这个工具提供了一个 Jupyter notebook 实现,允许您像其他 Google 应用一样与他人协作。如果您资金短缺,或者只是想要一个可以从任何连接互联网的计算机上使用的工具,那么这将对您有很大帮助。我几乎完全使用它,因为它帮助我避免了管理本地依赖项的问题。


视频

Andrej Karpathy 在 YouTube 上的斯坦福课程视频 YouTube

由 Kartik Subbarao 推荐

这些视频很棒。Andrej 以一种程序员的思维方式,让您对神经网络有一个直观的理解。他也有一些关于这个主题的精彩博客文章。


网站

Arxiv.org

如果每个人都对数据科学感兴趣,那么应该保存这个网站。所有最新的研究成果都在这里发布,以确保研究人员可以在论文正式发表之前声明他们在研究成果中“首创”。在数据科学领域,这个领域发展如此迅速,以至于保持最新状态对于拥有最有效和高效的算法非常重要。

Kdnuggets.com

不要让这个网站的外观欺骗您,它拥有大量高质量的内容。它还将在获得作者许可的情况下转载其他网站的文章。这通常有助于突出那些不一定会获得那么多流量的文章。这是数据科学内容最好的网站之一。

Kaggle.com

任何从事数据科学的人都会知道这个网站。这个网站有很多可用的数据集,但这些数据集主要集中在数据科学竞赛和项目上。这是学习并开始与许多公共数据集交互的好方法。他们有一些项目模板来帮助您入门,并了解所有这些数据科学的东西是如何工作的。

Towardsdatascience.com

整个网站对我来说都是一个极好的资源。他们不断有关于数据科学的实践和理论主题的精彩内容。

Dan Barker
网站:http://danbarker.codes 电子邮件:dan@danbarker.codes

4 条评论

谢谢!

不客气!

回复 作者:Pablo Gilvan Borges (未验证)

很棒的书,我以为它应该在这里,但也许我与其他事情混淆了。感谢您在这里添加它!

回复 作者:Ray Sousa

知识共享许可协议本作品根据知识共享署名-相同方式共享 4.0 国际许可协议获得许可。
© . All rights reserved.