Python 的 3 大机器学习库

了解 Python 最流行的三个机器学习库。
561 位读者喜欢这个。
Three giant robots and a person

Opensource.com

您不必成为数据科学家也会对机器学习的世界着迷,但一些旅游指南可能会帮助您驾驭浩瀚的宇宙,其中还包括大数据、人工智能和深度学习,以及大量的统计学和分析学。(“深度学习”和“机器学习”经常互换使用,因此,为了快速了解术语,这可能有助于您理解它们之间的区别,请阅读 Nvidia 的博客文章,人工智能、机器学习和深度学习之间有什么区别?

在本文中,我将介绍 Python 最流行的三个机器学习库。

Theano

Theano 于近十年前发布,主要由蒙特利尔大学的机器学习小组开发,Theano 是机器学习社区中使用最广泛的 CPU 和 GPU 数学编译器之一。2016 年的一篇论文《Theano:用于快速计算数学表达式的 Python 框架》对该库进行了全面的概述。该论文解释说:“已经开发了几个软件包,以 Theano 的优势为基础,提供更高级别的用户界面,更适合某些目标。” “LasagneKeras 的开发目标是更轻松地表达深度学习模型和训练算法的架构,作为要由 Theano 评估的数学表达式。另一个例子是 PyMC3,这是一个概率编程框架,它使用 Theano 自动导出梯度表达式,并生成 C 代码以实现快速执行。”(Keras 和 Lasagne 都在 TensorFlow 和 Theano 之上运行。)

Theano 在 GitHub 上有超过 25,000 次提交和近 300 位贡献者,并且已被 fork 了近 2,000 次。

有关视频教程,请观看 Martin Andrews 在 2015 年新加坡 PyCon 大会上的演讲《机器学习:使用 Python 和 Theano 深入了解

TensorFlow

TensorFlow 是一个使用数据流图进行数值计算的开源库,对于开源世界来说是一个新手,但这个由 Google 领导的项目已经拥有近 15,000 次提交和超过 600 位贡献者 在 GitHub 上,并且在其 模型仓库 上有近 12,000 个星标。

在第一本 开源年鉴 中,TensorFlow 被选为 2016 年最有可能成功的项目。在最新的 开源年鉴 中,TensorFlow 多次露面。我们将该项目列入了我们的 2017 年值得关注的顶级开源项目 列表。我们还在 Josh Simmons 的文章《Google 2016 年开源版本巡览》中了解了基于 TensorFlow 的项目 Magenta。Simmons 说 Magenta 旨在推进音乐和艺术生成方面的机器智能技术水平,并建立一个由艺术家、程序员和机器学习研究人员组成的协作社区。Rachel Roumeliotis 还在她的 2016 年热门编程趋势 综述中将 TensorFlow 列为 AI 的驱动语言之一。

TensorFlow 1.0 于 2 月中旬推出。“在短短的第一年里,TensorFlow 已经帮助研究人员、工程师、艺术家、学生和许多其他人,在从语言翻译到皮肤癌早期检测和预防糖尿病患者失明等各个方面取得了进展,”Google 开发者博客公告 中说。

要了解有关 TensorFlow 的更多信息,请阅读 DZone 系列 TensorFlow on the Edge,或观看 TensorFlow Dev Summit 2017 的直播录像

scikit-learn

scikit-learn(发音为 sy-kit learn)建立在 NumPy、SciPy 和 Matplotlib 之上, Spotify 工程师用于音乐推荐,在 OkCupid 中用于帮助评估和改进他们的配对系统,并在 Birchbox 的新产品开发探索阶段使用。

Scikit-learn 在 GitHub 上有近 22,000 次提交和 800 位贡献者。

有关免费教程,请阅读项目网站上的 scikit-learn 入门scikit-learn,或观看 Sebastian Raschka 在 2016 年芝加哥 PyData 大会上的演讲《学习 scikit-learn:Python 机器学习入门》。

User profile image.
Rikki Endsley 是 Red Hat 的开发者项目管理编辑,也是 Opensource.com 的前社区架构师和编辑。

评论已关闭。

Creative Commons License本作品根据 Creative Commons Attribution-Share Alike 4.0 International License 获得许可。
© . All rights reserved.