开放数据是否名副其实?一位数据记者对此进行了评价

尚无读者喜欢此内容。
open up

Opensource.com

新闻业是拥抱开源的行业之一。开源使预算很少或没有预算的小型组织能够有效地扩展其新闻采集能力。采用开源的不仅仅是小型新闻机构——《纽约时报》最近发布了一个新的开源内容管理系统

但在数据新闻领域,开源获得了最大的立足点。数据新闻中广泛使用了许多开源数据收集和分析工具,并且 GitHub 上与数据新闻相关的存储库数量也在不断增加。

Journalism++ 是有效融合开源和数据新闻的组织之一。它由 Nicolas Kayser-Bril 共同创立,是一家欧洲机构,专门从事 Kayser-Bril 所谓的数据驱动的故事讲述。根据 Kayser-Bril 的说法,Journalism++ 提供全套服务,从数据分析到故事再到可视化

在本次采访中,Kayser-Bril 讨论了为什么开源是新闻机构的正确选择,开放性如何使他的客户受益,以及为什么开放数据可能不像看起来那样是福音。

您是如何参与到数据新闻领域的?

我从五岁开始编程(我的父亲是一位计算机科学家)。对我来说,在学校、我的博客以及工作中制作小型互动作品是很正常的。在 2007 年和 2008 年,来自各种媒体机构的人开始联系我,并希望付费让我为他们编写代码。

Journalism++ 的指导原则之一是“开放胜于封闭。开源是我们的默认行为。” 为什么会这样?

在 Journalism++,我们认为开源是正常行为。我们团队的大多数成员都比较年轻,在成长过程中使用了可以轻松安装的 Linux 发行版。开源始终在他们的计算机上。对他们来说,专有软件是例外。我们并非听起来像开源激进分子,但我们认为代码默认情况下应该是公开的。

我们将来可能会将代码专有的唯一原因是,如果我们开发出一种算法,这种算法本身为我们的业务提供了竞争优势。但到目前为止,我们的核心技能是数据分析和故事讲述。这不是通过使代码专有来培养的。

开源是否为 Journalism++ 带来了竞争优势?

默认情况下保持开放有很多优势

  • 许多服务对开源项目是免费的。

  • 拥有一个庞大且维护良好的 Github 帐户是招聘优秀开发人员的关键。

  • 保持透明迫使我们在发布工单或编写提交消息之前始终三思而后行。

你们使用哪些技术来开发数据新闻工具?

我们的默认堆栈是用于前端的 Angular.JS 和用于后端的 Django。您会在我们所有的项目中找到这两个框架。我们还使用了各种开源库。Journalism++ 参与的两个项目,Data Wrapper(一种基于 Web 的数据可视化工具)和 Feowl(用于监控喀麦隆的断电情况),例如,部分是用 PHP 编写的,这是由于对这些项目的特定约束。

你们为自己的作品使用哪些许可证,为什么?

默认情况下,我们使用 LGPLv3,有时使用 GPLv3。它们是大多数商业项目使用的许可证。Journalism++ 使用它们是有道理的:其他人可以在我们的代码之上构建,但他们不能基于它创建全新的专有服务。我们有时使用 MIT 许可证——例如,当该工具由希望促进创新的基金会资助时。

对于我们的客户工作,客户选择许可证,但我们在合同中默认插入 GPLv3。大多数时候,我们的客户不会更改它。

使用开源工具进行数据新闻为新闻机构带来哪些优势?

开源使组织更加透明,因此更值得信赖。新闻编辑室正在转向开源;看看现在有多少记者在使用 GitHub 就知道了!

另一方面与监控有关:用户(包括我自己)倾向于认为开源软件不太容易存在后门,即使没有对该软件进行过审计。

使用开源数据工具有什么缺点吗?

据我所知,没有。

在哪里可以找到 Journalism++ 开发的工具的源代码?

这是我们的 GitHub 存储库:http://github.com/jplusplus

您是否想象过 Journalism++ 开发的工具会在数据新闻之外使用?如果是,将如何使用?

Journalism++ 从事数据分析和故事讲述工作。许多行业都需要这些技能,从公司、非政府组织和机构的宣传部门到商业情报机构。我更愿意将所有这些不同的群体视为信息专业人士。这些人是我们服务的对象。

越来越多的政府正在开放公共数据。您认为数据记者或希望使用这些数据的团体面临哪些问题?

政府并未开放公共数据。他们只是选择一组非争议性材料并在网上发布。大多数有趣的信息,即可以让记者评估公共政策影响的信息,都被审查了。

趋势是朝着更加不透明的方向发展。在欧洲和美国,提交信息自由请求变得越来越困难。在一些欧洲国家,记者甚至在某些数据与国家安全无关的情况下也无法获得访问权限。

记者在重新使用政府主动发布的数据集之前应该非常小心。他们需要问自己:是否删除了某列?为什么要发布此数据集?是否还有其他关于此问题但尚未公开的数据集?

您如何看待开源在数据新闻领域的未来?

我不是预言家,但我看不出今天拥抱开源的数据新闻团队明天应该转向专有的理由。

That idiot Scott Nesbitt ...
我长期使用自由/开源软件,并撰写各种有趣且有利可图的东西。我并没有把自己看得那么严肃,我所有的特技都是自己完成的。

评论已关闭。

© . All rights reserved.