“开放数据”的含义——以及不包含的含义

目前还没有读者喜欢这个。
open source button on keyboard

Opensource.com

上周,《华尔街日报》上的一篇文章谈到了开放数据合作伙伴关系,该伙伴关系“将允许消费者编辑收集到的关于他们的兴趣、人口统计数据和其他个人资料信息。它还将允许人们选择完全不被跟踪。” 这篇文章继续讨论了数据挖掘和隐私问题,这些都是当今数字世界的热门话题,我们都想知道究竟有多少个人数据泄露出去以及如何被使用。这些是在其他更合适的论坛上讨论的合理担忧。 然而,我想谈谈我个人对“开放数据”一词被淡化的不满。

开放知识定义是这样说的,“如果一块内容或数据您可以自由使用、重用和再分发它——最多只受限于署名和相同方式共享的要求,那么它就是开放的。” 一般来说,这意味着数据应以免版税和其他知识产权限制的格式发布。 问题是,越来越多的人使用“开放数据”一词来表示公开可用的数据

文章中,指导开放数据倡议的初创公司的首席执行官表示,目标是“更加透明,让消费者更多地控制”收集和共享的数据。 提供一种机制,让消费者可以决定哪些信息可以提供给广告商,这是一个值得称赞的目标。 然而,这项“开放数据”倡议侧重于什么数据是可用的,而开放数据实际上是关于如何使数据可用的。 这种定义上的转变是一个问题,特别是对于正在实施数据政策的政府而言。

简而言之,所有开放数据都是公开可用的。 但并非所有公开可用的数据都是开放的。

开放数据并不意味着政府或其他实体将其所有数据都发布给公众。 政府将您的所有私人个人数据提供给任何索取者是不可思议的。 相反,开放数据意味着无论发布什么数据,都以特定的方式进行,以允许公众访问它,而无需支付费用或在用途上受到不公平的限制。

在之前的一篇文章中,我写了马萨诸塞湾交通局 (MBTA) 如何向软件开发人员开放其交通数据。 在 2 个月内,已经为公交和火车乘客构建了六个新的行程规划应用程序,MBTA 无需为此付出任何成本。 这就是开放数据的力量。 这是政府产生的数据,以开放格式 (GTFS) 免费发布给公众,并根据许可证允许使用和再分发。

为什么这很重要? 如果开放数据被误解为向公众发布任何和所有数据,人们会因为担心隐私而反对这个概念。 作为政策倡导者,我们希望鼓励的是,政府确实应该发布的数据应该以确保所有公民平等公共访问的方式进行。 换句话说,您不应该为了能够打开、使用或重新利用数据而购买特定供应商的产品。 作为纳税人,您已经为数据的收集付费。 您不应该再支付额外费用来打开它。

我们都从最近关于维基解密的新闻中看到,将政府的所有数据都公开存在真正的隐私和/或安全问题,但这与开放数据是不同的问题,不应混淆。 数据是否应该公开是隐私问题发挥作用的地方。 一旦确定政府数据应该公开,那么就应该以开放格式进行。

我对这个术语吹毛求疵吗? 也许吧。 但我们从其他技术政策斗争中看到,良好的定义对于构建辩论至关重要。

User profile image.
梅兰妮·切尔诺夫 | 作为红帽公司公共政策经理,梅兰妮负责监测、评估并努力影响美国和国际上影响开源技术和开放标准的立法和政府法规。 她还担任公司企业公民委员会主席,协调红帽的慈善活动。

8 条评论

说得好!

出色的帖子,梅兰妮! 我们有机会在开放知识基金会博客 (blog.okfn.org) 上交叉发布这篇文章吗?

一个小小的更正:“开放数据”是在开放知识定义中定义的,而不是在开放数据公共项目

http://www.opendefinition.org/

开放数据公共项目是一个提供法律工具以使数据开放的项目,例如 PDDL(公共领域)、ODC-BY(署名)和 ODbL(相同方式共享)

http://www.opendatacommons.org/

嗨,乔纳森,

感谢您的更正。 我已更新帖子。

是的,请随意交叉发布。 除非另有说明,否则所有 opensource.com 均根据知识共享的 CC-BY-SA 许可获得许可,因此您无需询问。

谢谢,
梅尔

我很高兴其他人也在关注这个问题。 七月份,我发布了一篇关于加拿大城市“开放数据”许可证的抱怨,它不是:<a href="http://zzzoot.blogspot.com/2010/07/its-not-open-data-so-stop-calling-it.html">它不是开放数据,所以请停止这样称呼它……</a>,加拿大城市开放数据社区中的一些人将我视为对城市所做的美好事物不屑一顾的人。 我试图在八月份解释问题所在 <a href="http://zzzoot.blogspot.com/2010/08/what-is-open-gov-data-sunlight.html">什么是开放政府数据? 阳光基金会:《开放政府信息的十项原则》</a>。 然后,在 11 月,在蒂姆·伯纳斯-李宣布了他的开放政府数据五星系统后,我重复了公开可用数据和开放数据的错误混淆,<a href="http://zzzoot.blogspot.com/2010/11/canadian-open-data-cities-no-stars-in.html">加拿大“开放数据”城市:蒂姆·伯纳斯-李开放政府数据五星评级中“零星”</a>。

我们需要努力解决这个问题。 它贬低了开放数据运动的价值,但更重要的是,由于它不是开放数据,它<b>允许政治家和技术官僚合法阻止他们不喜欢应用程序、公司和人员的访问</b>。 如果它不是开放的,那么它就不透明。

优秀的帖子,梅尔。

您的解释非常清晰且有帮助,谢谢。

我在<a href="http://davidpidsley.com/">链接社区和开放数据</a>方面工作,目前正在与<a href="http://www.charity-commission.gov.uk">慈善委员会</a> 就 <a href="http://www.nationalarchives.gov.uk/doc/open-government-licence/">开放政府许可证</a>进行沟通。

慈善委员会在英格兰和威尔士注册并监管慈善机构。 他们提供建议并提供服务和指导,以帮助慈善机构尽可能有效地运作。 他们维护在线慈善机构注册表,其中提供了有关英格兰和威尔士数千个注册慈善机构中每一个的信息。

所有慈善机构数据都是公开可用的(请参阅委员会网站上的<a href="http://www.charity-commission.gov.uk/SHOWCHARITY/RegisterOfCharities/CharityWithoutPartB.aspx?RegisteredCharityNumber=1110906&SubsidiaryNumber=0">这个例子</a>),但并非所有公开可用的慈善机构数据都是开放的。

事实上,我不确定它是否符合蒂姆·伯纳斯-李建议的 <a href="http://lab.linkeddata.deri.ie/2010/star-scheme-by-example/">5 星部署方案</a> 用于链接开放数据:您可以在他们网站页脚上看到他们的 <a href="http://www.charity-commission.gov.uk/misc/copyright.aspx">版权声明、免责声明和隐私声明</a>。

期待尽快阅读您博客的更多内容。

诚挚的问候,

<a href="http://davidpidsley.com">大卫·皮兹利</a>
<a href="http://twitter.com/davidpidsley">@davidpidsley</a>

非常喜欢这篇文章:很好的定义和解释了为什么定义很重要。 很棒的图片来解释您的定义:好的可视化比千言万语更能说明问题。 不幸的是,气泡的大小尚未代表现实:但绿色开放数据气泡的大小正在增长!

我喜欢刺激开放数据的使用,以创建和分享见解。 关于您的定义,我有两点看法。 您有什么看法?

<strong>开放数据不仅限于政府数据</strong>:企业也可以从开放数据概念中获益。 在许多国家,政府已将任务从政府转移到(半)私营公司。 那么区别在哪里呢?
<strong>开放数据意味着可以免费访问,但并不总是意味着易于访问的格式</strong>:开放数据的使用才刚刚开始。 因此,许多开放数据(无意中)以难以重用的格式发布(例如,pdf 中的数据表而不是 csv)。 开发人员应该接受挑战,无论如何都要重用数据,以促进使用并证明开放数据的力量。 但我当然鼓励所有努力使开放数据易于访问!

继续努力!
雅各布·豪特曼

备注:在网站 http://DataAlchemist.com 上阅读我的完整评论

嗨,雅各布,

我同意您的看法,我并非有意给人留下只有政府才能拥有“开放数据”的印象。 我只是专注于政府背景,因为这是 opensource.com 的政府频道。 任何实体,包括企业,都可以以开放的方式发布他们的数据。

对我来说,“开放数据”一词仅表示数据在发布给公众时,没有会阻止使用、复制、再分发等的知识产权限制。 任何人都可以开放他们的数据。

我同意您的观点,即使是“开放数据”,有时也会以难以访问的格式发布。 我认为这不会阻止它被描述为开放的,但实际上,这仍然很麻烦。 我也提倡以开放的、机器可读/可搜索的格式发布数据。

顺便说一句,这是对蒂姆·伯纳斯-李关于此主题的精彩采访
http://www.huffingtonpost.com/alexander-howard/tim-bernerslee-on-wikilea_b_798671.html

这很好地概括了定义以及开放数据在数据共享和重用方面的含义。

如果能再次强调开放政府数据的开放政府方面,以及开放数据不一定等同于开放政府数据(即,它可以是商业组织自由共享的数据),那就太好了,就像您的文章的主要重点是所有政府数据并不意味着开放数据一样。 只有开放政府数据才能同时解决此数据的“开放”和“政府”属性。 用于说明的维恩图:http://www.port25.ca/?page_id=866

谢谢!

Creative Commons License本作品根据知识共享署名-相同方式共享 3.0 未本地化版本许可协议获得许可。
© . All rights reserved.