上周,《华尔街日报》上的一篇文章谈到了开放数据合作伙伴关系,该伙伴关系“将允许消费者编辑收集到的关于他们的兴趣、人口统计数据和其他个人资料信息。它还将允许人们选择完全不被跟踪。” 这篇文章继续讨论了数据挖掘和隐私问题,这些都是当今数字世界的热门话题,我们都想知道究竟有多少个人数据泄露出去以及如何被使用。这些是在其他更合适的论坛上讨论的合理担忧。 然而,我想谈谈我个人对“开放数据”一词被淡化的不满。
开放知识定义是这样说的,“如果一块内容或数据您可以自由使用、重用和再分发它——最多只受限于署名和相同方式共享的要求,那么它就是开放的。” 一般来说,这意味着数据应以免版税和其他知识产权限制的格式发布。 问题是,越来越多的人使用“开放数据”一词来表示公开可用的数据。
文章中,指导开放数据倡议的初创公司的首席执行官表示,目标是“更加透明,让消费者更多地控制”收集和共享的数据。 提供一种机制,让消费者可以决定哪些信息可以提供给广告商,这是一个值得称赞的目标。 然而,这项“开放数据”倡议侧重于什么数据是可用的,而开放数据实际上是关于如何使数据可用的。 这种定义上的转变是一个问题,特别是对于正在实施数据政策的政府而言。
简而言之,所有开放数据都是公开可用的。 但并非所有公开可用的数据都是开放的。
开放数据并不意味着政府或其他实体将其所有数据都发布给公众。 政府将您的所有私人个人数据提供给任何索取者是不可思议的。 相反,开放数据意味着无论发布什么数据,都以特定的方式进行,以允许公众访问它,而无需支付费用或在用途上受到不公平的限制。
在之前的一篇文章中,我写了马萨诸塞湾交通局 (MBTA) 如何向软件开发人员开放其交通数据。 在 2 个月内,已经为公交和火车乘客构建了六个新的行程规划应用程序,MBTA 无需为此付出任何成本。 这就是开放数据的力量。 这是政府产生的数据,以开放格式 (GTFS) 免费发布给公众,并根据许可证允许使用和再分发。
为什么这很重要? 如果开放数据被误解为向公众发布任何和所有数据,人们会因为担心隐私而反对这个概念。 作为政策倡导者,我们希望鼓励的是,政府确实应该发布的数据应该以确保所有公民平等公共访问的方式进行。 换句话说,您不应该为了能够打开、使用或重新利用数据而购买特定供应商的产品。 作为纳税人,您已经为数据的收集付费。 您不应该再支付额外费用来打开它。
我们都从最近关于维基解密的新闻中看到,将政府的所有数据都公开存在真正的隐私和/或安全问题,但这与开放数据是不同的问题,不应混淆。 数据是否应该公开是隐私问题发挥作用的地方。 一旦确定政府数据应该公开,那么就应该以开放格式进行。
我对这个术语吹毛求疵吗? 也许吧。 但我们从其他技术政策斗争中看到,良好的定义对于构建辩论至关重要。
8 条评论