虽然许多研究人员在发布数据时没有遇到基于隐私的障碍,但那些与人类参与者合作的人员,如医生、心理学家和遗传学家,却面临着一个难题需要克服。他们如何调和分享数据的愿望(以便他们的分析和结论能够得到验证)与保护参与者隐私的需求?这是一个我们在博客上讨论过的问题(参见:开放数据与 IRB,隐私与开放数据)。一个新的项目 “开放人类 (Open Humans)” 试图通过寻找愿意甚至渴望分享其个人数据的患者来解决这个问题。
“开放人类” 项目最近获得了来自 奈特基金会 (Knight Foundation) 的 50 万美元资助,它起源于 个人基因组计划 (Personal Genome Project)。个人基因组计划由哈佛大学遗传学教授 乔治·丘奇 (George Church) 于 2005 年创立,旨在解决许多遗传学研究人员尚未意识到的问题。 Madeleine Price Ball 解释说:“当时人们并没有真正将基因组视为本质上可识别的。” Ball 是 OpenHumans 的联合创始人、PersonalGenomes.org 的高级研究科学家以及哈佛个人基因组计划的研究主任。她引用了 千人基因组计划 (1000 Genomes) 的 知情同意书 中的内容:“‘由于这些措施,任何查看科学数据库的人都很难知道哪些信息来自您,甚至不知道科学数据库中的任何信息来自您。’”
“因此,这就是当时科学家对基因组的态度。此外,《遗传信息非歧视法案 (Genetic Information Nondiscrimination Act)》当时还不存在。而且还有电影《千钧一发 (GATTACA)》。隐私仍然是每个人都认为可以拥有的东西,而基因组是人们认为以可识别的方式分享会很疯狂的东西。我认为科学界有点无意识的盲目性,因为他们无法想象另一种选择。”
丘奇找到了最初的 十位参与者——名单包括大学教授、医疗保健专业人员和丘奇本人。 IRB 面试了每位参与者,以确保他们真正理解该项目,并对此感到满意,允许其向前推进。个人基因组计划现在拥有 超过 3,400 名参与者,他们都通过了入学考试,表明他们了解自己的数据将会发生什么以及涉及的风险。大多数参与者都热衷于分享。一位参与者将其描述为“将我的身体捐献给科学,但我不必先死。”
成长的烦恼
个人基因组计划的扩展并非没有成长的烦恼。“我们已经开始尝试收集基因组以外的数据。” 包括医疗史、手术过程、测试结果、处方在内的个人健康信息已由一部分参与者提供。“每次将这些新研究之一提交给 IRB 时,他们都会说 ‘什么?还有那个??我不明白你们在做什么???’ 这无法扩展,令人困惑,PGP 试图收集样本和测序基因组,并且它试图让其他团体收集样本并做其他事情。”
因此,“开放人类” 项目应运而生。
Ball 解释说:“‘开放人类’ 是对 PGP 正在做的一部分(第二部分)的抽象,并使其可扩展。” “它是一群对公共数据共享表现出兴趣的参与者,也是承诺将数据返回给参与者的研究人员。”
由于合作项目 美国肠道 (American Gut)、流感近你 (Flu Near You),当然还有哈佛个人基因组计划,“开放人类” 项目将从许多参与者和一系列公共数据集开始。参与者分享数据,作为回报,研究人员承诺分享结果。“分享结果” 究竟意味着什么还有待确定。
Ball 解释说:“我们才刚刚起步,并且知道弄清楚这将如何运作是一个学习过程。” 但她已经看到了当参与者被带入研究过程——并聚集在一起时会发生什么
“一位参与者创建了一个在线论坛,另一位创建了一个 Facebook 群组,还有一位维护着一个 LinkedIn 群组……在此之前,我从未想到放弃研究的隐私保证模型可以以这种方式赋予参与者权力。想想典型的研究——每位参与者都是孤立的,他们永远不会见面。彼此见面可能会泄露机密!在这里他们可以互相交谈,并且抱怨你。这真是令人振奋。”
Ball 和她的同事 Jason Bobe (Open Humans 联合创始人兼 PersonalGenomes.org 执行董事) 希望看到参与者和研究人员之间各种形式的合作。参与者可以帮助研究人员改进和测试协议、发现错误,甚至提供他们自己的分析。
未来的道路
尽管有这些梦想,Ball 仍保持项目的务实性。当被问及 “开放人类” 项目是否会要求使用其数据集发表的文章必须开放获取时,她回答说:“如果道德义务堆积如山,有时弊大于利,因为它会限制采用。” 当被问及参与者退出对数据集和可重复性的影响时,她回应说:“我不想过度思考,并根据猜测来实施保护研究人员利益而牺牲参与者自主权的事情。” (这主要是猜测。只有不到 1% 的个人基因组计划用户退出了研究,并且没有一位提供全基因组或外显子组数据的参与者这样做。)
很明显,“开放人类” 项目专注于眼前的道路。这条道路看起来如何? “目前,我最关心的是组建我们的团队。现在我们获得了资金,我们需要聘请一位优秀的程序员……因此,如果您是或认识某人似乎非常适合我们,请转发 我们的招聘机会。” 她补充说,任何人都可以 加入该项目的邮件列表 以获取更新,并了解 “开放人类” 何时向新参与者和新研究人员开放
“并且多多谈论我们。提及我们对于帮助提高人们对参与者主导的数据共享作为一种参与式研究方法和一种创建开放数据的方法的认识至关重要,尽管它是无形的。”
换句话说:开始传播消息。参与者主导的数据并不是解决隐私问题的唯一方案,但它是一个有吸引力的方案——拥抱它的人越多,它就越能成为一个好的解决方案。
最初发布于 开放科学协作博客 (Open Science Collaboration blog)。根据 Creative Commons 重新发布。
评论已关闭。