几周前,不列颠哥伦比亚省 (BC) 执政党的政治家科林·汉森在《温哥华太阳报》上撰写了一篇题为解锁我们的数据以拯救生命的专栏文章。现任政府和反对派都应该阅读这篇文章,因为它充满了非常有前景的想法。
他在文章中指出,不列颠哥伦比亚省拥有世界上最好的健康数据集合之一,并且挖掘这些记录中的数据可以产生模式——例如药物组合使用的长期不良影响或疾病之间的相关性——这可以节省数十亿美元并改善医疗保健结果。
他建议该省找到方法与研究人员和学者共享这些数据,以确保个人隐私得到保护。虽然我同意这个想法,但我们在过去 5 年中学到的一件事是,尽管学者们很优秀,但更广泛的公众通常更擅长识别大型数据集中的模式。所以我认为我们应该更大胆地思考。更大胆,更大胆。
两年前,总部位于加利福尼亚州的 Heritage Provider Network,一家经营医院的公司,发起了一项 300 万美元的预测健康竞赛,该竞赛将奖励在三年内创建最佳算法的团队,该算法可以最好地预测患者在未来一年内在医院度过多少天。Heritage 认为,凭借这样的算法,他们可以在紧急情况发生之前制定策略来接触患者,从而减少住院天数。正如他们所说:“这将导致在降低护理成本的同时提高患者的健康水平。”
当然,Heritage 通过本次竞赛获得的算法将是专有的。他们将拥有它,我可以选择与谁分享。但是,不列颠哥伦比亚省(或美国的退伍军人事务部)举办的类似竞赛可以创造公共资产。只要我们也做到了,我们为什么要关心其他人是否提高了他们的医疗保健系统的效率呢?我们可以创造公共利益,而不是 Heritage 的私人资产。更重要的是,我们不需要提供 300 万美元的奖金。几项奖金为 10,000 美元的竞赛可能会产生许多令人兴奋的结果。因此,只需花费很少的钱,就可能有助于彻底改变不列颠哥伦比亚省,甚至可能是加拿大乃至世界的医疗保健系统。这是一个令人兴奋的机会。
当然,所有这一切中最大的担忧是隐私。《环球邮报》发表了一篇文章回应汉森的专栏文章(令人震惊但不足为奇的是,它没有链接回原文——为什么报纸会这样表现?),该文章重点关注隐私问题,但在细节上相当模糊。隐私专员从未提出或引用具体的担忧。例如,这篇文章本可以谈谈这个领域真正关注的问题,即所谓的去匿名化。这是指分析师可以获取已被匿名化以保护个人身份的记录(例如健康记录),并使用其他来源来查明记录属于谁。在这种情况下,通常只有少数人的记录被识别出来,但即使是如此有限的去匿名化也是不可接受的。
据我所知,没有人对 Heritage 健康奖数据进行去匿名化处理。但我们可以采取更多预防措施。我最近与当地流行病学家 Rob James 取得了联系,他很兴奋开放匿名化的医疗保健记录如何能够挽救生命和金钱。他与我分享了美国人口普查局采取的一种方法,这种方法甚至比去匿名化更激进。正如 Jennifer C. Huckett 和 Michael D. Larsen 在这篇(高度技术性)研究论文中概述的那样,该方法涉及创建一个并行数据集,该数据集不具有原始数据集的任何特征,但保持数据点之间的所有关系。由于通常重要的是关系而不是数据,因此可以在风险低得多的情况下进行大量研究。正如 Rob 指出的那样,关于这些类型的隐私保护策略已经有相当成熟的学术文献。
简单的事实是,加拿大的医疗保健支出正在上升。在未来几年内,许多省份的医疗保健支出将超过所有支出的 50%。这条道路是不可持续的。美国的支出情况更糟。我们需要变得更聪明、更有效率。数据挖掘也许是我们可支配的最直接和最容易获得的策略。
所以问题是:不列颠哥伦比亚省是否想在医疗保健研究和成果方面成为世界关注领域的领导者?基础——创建高价值数据集——已经到位。未知数是我们是否能够建立政策基础设施和公众授权,使我们能够以宏大的方式思考和行动。如果政府官员、隐私专员和一些公民自由代表开始对话以找到一些共同点,那将是很好的。 这对不列颠哥伦比亚省居民——以及可能对更广泛的人群——带来的好处可能是巨大的,无论是在金钱方面,更重要的是,在挽救生命方面。
评论已关闭。