通过 Twitter 数据追踪实时健康状况,作为早期预警系统

尚无读者喜欢这篇文章。
Twitter birds

Opensource.com

随着开源精神改变了我们分享和开发资源的方式,众包正在重新定义我们如何基于这种分享意愿来创建新资源。 众包为了我们所有人的福祉而发挥作用的一个例子是公共卫生研究人员转向 Twitter,以收集有关公共卫生的实时数据。

约翰·霍普金斯大学的研究人员开发了一种新的软件算法,使他们能够过滤推文流中的健康相关信息,然后将结果分类到健康类别中。 研究人员 Mark Dredze 和 Michael Paul 在 20 亿条推文上测试了他们的算法,然后分析了由此产生的 150 万条与健康相关的消息。 他们发现了与流感、过敏、失眠、抑郁症、癌症、疼痛和其他几种疾病相关的模式。 由于配备 GPS 的移动设备发送的推文可以获得位置信息,研究人员能够精确定位许多健康信息的来源。 该项目的目标是预测疾病何时何地传播,以便地方公共卫生部门有时间计划和分配资源。 Dredze 和 Paul 认为,与疾病控制中心 (CDC) 目前提供的数据相比,使用 Twitter 数据可以更及时地反映公共卫生的状况。

过滤相关的健康数据是该项目最具挑战性的部分。 Twitter 平均每天有 3.4 亿条推文,其中大部分是对新事件的反应。 当流感爆发成为新闻事件时,一定数量的推文将是对爆发的评论,而不是人们谈论自己是否出现流感症状。 这意味着过滤算法必须做的不仅仅是搜索与健康相关的关键词; 它还必须过滤掉与个人健康无关的“噪音”。

约翰·霍普金斯大学的项目并不是第一个使用 Twitter 收集健康数据的尝试。 在 2012 年中期,美国卫生与公众服务部向开发人员发起了一项挑战,要求他们设计基于网络的应用程序,以使用 Twitter 数据实时跟踪健康趋势。 这项挑战名为 Now Trending: #Health in My Community其灵感来自于对 2009 年 H1N1 流感大流行和 2010 年海地霍乱爆发的研究,这些研究表明社交媒体如何比传统的跟踪方法更早地识别出疾病爆发。

在提交给 Now Trending 挑战赛的 33 个应用程序中,MappyHealth 被选为最具创新性、可扩展性、动态性和用户友好性的作品。 MappyHealth 由 Social Health Insights LLC 开发,实时跟踪推文流中的 234 个与健康相关的术语,并应用一组 29 个条件来确定消息是否相关。 数据分析完成后,应用程序会以多种格式呈现信息。 除了基于网络的应用程序外,MappyHealth 还为智能手机和平板电脑提供移动应用程序。 MappyHealth 常见问题解答提供了通过 Twitter 数据中的趋势峰值识别出的健康趋势示例。

第三个使用 Twitter 跟踪公共卫生数据的应用程序是 Germ Tracker。 该应用程序由罗切斯特大学研究员 Adam Sadilek 及其合作者开发,它过滤推文以识别哪些推文可能属于生病的人,然后在国家地图上将这些推文显示为点。 该应用程序本身鼓励社交互动:当用户发现一条实际上与疾病无关的推文(例如有人说他们“厌倦了上学”或他们的新车“真酷”)时,他们可以单击一个按钮来提醒应用程序发推者实际上是否生病。

尽管这些应用程序似乎很有前景,但当前的研究状况表明,Twitter 作为监测公共卫生工具的有效性存在局限性。 Twitter 用户代表了人口的一个横截面,其中不包括所有地区、社会经济阶层和年龄组。 Twitter 中代表性不足的两个最大的人口群体是最有可能受到流感爆发影响的群体:儿童和老年人。 约翰·霍普金斯大学研究员 Michael Paul 表示,这些应用程序与其说是提供当前健康趋势的完整图景,不如说是更有价值的早期预警系统,它可以比 CDC 使用的数据收集技术更快地传递健康数据。

标签
User profile image.
Sarah Fudin 在 2U, Inc. 工作,这是一家教育科技公司,与顶尖大学合作在线提供硕士学位。 她目前与四所大学合作伙伴合作:乔治·华盛顿大学的公共卫生硕士、乔治城大学的 MSN 学位以及南加州大学的 MAT 在线和 MSW 课程。

评论已关闭。

知识共享许可协议本作品根据知识共享署名-相同方式共享 3.0 未本地化许可协议获得许可。
© . All rights reserved.