我非常期待 Joshua Lee 在 DrupalCon 2015 大会上关于基于 Drupal 的国际生物安全情报系统(IBIS)的演讲。虽然我不是生物安全专家,但收集生物安全信息的聚合方法和流程工作流与许多行业相关。在他的演讲中,将介绍创建此数据聚合系统的技术,以及 Drupal 社区如何从中受益并为此项目做出贡献。
为了快速了解 IBIS 的工作原理,该系统从不同的来源抓取文章,这些来源要么是可信的,要么需要人工验证。这些文章一旦经过人工验证或来自可信资源,就可以被引入 IBIS 网络,分发给 IBIS 成员。该系统的人工干预保持在较低水平,以便将信息快速报告给生物安全专家以进行决策。
我与 Joshua Lee 坐下来,填补了一些空白,并为我们提供了关于 IBIS 更详细的背景信息。
在开发这个系统时,您遇到了一些什么问题?您认为这些问题是生物安全报告所需工作流程独有的吗?
在开发系统时,我遇到的最重要挑战是构建一个高性能网站。作为一个新闻聚合器,IBIS 每天使用 Google API 收集大约 10,000 篇新闻文章,并从不同的 RSS 源收集 5,000 篇研究和工业文章。我大部分时间都花在改进算法和服务器架构上,以确保网站在收集新闻文章时表现良好。这对任何类型的新闻聚合器来说都是一个常见的挑战。
动物相关的生物安全文章主要是通过宿主、害虫和疾病名称的组合来发现的。这需要 IBIS 查询构建器使用特殊语法来编写 Google 搜索查询。由于搜索模式对于 IBIS 来说是独一无二的,因此它阻止了该技术在其他行业中的使用。我目前的研究是使 IBIS 搜索过程通用化,以便 IBIS 算法可以在其他领域被广泛采用。
开源是如何促成 IBIS 的创建的?在选择内容管理平台时,为什么选择 Drupal?
澳大利亚政府农业部从一开始就决定使用开源技术来构建 IBIS。IBIS 的目标不仅是使澳大利亚政府受益,还要使全球生物安全社区受益。越来越多的不同国家的组织机构为了不同的目的开始使用 IBIS。开源允许社区中的任何人为 IBIS 做出贡献,这也为 IBIS 的使用方式开辟了可能性。
选择 Drupal 是因为它是最流行的开源 CMS 平台之一,并且拥有不断壮大的社区。IBIS 将由不同的承包商和公司开发,Drupal 将通过社区提供的强大支持来最大限度地减少任何过渡时期。
在确定一个流程应该是自动化的还是由文章评估员/搜索编辑处理时,有哪些考虑因素?
IBIS 的设计目的是为用户带来尽可能多的相关文章以供分析。文章编辑只需要在文章无法被 IBIS 检测到时,才需要手动将文章提交到系统。
文章评估员的角色是剔除噪音,并推广他们认为可能对订阅用户重要的文章。这个过程需要具有生物安全背景的科学研究人员来识别有价值的文章。
是否有计划将 IBIS 使用的技术打包(例如作为 Drupal 模块或快速入门包),以便需要此工作流程的公司或组织也能轻松使用这项技术?
已经有来自不同行业的其他组织机构对 IBIS 正在使用的技术表示了兴趣。我们很乐意与社区分享代码库和算法。这样做,我们也可能从社区贡献中受益。考虑到需要删除 IBIS 的特定功能和结构才能创建一个通用系统,我们计划研究将 IBIS 转换为 Drupal 发行版或一组 Drupal 模块的可能性。完成工作后,我们将在 drupal.org 上发布这些模块。
IBIS 计划进行哪些额外的自动化?
IBIS 开发的下一阶段将侧重于数据分析和社交媒体新闻聚合功能。现有的 IBIS 订阅者受益于每日摘要。我们计划通过为具有不同兴趣的用户创建可视化数据分析工具,将订阅者引入网站。该工具将能够生成图表,以显示不同国家/地区害虫和疾病之间的联系。对于那些有兴趣检测不同社交媒体上的热门话题的用户,社交媒体聚合器将成为可选功能。
演讲者访谈
本文是 DrupalCon 2015 演讲者访谈系列的一部分。DrupalCon 2015 汇集了来自全球各地数千名使用、开发、设计和支持 Drupal 平台的人员。它于 2015 年 5 月 11 日至 15 日在加利福尼亚州洛杉矶举行。.
评论已关闭。