开源软件正在改变学术研究,以以前不可能的方式实现新的发现和创新。每个月我都会关注您可以在数字人文研究中使用的开源工具,以及一些正在使用开源工具的人文研究项目。
数字人文是传统的人文学术研究——或者说,是对艺术、语言、历史等方面的学术研究——与数字时代的结合。通过以新的和创新的方式使用技术,数字人文领域的学者可以创建研究项目,以计算机出现之前不可能(或非常费力)的方式探索主题。
文本/数据挖掘、可视化、信息检索和数字出版是数字人文研究的一些关键特征。借助计算机,可以相对轻松地分析文本、发现模式和可视化数据。此外,与传统的学术研究相比,数字项目可以更容易地被公众访问。例如,数字人文项目可以建立与过去的联系,例如 OldNYC 项目 通过映射纽约公共图书馆的历史照片,以及 荷兰船舶与海员项目 通过提供“海事历史数据集的基础设施,通过语义网技术链接相关数据”,突出了荷兰丰富的海事历史。
今年五月,一些有趣的项目变成了开源,并且发布了一些有用的资源,以及许多其他发展。我在下面重点介绍了其中最有趣的几个项目。也许其中一个项目会启发您自己的数字人文研究,或者帮助您了解这个有趣的学术研究领域。
来自现代艺术博物馆的 Binder
纽约现代艺术博物馆 宣布发布 Binder,这是一个基于 Web 的开源“应用程序,旨在监督和管理数字馆藏的积极保护”。Binder 帮助博物馆馆长处理数字化和原生数字对象的复杂策展工作。它与 Archivematica 和 Access to Memory 集成,为博物馆提供有关其馆藏的信息,并提供概述屏幕,用于显示整个馆藏或单个项目的信息,以及更多功能。MoMA 目前正在使用 Binder,但根据 官方文档,“就目前的形式而言,该应用程序尚未准备好在其他机构环境中广泛使用,还需要进一步开发。” Binder 的源代码 托管在 GitHub 上,供任何希望为该开发工作做出贡献的开发人员使用。
如果您想了解更多信息,YouTube 上有一个 短视频,简要概述了 Binder 的工作原理。
盖蒂艺术家姓名联合列表
艺术家姓名联合列表是盖蒂研究所根据 开放数据共享署名许可发布的第三组关联开放数据。结合前两个版本,艺术与建筑主题词库和地理名称主题词库,ULAN 为研究人员提供了关联数据,通过例如识别个人或地理名称的变体拼写和别名,简化了研究过程,使研究人员能够建立在关联数据不是开放内容的情况下可能无法建立的联系。关联数据使联系清晰明了,并且以开放许可发布,使研究人员可以轻松地以他们希望的任何方式使用它。
而这仅仅是开始,这三个数据集的发布是盖蒂更广泛的 开放内容计划 的一部分。盖蒂研究所的 关联开放数据页面 提供了有关当前和未来发布的开放数据集的更多详细信息。
用 D3 替换 jQuery 函数
D3.js 和 jQuery 都是功能强大的 JavaScript 库。jQuery 是许多网站使用的通用库,而 D3.js 是用于数据可视化的专用库。当然,您可以将它们一起使用,使用 D3 函数进行数据可视化,而 jQuery 用于其他所有操作,但这意味着要导入两个库并编写有些不一致的代码(jQuery 和 D3 函数的语法不同)。
希望避免这些问题的开发人员应查看 webkid 出色的操作指南,其中展示了如何使用 D3 来完成传统上使用 jQuery 完成的事情。对于在 D3 中没有完全等效项的 jQuery 函数,有一些代码示例展示了如何编写 D3 风格的函数来执行所需的任务。Webkid 的 D3 扩展版本 及其添加的所有自定义函数都可以在 GitHub 上找到。
开发国际化和可互操作的权利声明
美国数字公共图书馆 和 Europeana 正在合作开展一个 项目,以标准化使用权声明。尽管在美国和欧盟不同的版权法下运营,但 DPLA 和 Europeana 都渴望有一种清晰且兼容的方式与合作者和用户共享版权信息。为此,开发可互操作权利声明的技术框架 的工作已经开始。目前,他们正在征求对他们的 权利声明白皮书 和他们的 技术基础设施白皮书 的意见。对这两份文件的评论截止日期为 2015 年 6 月 26 日。
将您希望看到回答的问题和感兴趣的主题发送给 Joshua Allen Holm。要提交您自己关于此主题的文章,请将投稿发送给 Opensource.com 编辑团队。
评论已关闭。