欢迎来到我的每月专栏的第三期,本专栏探讨开源软件和开源方式如何在数字人文领域中应用。每个月,我都会介绍您可以在数字人文研究中使用的开源工具,以及一些正在使用开源工具的人文研究项目。我还将介绍关于透明度和开放交流以及开源方式原则如何应用于人文领域的最新动态。
首先,让我们解释一下什么是数字人文。数字人文是传统人文科学学术研究(即对艺术、语言、历史等学科的学术研究)与数字时代的结合。通过以新的和创新的方式使用技术,数字人文领域的学者可以创建研究项目,以以前不可能实现的方式(或极其费力的工作)探索主题。
文本/数据挖掘、可视化、信息检索和数字出版是数字人文研究的一些关键特征。借助计算机,可以相对容易地分析文本、发现模式和可视化数据。此外,数字项目可能比传统学术研究更容易为公众所接受。例如,数字人文项目可以构建与过去的联系,例如亚伯拉罕·林肯论文项目正在处理林肯总统的论文,以及罗伊·罗森茨威格历史与新媒体中心将要做的,即为艾森豪威尔电子纪念馆创建学习材料。
今年四月,发布了几个新的教程以及许多其他有趣的发展。我在下面重点介绍了其中最有趣的几个。也许其中一个会启发您自己的数字人文研究,或者帮助您了解这个有趣的学术研究领域。
学习如何使用 Gephi
Gephi 是一个用于创建社交网络或类似数据中连接的可视化表示的工具。 Gephi 附带的示例项目之一是“悲惨世界中人物的共同出现网络”。另一个示例项目着眼于 Java 编程语言类的依赖关系。基本上,如果您的数据项之间存在连接,则可以使用 Gephi 来可视化这些连接。
Gephi 相当复杂,对于新用户来说可能会感到不知所措。值得庆幸的是,有一些很好的教程可以向新用户介绍 Gephi 的功能。3 月下旬,Brian Sarnacki 在他的博客上发布了Gephi 新手完全指南。Sarnacki 的教程通过引导读者完成六个关键步骤,向读者介绍了 Gephi 的工作流程。另一个很棒的教程是 Miriam Posner 的一种向数字人文学生有趣地介绍数据可视化的方法,这是一个课堂练习,旨在教学生如何管理数据集并将其可视化。除了介绍 Gephi 之外,Posner 的教程还涉及 OpenRefine。这两个教程都是很好的入门指南,应该可以帮助您学习如何使用这个强大的开源工具。
使用开源软件进行定量考古学研究
与许多学术领域一样,考古学也使用统计软件包进行定量研究。最流行的软件包当然是闭源解决方案,例如 SPSS 和 Excel。Arc-Team Open Research 博客 论证了使用 R 代替这些闭源选项的理由。博客文章指出的闭源选项的问题是专有文件格式、在点击式环境中难以重现选择/选项,以及统计分析中使用的算法不开源。另一种选择是使用 R,这篇文章重点介绍了 RStudio、“Hadleyverse”(R 附加软件包的集合)以及 R 社区如何使 R 成为考古学家的绝佳选择。
Hydra-in-a-Box 联合倡议
美国数字公共图书馆宣布,Hydra-in-a-Box 已获得博物馆和图书馆服务研究所提供的 200 万美元资助。Hydra-in-a-Box 是 DPLA、斯坦福大学图书馆和 Duraspace 的联合项目,目标是“生产一种交钥匙的、基于 Hydra 的解决方案,该解决方案可以被全国范围内的机构广泛而轻松地采用”,每个组织都提供不同领域的专业知识。 Hydra 已经是一个用于管理和共享数字资产的强大解决方案,而 Hydra-in-a-Box 将使该项目对于希望使用 Hydra 共享数字对象的最终用户来说更加平易近人。
定制的成本
伯克利数字人文博客饶有兴趣地探讨了为数字人文项目使用自定义代码与预打包解决方案的比较。数字人文项目的资金并不总是涵盖项目的长期维护,而且通常主要研究人员/开发人员在项目完成后不再积极参与项目的维护。该博客文章以 DiRT Directory 为例,该项目已经多次易手,这意味着有新的人员来支持该项目。DiRT Directory 在 2011 年的重新设计中使用了 Drupal,因此该项目的代码通过 Drupal 社区获得了广泛的支持结构,如果他们使用自定义代码(即使他们使用开源框架来开发自定义代码),他们也不会获得这种支持结构。长期维护是每个人都应该关注的事情,即使对于数字人文领域之外的人来说,这篇博客文章也值得一读。
这是一个关于开放数字人文领域现状的月度专栏。如果您有与此主题相关的新闻想要分享,请发送电子邮件给 Joshua Allen Holm。如果您想投稿一篇关于此主题的文章,请将您的投稿发送给 Opensource.com 编辑团队。
评论已关闭。