互联网档案馆如何维护信息高速公路

还没有读者喜欢这个。
open network

Opensource.com

自从五年前发现 互联网档案馆 以来,我一直是它的忠实用户。从那时起,我使用他们的 时光机器 搜索过去万维网的有趣瞬间,而且我也受益于档案馆作为一个分发平台。

我发现了一些被遗忘的老爵士音乐家、小型独立乐队以及整个管弦乐队演奏的音乐表演(有时在我看来是权威版本)。我发掘了小众播客、被遗忘的黑色电影、科幻电影和恐怖电影等等。我甚至在我的一些实验音乐(我认为在艺术学院它们会被归类为“声音拼贴”)专辑中使用了旧电视广告和电视节目的声音片段。

而且,也许最重要的是,我瞥见了用户和本土档案管理员的文化,他们有兴趣以最精细的细节获得世界的不可能的快照。

档案馆不仅仅是存档互联网;它是关于利用互联网作为世界文化的档案馆,随着时间的推移,没有进入门槛,也不需要资格或理由。而且它奏效了。在档案馆度过一个下午就像在公共图书馆度过一个下午;它是漫无目的的、令人眼花缭乱的,并且充满了无尽的兴奋和教育意义。

在某种程度上,档案馆正是我们在弹出广告和全国性 ISP 出现之前被告知互联网应该成为的样子:信息高速公路。

为了渴望更多地了解互联网档案馆内部的文化以及帮助维持其生命的人们的背景,我与互联网档案馆的媒体和访问主管 Alexis RossiVicky Brasseur 进行了交谈,Vicky Brasseur 是一位维护互联网档案馆 S3 API 文档的志愿者。他们一起在 All Things Open 2015 上就互联网档案馆的 API 集进行了演讲。

阅读本次采访以了解更多信息。

您在互联网档案馆做什么?

Alexis Rossi (AR): 基本上,我负责所有数字媒体(图书馆术语中的“馆藏”)以及人们访问这些媒体的界面。

Vicky Brasseur (VB): 目前,我想你可以称我为无特定职务的志愿者。我维护互联网档案馆 S3 API 文档,有时会四处旅行,谈论档案馆、其馆藏以及人们如何使用它。

您的教育背景是什么?

AR: 我拥有英语文学学士学位和图书馆与信息科学硕士学位。自 1996 年以来,我一直从事互联网内容工作。(在此之前,我曾经编辑食谱!)

VB: 我是一位前程序员,很久以前就走向了管理的黑暗面(我喜欢它)。我没有 MLIS 或正式的档案管理员培训,但我在图书馆或图书馆软件方面工作了 10 多年,我非常了解并敏感于 GLAM(美术馆、图书馆、档案馆、博物馆)在我们生活中的重要性。

您是如何参与互联网档案馆的?

AR: 当我在 Alexa Internet 工作时,我开始参与互联网档案馆,Alexa Internet 也是由 Brewster Kahle 创立的。Alexa 为我们构建了第一个版本的 时光机器,当我于 2001 年推出它时,我就在那里。

VB: 我在档案馆创建后不久就意识到了它的存在,可能是通过它与 古腾堡计划 的关系,并在多年来继续关注它。2011 年,我写信给档案馆,介绍了我的资历,希望那里有适合我的志愿者机会。我很惊喜地被提供了一个全职职位来开发一个新项目。生活发生了变化,我离开了档案馆,但我找到了保持与它及其鼓舞人心的使命联系和关联的方法,自从我离开后一直如此。

开放对于互联网档案馆意味着什么?

AR: 开放意味着自由获取信息。我们是一个图书馆,我们的存在是为了收集知识并使其可供人们使用。

您为什么觉得互联网档案馆很重要?

AR: 世界上有很多实体图书馆,包括学术图书馆和公共图书馆。它们在为社区服务方面做得非常出色,但它们侧重于为碰巧在附近的人们服务。还有一些数字图书馆倡议,例如 EuropeanaHathi Trust,但它们往往在访问权限和/或范围方面受到限制,具体取决于国籍或大学会员资格或其他因素。

互联网档案馆是一个为全世界服务的公共图书馆。世界上任何人都可以使用我们图书馆的媒体,任何人都可以通过上传来贡献媒体。

最近 archive.org 改版背后的驱动力是什么?

AR: 互联网档案馆的座右铭是“普遍获取所有知识”。多年来,我们一直在改进我们的存储系统,学习数字化图书,收集网页和媒体,并与合作伙伴合作建立馆藏。换句话说,我们花了很长时间来研究我们座右铭的“所有知识”部分。

我们一直都提供这些馆藏,但是旧版本的网站是在 2002 年设计的。自那时以来,互联网上发生了很大变化,虽然我们在此过程中进行了许多小的更改以跟上不断变化的技术,但我们觉得我们在“普遍访问”方面做得还不够。例如,我们约 35% 的流量来自移动设备,而旧版本的网站不具有响应性,并且在手机上相当难用。我们正在继续改进新界面,并将随着新功能的构建而推出新功能。

与表面上“开放”任何应用程序的 API 相比,开放 API 是什么?

VB: 许多读者已经了解应用程序编程接口,即 API。开放 API 正如其名称所示:这些 API 是开放使用的,提供对开放资源的访问,并且(对于公共代码存储库中的那些 API)是开放修改和重用的。如果帮助实现访问的 API 受到任何限制,档案馆就无法完成其普遍获取人类知识的使命。这些 API 旨在被所有人使用和自由使用。

当然,最好始终做一个好公民,不要在短时间内使用这些 API 对档案馆进行数千次下载或上传。但这通常不是问题,因为互联网档案馆的赞助人普遍理解并欣赏他们是更大社区的一部分,所有人都为惊人的丰富资源做出贡献并从中受益。看到这种情况发生真是太棒了。

互联网档案馆本身是一个开放堆栈,还是只有 API 是开放的?

AR: 我们的堆栈是 Ubuntu Linux + PostgreSQL + NGINX + PHP5 (主要是) + Redis + Elasticsearch + jQuery + Less

archive.org 有哪些 API 可用?它们访问什么以及可以用哪些语言访问?

VB: 互联网档案馆提供了如此多的 API,我几乎不知道从哪里开始回答这个问题。有用于时光机器、开放图书馆、搜索和上传的 API。有很多不同的方式可以通过编程方式与档案馆交互。想要挖掘 24 PB 的内容数据吗?有一个 API 可以做到这一点。想要通过将用户重定向到时光机器来消除您网站上的 404 错误吗?有一个 API 可以做到这一点。想要将您的播客托管在档案馆中以便永久保存吗?是的,有一个 API 可以做到这一点。而这只是冰山一角。

在大多数情况下,所有 API 完全与语言无关。您可以进行 REST 吗?您可以进行 URL 吗?您可以解析 JSON 吗?那么您就可以使用这些 API。对于那些 Python 爱好者,档案馆的 Jake Johnson 提供了一个非常棒的工具集和库,它将许多 API 包装成一个简洁的包:github.com/jjjake/internetarchive

我们在 All Things Open 的演讲中介绍了所有 API,但对于那些无法前往罗利的人(我们想念您),我们上传了幻灯片,这些幻灯片将向人们介绍 API 选项:archive.org/details/linuxconna2015-ia-apis

为什么文化保持开放很重要?

AR: 所有人类的成就都建立在别人的工作之上。社会因信息而发展,增加可以访问这些信息的人数只会使我们受益。我们需要更多有更多想法的人!

人们可以做些什么来帮助档案馆?

VB: 除了以各种形式使用它之外?嗯,我不能代表 Alexis 发言,但我非常非常希望有些人能够伸出援手并翻译一些 API 文档。如果您只用一种语言说话,就很难普遍获取所有知识。我不知道如何用英语以外的语言说,但是:欢迎补丁。

Seth Kenlon
Seth Kenlon 是一位 UNIX 极客、自由文化倡导者、独立多媒体艺术家和 D&D 爱好者。他曾在电影和计算机行业工作,通常同时从事这两个行业。

1 条评论

我很久以前就使用过互联网档案馆。设计已经改进了很多。我很高兴听到关于 API 的消息。向团队致敬,感谢你们出色的工作。

知识共享许可协议本作品根据知识共享署名-相同方式共享 4.0 国际许可协议获得许可。
© . All rights reserved.