世界上一半的语言正在消亡。我们应该拯救它们吗?

每两周就有一种语言消失,这意味着什么?
349 位读者喜欢这篇文章。
open source button on keyboard

Opensource.com

目前大约有 7000 种语言正在使用,平均每两周就有一种语言消失。联合国教科文组织表示, 一半 的世界语言可能会在一个世纪内消失。在我的祖国印度,过去 50 年里已经消失了 220 种语言,并且 197 种语言 濒临灭绝。

开放科学 通过使个人和组织能够协作和交流知识来改进彼此的工作,从而推动科学研究的发展。其中一个可以利用这种帮助的领域是世界各地的本土语言。

语言优势

我小时候在印度奥里萨邦的一个小镇长大,那里至少 30% 的人口说 桑塔利语,但包括我的家人在内的其余 70% 的人从未尝试学习这种语言。大多数人说 奥里亚语。我们不必学习桑塔利语,因为学校和更大的职业市场都说奥里亚语。

语言优势是存在的,这并没有什么不妥,但我们需要确保我们也保护古老的语言,这样我们就不会失去那些语言固有的故事和文化碎片。我们该怎么做呢?对于桑塔利语,我们没有做好准备,因此谷歌花了将近 15 年的时间才发布第一个符合 Unicode 标准(全球通用编码标准)的 字体。然后,我领导了一个 项目,为桑塔利语构建第二个符合 Unicode 标准且获得 开放字体许可证 (OFL) 授权的字体。(由印度字体设计师 Pooja Saxena 设计,输入工具由 Jnanaranjan Sahoo 和 Nasim Ali 开发。)

语言消亡的原因有很多。一些原因是:

  • 在多元文化和多语言的社会中,官方和/或主要语言具有政府资助的优势。例如,它们被用于学校教育和科学研究。
  • 少数民族语言通常由 土著居民 或生活贫困的人使用。
  • 缺乏数字工具来帮助社会和文化延续和分享他们的本土少数民族语言。随着在线讲故事变得越来越普遍,对数字工具和其他标准的需求变得越来越重要。

开源方式如何拯救这些语言

  • 我们需要一张世界语言地图,并标明保护每种语言的相关挑战。
  • 我们需要协作工具和技术,以便与濒危语言社区密切合作。
  • 我们需要开放教育资源,用于编写手册和其他材料,以培训人们如何进行语言文档记录。
  • 我们需要记录关于现在(例如,当前事件的新闻报道和其他社会经济事件)和过去(民间文学和文化现象)的开放多媒体内容,并进行注释以扩大语言的范围。
  • 我们需要数字工具来构建语言应用程序(例如,机器学习和自然语言处理工具,如文本转语音,可用于放大多媒体内容并帮助构建数字辅助工具,如屏幕阅读器)。

已经有人在做这方面的工作,而且还有更多工作要做。目前正在开展开创性的语言保护倡议,以数字形式保护本土语言。一些值得注意的倡议包括:

考虑到语言灭绝的速度如此之快,有必要不断进行干预。我个人启动了一个名为 OpenSpeaks 的项目,旨在构建 OER 并帮助公民档案员创建多媒体语言文档。我希望为更广泛的受众策划内容,并使用这些内容来构建数字辅助功能和其他工具,以帮助本土语言使用者访问知识并为公共知识库做出贡献。

标签
Somewhere in Mumbai in a moving local train.
Subhashish Panigrahi (@subhapa) 是 OpenSpeaks 的创始人,这是一个屡获殊荣的项目,旨在发展开放资源以数字化记录边缘化语言。他共同创立了 O Foundation (OFDN),这是一个非营利组织,致力于解决人、文化和技术交汇处的问题,其核心是开放性。

5 条评论

“我们应该拯救它们吗?”

显然,我认为除了标题之外,没有任何迹象表明不是这样。这绝对不是是否拯救的问题,而是如何拯救的问题。

很高兴你喜欢它,Adam。是的,“如何做”部分肯定需要详细说明。最后一段确实引出了这个问题,但我将写更多文章来详细说明如何使用计算机、智能手机等不同的工具来记录语言。敬请期待。:)

回复 ,作者:AdamElteto

Subashish,我要提前向你和这篇评论的任何其他读者道歉……它比我开始写的时候预期的要长得多 :)

……首先让我说,我真的很喜欢你的文章……虽然我还没有真正深入研究过这类主题,但我不时地遇到一些关于这个主题的文章,它一直是一些非常吸引我,但也非常令人沮丧的事情……

我对濒临消亡/消亡的语言主题的主要挫败感是,没有人真正解决我认为尚未解决这个问题的主要原因。

所以请允许我详细说明我认为这个复杂且错综复杂的问题尚未解决的主要原因,这个问题可以从一些最新的技术优势中获益……金钱

你关于语言消亡原因的第二点直接支持了我的信念/理论的前半部分……而你在这里写的第一句话,除了让我了解目前存在的众多标准之外,实际上更详细地阐述了我的理论的后半部分。

开源绝对很棒,但只有真正的“独角兽”项目才能在实际上对“某人”有利可图的情况下生存下来,而那些在没有盈利方面生存下来的项目,即使是那些拥有真正罕见和伟大的想法的项目,仍然需要非常长的时间才能得到证明。

所以我的关键问题是向你和你的所有读者提出的,很简单……如果我是一个风险投资家,我必须在 500 家初创公司中选择资助对象,而我的标准是我会选择 100 家给他们少量资金,前提是他们有 50% 的机会获得 250% 的投资回报率……在这 500 家公司中,有多少家支持拯救濒危语言的初创公司,或者我以前甚至听说过多少家公司的名字?

对于这个相当简单的问题,没有好的回应,至少我甚至没有意识到任何一种好的回应。我认为这是问题最糟糕的方面,没有一个清晰简洁的电梯演讲,可以有可能向潜在投资者灌输信心,让他们相信有 3.57 万亿个理由来进行这场赌博。

语言翻译、学习和/或复活已消亡的语言长期以来一直是一个非常具有挑战性和已知的问题……或者拉丁文和埃及象形文字比我手头记得的更近期/重要?

语言专家或支持他们的公司是否比你提到的所有项目的总和更有利可图?我绝对没有关于这方面的数据,但我仍然非常有信心做出这个假设。

我的理论的后半部分是标准问题,即标准太多…… https://xkcd.com/927/ ……考虑到我出生在美国并以英语为母语长大,并且考虑到在某些全球努力中,例如科学/医学领域,使用英语作为标准语言的趋势非常明显,我不能如此有偏见地认为,一位母语不是英语但仍位居世界十大语言(9.83 亿英语使用者 vs 35.7 亿其他十大语言使用者,根据维基百科)的风投会认为投资一家语言翻译初创公司是一场值得的赌博,为了速度/简洁/市场份额的缘故,这家公司肯定会被迫选择一种标准进行翻译,而这种标准只有十分之一的机会是“正确的”,并且主要(或至少最初)使土著/贫困社区受益。如果这 35 亿多非英语语言使用者每个人都承诺在未来 10 年内每年捐赠区区 0.10 美元给我个人 :),我可以很容易地保证在收到第一张支票后的 12-18 个月内(如果不是更快的话)提供一个可行的解决方案,将 7000 种语言中的 75% 翻译成所有排名前 9 的语言……而且我非常确定任何真正读完我评论的这么多内容的人都可以自信地做出同样的保证!!!

所以,为了用风险投资/高管风格的标题总结我看到的问题……

我绝对希望你能探索一下对语言技术的投资如何在未来 20 年内将我变成万亿富翁!

我绝对相信这种潜力存在……好吧,也许不是个人,但很容易成为一家潜在的万亿美元独角兽公司的主要投资者,或者更重要的是第一位创始人……挑战仅仅在于什么是 1 个,甚至是 3-4 个“正确”的标准来追求……并解释如何最大限度地降低整体风险,同时清楚地说明最坏情况/最佳情况的投资回报率,并且为了真正相信潜在的投资回报率,应该非常清楚地解释收入实际上将来自何处和何处。

再次,我衷心赞扬你在本文中传达的信息,但我绝对希望看到有人挺身而出,迎接挑战,更好地解释为什么这个问题尚未解决,并考虑到新可用的技术,仍然存在哪些潜在障碍,以及创始人如何可能向风险投资家进行推介,清楚简洁地解释说,尽管存在许多未知变量,但潜在的投资回报率是前所未有的。

有趣的评论,Rick。

根据我在土著环境中工作的经验,我认为你认为保护和鼓励土著文化应该对一些外部投资者有利可图的想法不会被普遍接受。

如果你去加拿大北部或智利南部的偏远原住民社区旅行,你会遇到许多社区领袖,他们对流行文化的“海妖之歌”感到沮丧,并正在努力使他们的传统方式对社区的年轻人有吸引力。你还会遇到一些人(不仅仅是年轻人)失去了文化联系,并为此而痛苦。

建议这些问题应该,甚至可以,通过外部投资者找到一种从剥削这种文化中获利的方式来解决,这可能有点难以推销。

至于你的评论“我绝对希望看到有人挺身而出,迎接挑战,更好地解释为什么这个问题尚未解决”,这里有一些想法供你参考:

https://www.quora.com/How-can-we-help-promote-indigenous-languages-and-…

回复 ,作者:Rick(未验证)

出色的文章,Subhasish!非常感谢你的贡献。

知识共享许可协议本作品根据知识共享署名-相同方式共享 4.0 国际许可协议获得许可。
© . All rights reserved.