世界上一半的语言正在消亡。我们应该拯救它们吗?

每两周就有一种语言消失,这意味着什么?
349 位读者喜欢这篇文章。
open source button on keyboard

Opensource.com

目前大约有7,000 种语言正在使用,平均每两周就有一种语言消失。联合国教科文组织表示,一半的世界语言可能会在一个世纪内消失。而且,在我的祖国印度,过去 50 年里已经消失了 220 种语言197 种语言濒临灭绝。

开放科学通过使个人和组织能够协作和交流知识来改进彼此的工作,从而推进科学研究。其中一个可以利用这种帮助的领域是世界各地的本土语言。

语言优势

小时候,我在印度奥里萨邦的一个小镇长大,那里至少 30% 的人口说桑塔利语,这种语言是包括我的家人在内的其余 70% 的大多数人从未尝试学习的。大多数人口说奥里亚语。我们不必学习桑塔利语,因为学校和更大的专业市场都说奥里亚语。

语言优势是存在的,这并不是说这不好,而是我们需要确保我们也保护古老的语言,这样我们就不会失去语言中固有的故事和文化片段。我们该怎么做呢?对于桑塔利语,我们没有做好准备,因此谷歌花了将近 15 年的时间才发布第一个符合 Unicode 标准(全球通用编码标准)的字体。然后,我领导了一个项目,为桑塔利语构建第二个符合 Unicode 标准且获得 开放字体许可证 (OFL) 授权的字体。(由印度排版师 Pooja Saxena 设计,输入工具由 Jnanaranjan Sahoo 和 Nasim Ali 开发。)

语言消亡的原因有很多。一些原因是

  • 在多元文化和多种语言的社会中,官方语言和/或主要语言具有政府资助的优势。例如,它们被用于学校教育和科学研究。
  • 少数民族语言通常由土著居民或生活贫困的人使用。
  • 缺乏数字工具来帮助社会和文化延续和分享他们的母语、少数民族语言。随着在线讲故事越来越普遍,对数字工具和其他标准的需求变得越来越重要。

开源方式如何拯救这些语言

  • 我们需要一张世界语言地图,并标明保护每种语言的相关挑战。
  • 我们需要协作工具和技术,以便与濒危语言社区密切合作。
  • 我们需要开放教育资源,用于手册和其他材料,以培训人们如何进行语言记录。
  • 我们需要记录关于现在(例如,当前事件的新闻报道和其他社会经济事件)和过去(民间文学和文化现象)的开放多媒体内容,并进行注释,以扩大语言的范围。
  • 我们需要数字工具来构建语言应用程序(例如,机器学习和自然语言处理工具,如文本转语音,可以用来放大多媒体内容,并帮助构建数字辅助工具,如屏幕阅读器)。

已经有一些工作在进行中,还有更多的工作要做。开创性的语言保护举措正在进行中,以数字形式保护本土语言。一些值得注意的例子是

考虑到语言灭绝的速度如此之快,需要不断干预。我个人启动了一个名为 OpenSpeaks 的项目,以构建开放教育资源,并帮助公民档案员创建多媒体语言文档。我希望为更广泛的受众策划内容,并使用这些内容来构建数字辅助功能和其他工具,以帮助母语人士访问知识并为公共领域做出贡献。

标签
Somewhere in Mumbai in a moving local train.
Subhashish Panigrahi (@subhapa) 是 OpenSpeaks 的创始人,这是一个屡获殊荣的项目,旨在发展开放资源,以数字方式记录边缘化语言。他共同创立了 O Foundation (OFDN),这是一个非营利组织,致力于解决人、文化和技术交汇处的问题,并以开放性为核心。

5 条评论

“我们应该拯救它们吗?”

显然,我认为除了标题之外,没有任何迹象表明不是这样。这绝对不是是否要拯救的问题,而是如何拯救的问题。

很高兴你喜欢它,Adam。是的,“如何做”部分肯定需要详细说明。最后一段确实引出了这一点,但我将写一篇——更多文章详细说明如何使用计算机、智能手机等上的不同工具记录语言。敬请期待。:)

回复 ,作者 AdamElteto

Subashish,我要提前向你和这篇评论的任何其他读者道歉……它比我开始写的时候预期的要长得多 :)

……首先,让我说我真的很喜欢你的文章……虽然我还没有真正深入研究过这类话题,但偶尔会有一些关于这个话题的文章出现在我的视线中,它一直是一些非常吸引我,但也非常令人沮丧的事情……

我对这类垂死/已死语言话题的主要挫败感是,没有人真正解决我认为尚未解决这个问题的首要原因。

所以请允许我详细说明我认为尚未解决这个复杂且错综复杂的问题的主要原因,这个问题可以从一些最新的技术优势中获益……金钱

你关于语言消亡原因的第二点直接支持了我的信念/理论的前半部分……而你在这里写的第一句话,除了让我了解目前存在的众多标准之外,实际上更详细地阐述了我的理论的后半部分。

开源绝对很棒,但如果对于“某人”来说实际上没有盈利能力,那么只有真正的“独角兽”项目才能生存,而那些在没有盈利能力方面生存下来的项目必须是那些真正罕见和伟大的想法,仍然需要非常长的时间才能得到证明。

所以我的关键问题是向你和所有读者提出的,很简单……如果我是一个风险投资家,我必须在 500 家初创公司中选择资助,而我的标准是我会选择 100 家给少量资金,条件是它们有 50% 的机会获得 250% 的投资回报率……在 500 家公司中,有多少家支持拯救濒危语言的初创公司?或者我以前甚至听说过多少家公司的名字?

对于这个相当简单的问题,没有好的回应,至少我没有意识到任何好的回应。我认为这是这个问题最糟糕的方面,没有一个清晰简洁的电梯游说,可以可能向潜在投资者灌输信心,即有 3.57 万亿个理由来进行这场赌博。

语言翻译、学习和/或死语言复兴长期以来一直是一个非常具有挑战性和已知的问题……或者拉丁语和埃及象形文字比我手头记得的更晚近/更重要?

语言专家或支持他们的公司是否比你提到的所有项目的总和更赚钱?我绝对没有这方面的数据,但我仍然非常有信心做出这个假设。

我的理论的后半部分是标准问题,即标准太多…… https://xkcd.com/927/ ……鉴于我在美国出生和长大,说英语,并且鉴于在某些全球努力中(例如科学/医学领域)使用英语作为标准存在显着趋势,我不能如此有偏见地认为,母语不是英语但仍属于世界十大语言(英语使用者 9.83 亿,其他十大语言使用者 35.7 亿,根据维基百科)的风险投资家会认为投资语言翻译初创公司是一场值得的赌博,为了速度/简单/市场份额的缘故,该公司肯定会被迫选择一种标准进行翻译,而这种标准只有十分之一的机会是“正确的”,并且主要(或至少最初)使土著/贫困社区受益。如果这 35 亿多非英语语言使用者仅仅承诺在未来 10 年内每年捐赠区区 0.10 美元给我个人 :), 我可以非常容易地保证在收到第一张支票后的 12-18 个月内(如果不是更早的话)提供一个可行的解决方案,将 7,000 种语言中的 75% 翻译成所有排名前 9 的语言……我非常肯定任何真正读完我这么多评论的人都可以自信地做出同样的保证!!!

所以,为了总结我看到的 VC/高管风格标题中的问题……

我绝对希望你探索对语言技术的投资如何在未来 20 年内将我变成万亿富翁!

我绝对相信这种潜力存在……好吧,也许不是个人,但很容易成为潜在的万亿美元独角兽公司的主要投资者,或者更重要的是第一创始人……挑战仅仅在于要追求 1 个,甚至是 3-4 个“正确”的标准……并解释如何最大限度地降低整体风险,同时清楚地说明最坏情况/最佳情况的投资回报率,并且为了真正相信潜在的投资回报率,应该非常清楚地解释收入实际上将来自哪里和何处。

再次,我衷心赞扬你在本文中传达的信息,但我绝对希望看到有人挺身而出,迎接更好地解释为什么这个问题尚未解决的挑战,并考虑到新提供的技术,仍然存在哪些潜在障碍,以及创始人如何可能向风险投资家推销,清楚简洁地解释说,尽管存在许多未知变量,但存在一种潜在的投资回报率,这与以前见过的任何事物都不同。

有趣的评论,Rick。

根据我自己在土著背景下工作的经验,我认为你认为保护和鼓励土著文化应该对一些外部投资者有利可图的想法不会被普遍接受。

如果你前往加拿大北部或智利南部的偏远第一民族社区,你会遇到许多社区领袖,他们对流行文化的“海妖之歌”感到沮丧,并努力使他们的传统方式对社区的年轻人有趣。你还会遇到一些(不仅仅是年轻人)已经失去文化联系并为此受苦的人。

建议这些问题应该,甚至可能,由外部投资者找出一种从剥削这种文化中获利的方式来解决,这可能有点难以推销。

至于你的评论“我绝对希望看到有人挺身而出,迎接更好地解释为什么这个问题尚未解决的挑战”,这里有一些想法供你参考

https://www.quora.com/How-can-we-help-promote-indigenous-languages-and-…

回复 ,作者 Rick (未验证)

Subhasish,精彩的文章!非常感谢你的贡献。

知识共享许可协议本作品根据知识共享署名-相同方式共享 4.0 国际许可协议获得许可。
© . All rights reserved.