改进印度语言维基百科的 8 项挑战

尚无读者喜欢这篇文章。
8 challenges for improving the Indian-language Wikipedias

Subhashish Panigrahi。CC BY-SA 4.0。

印度语言维基百科存在已超过 10 年,但仍不为许多印度语使用者所知。维基百科因成千上万的志愿者编辑而成为历史上最大的百科全书。当母语维基百科在世界其他角落成为改变游戏规则的力量时,印度的情景却有所偏差。在“BHASHA:印度语言数字节”上发言时,我在新德里就印度语言及其在新媒体(尤其是在数字平台)中的状态进行了一整天的讨论,我分享了印度语言维基百科面临的挑战。

1. 语言社区

许多印度母语使用者不知道如何使用其文字输入的语言进行在线搜索。由于 Google 的主页未将其语言文字显示为选项,人们常常认为他们的语言在互联网上不存在。Google 现在有九种印度语言。但这并不能阻止桑塔利语曼尼普尔语使用者使用 Unicode Ol chiki(桑塔利语文字)或 Unicode Meithei(曼尼普尔语文字)进行搜索。Google 和其他搜索引擎将显示互联网上任何文字的内容,但不知道这一点会使许多人远离互联网,这也意味着远离维基百科。

2. 维基百科的编辑社区

维基百科是由像你我这样的人创建的。从写作到编辑,一切都是自愿发生的。许多人不明白他们可以纠正错误并帮助改进维基百科文章。几种印度语言的维基百科编辑社区非常小。尽管这些语言有数百万人使用,但只有少数编辑为这些语言的维基百科编辑做出贡献。截至 2016 年 1 月,印地语维基百科只有 89 位编辑,而印地语在母语使用者人数最多的语言列表中紧随英语之后。

3. 计算机中的语言输入

印度的大多数人知道如何用自己的语言打字。此外,用户学习语言输入的文档也很少。即使印度许多政府开办的学校看到了更多的计算机并可以访问互联网,但在所有州的学校中,母语输入和其他一些基础计算机培训尚未得到广泛教授。用于语言输入的免费软件是可用的,并且过去存在的印度语言打字挑战(PDF)在很大程度上已得到解决。

4. 移动设备中的语言输入

印度有超过10 亿人(PDF)拥有手机,15% 的互联网普及率将很快以更快的速度增长。这种增长和激烈的竞争迫使电信服务提供商降低数据费用,这将帮助更多的印度人访问互联网。如果这些人没有接受过母语输入教育,那么他们将被困在以英语为中心的互联网中,而不是能够用自己的语言进行导航。许多拥有智能手机的印度人需要完整的印度语言支持,尤其是内置的输入法,才能用自己的语言为维基百科做出贡献。

5. 互联网上印度语言内容的可用性低

互联网上缺乏母语内容是获取知识的障碍。例如,让我们看看我的邦奥里萨邦。喀拉拉邦(印度邦)政府的官方旅游门户网站提供奥里亚语和其他印度语言版本,但奥里萨邦政府的旅游门户网站今天在奥里亚语没有信息在我们自己的邦,我们的语言在很大程度上被忽视了。

6. 传统媒体和新媒体的不匹配

许多传统媒体机构仍然使用非标准的 ASCII/ISCII 脚本编码系统,而不是采用Unicode 标准。作为全球标准,Unicode 可以帮助统一世界,并且已经为印度语言提供了近 25 年。但是我们的许多印刷媒体未能采用这一点,许多流行的印度语言报纸仍然没有 Unicode 版本。

7. 缺乏开放访问

许多在线信息,包括政府创建的内容,都受到版权许可的保护。付费墙和版权限制使信息封闭,并阻止人们共享内容。另一方面,维基百科内容根据知识共享署名-相同方式共享许可提供,该许可允许任何人使用该内容(甚至分发其商业副本)。根据免费许可开放内容的想法可以帮助信息到达无数更多的人。

8. 可访问性

印度有超过 6 千万人患有听力障碍。许多肢体残疾人士需要良好的文本到语音和语音到文本引擎。这些软件解决方案必须是免费的,这样任何人,无论其经济状况如何,都可以用自己的语言为维基百科做出贡献。

本文的一个版本也出现在 thewire.in 上。

Somewhere in Mumbai in a moving local train.
Subhashish Panigrahi (@subhapa) 是 OpenSpeaks 的创始人,这是一个屡获殊荣的项目,旨在帮助发展开放资源,以数字化记录边缘化语言。他共同创立了 O Foundation (OFDN),这是一个非营利组织,致力于解决以开放性为核心的人、文化和技术交汇处的问题。

评论已关闭。

Creative Commons License本作品根据知识共享署名-相同方式共享 4.0 国际许可协议获得许可。
© . All rights reserved.