Subhashish Panigrahi

1332 积分
Somewhere in Mumbai in a moving local train.
班加罗尔

Subhashish Panigrahi (@subhapa) 是 OpenSpeaks 的创始人,这是一个获奖项目,旨在发展开放资源,以数字化记录边缘化语言。他共同创立了 O Foundation (OFDN),这是一个非营利组织,致力于解决以开放性为核心的人民、文化和技术交汇处的问题。他是互联网协会亚太地区的区域发展经理,过去曾在 Mozilla、互联网与社会研究中心的知识获取项目以及维基媒体基金会工作,以深化亚洲各地开放知识/开源社区的发展。在 Twitter 上关注 Subhashish @subhapa。

撰写的评论

嗨,我同意您关于 ISCII 和 Unicode 的观点。我亲眼见过卡纳达语专有 OCR 的演示。由于它无法下载,不是开源的,并且开发者明确表示甚至不出售该软件包,我将避免提供有关此事的详细信息。这与我为开源做贡献的根本动机背道而驰。另一个广为人知的 OCR 是 Tesseract。当然,它需要大量的培训和协作。目前我没有个人和/或专业时间来处理此事。但我将继续与人们联系。谁知道呢,也许有人会把它提升到一个新的水平?

亲爱的 Randompie,感谢您对这个话题的兴趣并分享有用的信息。但请允许我澄清一下,我提到的是奥里亚语被宣布为古典语言后的政策层面变化。90 年代的所有那些政策改革在这个特定案例中都是无效的。这是一件不同的事情,尽管您提到的一切,但仍然存在多个互不兼容的 Unicode 标准。我每天都面临着实际问题。无论如何,这不是讨论的重点。说到政府机构的开放性和透明度,我想分享两个事实。与专有的 WINDOWS 特定软件相比,包含语言工具的 CD 有很多空白文件夹。一个资金充足的奥里亚语 OCR 项目在过去 8 年中从未公开供用户测试和提供反馈,而只是为负责人带来了个人名誉。但假设是善意的,我不想在这里争论您所说的那些不相关的事情。我很乐意通过电子邮件(psubhashishatgmaildotcom)讨论这些。我对 @randompie 的最后一点看法是,ISCII 已成为历史,让我们尊重当时发生的事情。但在 Unicode 时代,谈论 ISCII 将毫无意义。谢谢,到此为止。

© . All rights reserved.