Openwords 挖掘海量的、已有的公共数据资源(如 Wiktionary 或 Apertium),以便为世界人口,特别是为未充分服务语言,快速提供语言学习移动软件。
世界上超过一半的人口没有适合其语言或需求的语言学习应用程序。我们谈论的是全球数十亿人,他们说的语言的母语使用者少于 1 亿。大多数这些语言都被移动应用程序开发者所忽视,但 Openwords 是一家旨在解决此问题的初创公司。
那么,当像 Rosetta Stone 这样的公司每年收入超过 2 亿美元,而 Duolingo 拥有数千万美元的投资时,为什么一家初创公司能够解决这个问题呢?
Openwords 应用程序拥有开源内容。Openwords 可以挖掘海量的、已有的公共数据资源,如 Wiktionary 或 Apertium(一个开源机器翻译器)。因此,Openwords 将能够为没有语言学习应用程序的人群快速提供内容。其他公司需要自己构建这些内容,但 Openwords 使用已经存在的开放数据。
Openwords 已经证明了这个概念是可行的,它整理了超过 1000 种语言的内容,并将开展一场活动来筹集资金,以完成 Openwords 应用程序的开发。Openwords 应用程序将为这个开放内容集合提供一个语言学习平台。
Openwords 强调自由
Openwords 应用程序将强调自由。许多现有的应用程序不允许学习者决定他们将学习什么。例如,Duolingo 不允许用户选择他们接下来要学习的单词,这些单词是预设的。Openwords 将给予学习者这种自由,同时也允许他们遵循默认的课程。Openwords 应用程序对于学习者来说也将是免费的(指没有经济成本)。
最重要的是,Openwords 的内容属于公共领域。这意味着所有 Openwords 教育内容都是版权开放的,并为公众所有。我们认为人类语言是公共资产。这是 Openwords 与其他主要语言学习应用程序之间的主要理念差异。Openwords 应用程序将作为开放内容的阅读器发挥作用。当你为 Openwords 贡献或改进内容时,你是在为每个人构建东西。
Openwords 的起源
Openwords 的想法源于创始人兼首席执行官 Marc Bogonovich 的研究方法。作为印第安纳大学的研究生,Bogonovich 挖掘了大量可用的数据源,并将这些数据重新用于新的问题。Bogonovich 意识到存在大型的开放语言数据源,并且这些数据可以解决各种未充分服务语言的未被满足的教育需求。Bogonovich 接受过进化生物学家的培训,但他意识到他在生物学研究中应用的相同挖掘方法也可以应用于资源不足语言的问题。
Openwords 的首席技术官 Shenshen Han 也是印第安纳大学的前研究生。Han 认为,一个具有公共领域内容的通用语言学习平台可能是解决为满语(Han 是满族人,中国的少数民族)等资源不足语言提供电子教育内容挑战的方案。
社会创业
Openwords 是一家以社会和财务目标为目的的营利性企业。Openwords 旨在提供
- 免费、开放领域的教育材料。
- 为没有电子外语学习内容的人群提供多样化的教育材料。
为了产生收入,Openwords 将向教师提供订阅服务。教师将能够在课堂外监控学生在 Openwords 应用程序上的学习情况,从而获得关于学生表现的宝贵信息。在学习者同意的情况下,Openwords 也可能向他们提供相关产品、旅行或其他教育服务的赞助链接。
用户
Openwords 旨在解决的问题正在增长。智能手机市场增长最快的地区是拥有多种语言的地区,包括非洲、亚洲和拉丁美洲。这些地区的互联网和智能手机增长将导致对数字语言学习程序的更多需求。这些地区对应的许多语言都未得到移动应用程序开发者的充分服务。
如何参与
Openwords 有两个部分
- Openwords 拥有一个不断增长的单词和翻译问题数据库。这些数据来源于公众,并为公众所有。
- Openwords 正在构建一个应用程序,它可以读取这个数据库,为学习者提供问题,并具有精心设计的界面。
Openwords.com 将托管关于 Openwords 应用程序的信息。
Openwords.org 托管 Openwords 单词和语言问题数据库。
Openwords 正在向开源社区寻求指导,以了解如何成功履行对开源社区的所有义务。Openwords 在使 Openwords 数据库可用方面取得了很大进展,并构建了一个通过 Openwords.org 提供的 HTTP API。
Openwords 现在需要帮助改进和构建 Openwords 数据库。Openwords 正在寻找对自然语言处理 (NLP) 和特定人类语言有兴趣和知识的人。我们有兴趣与在 NLP 方面有技能并能够制作学习内容的企业或个人进行收入分成。Openwords 还希望建立机制,将我们对 Openwords 数据的改进反馈回原始来源(例如 Wiktionary)。例如,参与者已经完成了整个英语-波斯语 Openwords 数据库的检查,并检查了错误。这些数据大部分来源于 Wiktionary,Openwords 旨在自动将改进反馈回 Wikimedia。
评论已关闭。