发表者: Sveta Kelman, Google Translate 资深项目经理
自 2006 年起,我们开始在英语与阿拉伯语,中文和俄罗斯语之间使用机器学习为基础的翻译方法。十年之后,加上我们今天新增的 13 种语言, Google Translate 支持的语种总数已达到 103 种,覆盖了 99% 的线上人口。
新添加的 13 种语言包括:阿姆哈拉语、科西嘉语、弗利然语、吉尔吉斯坦语、夏威夷语、库尔德语、卢森堡语、 萨摩亚语、苏格兰盖尔语、修纳语、信德语、帕施图语以及班图语,让超过 1.2 亿人所使用的语言加入 Google Translate 大家庭。
翻译语言基本准则是书面用语,在这一准则之上,我们还需要翻译大量网络上可使用的新兴用语。因此,我们将机器学习原理,授权内容以及翻译社区( Translate Community )进行结合。
在网络上我们可以得到数十亿翻译文本,因此我们利用机器学习让系统大规模的 “ 学习 ” 语言。但已有的文章并不能完全涵盖语言的广度,我们同样也需要翻译社区的你们来帮助我们提高 Google Translate 质量并添加新语言,比如弗利然语和吉尔吉斯坦语。目前,已有超过 300 万社区群众贡献了将近 2 亿个译词。
在你深入探索翻译功能之前,这有一些关于语言的趣味信息供你了解:
虽然我们已实现超过 100 种语言的相互翻译,但这一切还远远不够。如果你也想贡献一份力量,为什么不赶在 2 月 21 日国际母语节到来之际加入翻译社区。你只需选择日常用语,就可以进行短语翻译或者验证已有的译文。你的每一次付出都能够帮助我们提高翻译质量。同时,分享你的反馈到 Translate.Google.com ,我们非常乐意听到你的建议!
对于每一种新语言,我们通过改善算法和系统,并从翻译社区里的翻译中汲取精华,从而使翻译质量不断完善。你将在接下来的日子里体验到今天的语种更新。
无论你使用何种语言,我们希望今天的更新可以让你打破语言的隔阂,让你能够与无数新朋友自如地沟通对话。