本地化
回到专栏主页
我们的游戏机器翻译之旅
工具辅助翻译在过去几十年的发展中已经发生了巨大的进步。完美的机器翻译一直都是游戏本地化行业梦寐以求的目标之一,因为这意味着更快的翻译效率和更大体量的项目承接能力。
可惜如同任何涉及人类语言的项目一样,完善这一进程的道路总是崎岖蜿蜒。成语、本地化俚语和人们各种独特的交流方式,都给机器的正确理解带来极大挑战。即使翻译目标非常明确,对于机器来说仍然需要很多年的试错才能达到和人工一样相同的熟练度……同时依然需要大量的人工参与。下面,我们将为大家介绍机器翻译技术发展的历史,包括人们是如何慢慢接受这一技术的历程,以及它将如何给游戏业的未来赋予收益和挑战。
在过去,人工翻译、编辑和校对一直都是非常耗时耗力的过程。团队在翻译和校对上的人员比例通常为:2:1。
最早的机器翻译项目主要都是由政府资助。在过去的70多年里,机器翻译的相关体系获得了大量的投资,而近些年融合了深度学习和人工神经网络的相关研发技术则为其进一步提升了准确性和可靠性。
神经机器翻译引擎的核心是人工神经网络,它模仿人脑的语言逻辑,能够一次性翻译整句,而非几个词几个词的翻译。这种高质量翻译技术将带来更准确、通顺和符合人类语言方式的成果。
使用机器翻译带来的好处非常明显:我们可以更快速地处理更多的内容,同时将更多精力放在复杂和创造性的翻译上(比如一些游戏内容)。机器翻译还能为我们带来显著的产能提升,因为专业翻译人员可以更快速地校对更多文本量,这是传统人工翻译完全无法比拟的。除了节省时间以外,机器翻译在校对复核流程中省下来的金钱成本也非常可观。
PTW一直致力于引领行业潮流,紧跟科技发展。我们围绕机器翻译快速发展的现状展开了许多讨论和分析。看到神经机器翻译引擎数量和其带来的收益快速增长的潜力,我们决定将机器翻译纳入到我们的本地化流程中。
最初,我们把机器翻译当作一款工具来进行测试,用于强化内部团队的效率,包括翻译内部文件、公司文档、和针对Bug报告的日文-英文双向翻译。
我们起初将时间和精力放在某一特定的机器翻译供应商,不过在多次测试之后,我们发现某些引擎在特定语言和主题上能有更好的表现。
因此,我们试用了多个引擎,逐一测试了开发和玩家客服团队内部交流中使用的六种语言。
接着,我们收集、分析和整理了数据的准确性、流畅性、错误数量、无需校对的条目数量,和常见的错误类型。结果显示了排名靠前的四款引擎都能满足我们有兴趣的语言组合需求。我们也花费了许多时间精力在那些易使用且可定制的即插即用的引擎上。
虽然单一的解决方案看上去简单方便,但我们不想在任何一种语言的翻译品质上有任何妥协。因此,我们决定使用针对文本类型和特定语言组合所需要的最佳引擎来定制工作流程。
在引擎不唯一的准则下,我们可以自由灵活地根据语言和文本风格挑选正确的引擎。这意味着我们可以支持不同的语言和游戏类型,而这是在以前无法做到的。
我们的技术团队在这方面参与很多,不仅帮助进行数据监管、引擎训练和研发,同时也将引擎与现有工具连接,甚至在必要的时候创建了一些全新工具。我们还对欧洲和亚洲的语言质量评价和评估方面投入了大量的时间和金钱成本,包括对员工培训、引擎调制以及后期校对和评估的人工数据整理和收集。
我们的流程还包括定位和实施适用合作伙伴本地化流程的机器翻译解决方案,从引擎定制和品质测试到将各个语言与对应的引擎匹配,以此应对具体的游戏系列。
采用的引擎将随后进行训练并无缝连接至相应的CAT工具或TMS上。我们的游戏翻译专家会负责人工后期编辑作为流程的收尾,以此确保项目的最终品质。
神经机器翻译所带来的技术发展和显著的质量提升正是推动我们在机器翻译工具上进行投入的关键,这些投入将带来产能提升和执行时间缩短的收益。不过我们依然有可以改进的地方,和未来更多的潜在应用场景。
目前我们正在自主研发一款工具,利用机器翻译来为玩家客服的工单提供快速有效的翻译服务。这样我们的玩家客服专员能够对那些非母语的工单进行快速回应,并优化我们支持团队在相应语言工单高峰期的工作效率。
在游戏翻译市场不断拓宽的同时,我们还将把机器翻译用于少见或资源稀少的语言,例如芬兰语和土耳其语,和其他一些最初未被考虑在游戏本地化服务范围之内的语言。
最后,我们将继续探索高质量机器翻译服务,将机器翻译应用于亚洲语言(比如,日-简中和繁中;简中-韩语等等)。我们目前正在使用内部文件作为测试对象,但之后会在改进的过程中更多地将目光聚焦在游戏内容。
说到底,我们可能永远没法达到那种只要向机器输入一种语言,就能完美获得其他任何语言的机器翻译技术,因为人类的语言本身始终在以极快的速度持续进化。但即使如此,目前阶段的机器翻译技术能带来的好处也是非常明显的,因此我们将继续进行研究,让每一次改进能更上一层楼,并给未来指明方向。