人工智能翻译助力网文“一键出海”

发布时间:2024-12-05 20:31:15 来源: sp20241205

原标题:人工智能翻译助力网文“一键出海”

“土生土长”的中国网络文学已成为世界文化奇观。根据中国作协发布的相关数据,海外用户超过1.5亿人,覆盖200多个国家和地区。

海外阅读需求旺盛,但相较堪称海量的中国网络文学而言,“出海”作品仍是少数。中国网文“出海”至今,累计输出作品16000余部,而仅2022年,国内新增作品就有300多万部。每天有百万海外读者盯着屏幕、在线“催更”,“出海”作品“供不应求”。

翻译是第一道关卡。篇幅巨大、作品海量,而翻译人才不足,成为影响网络文学更大规模走出去的重要因素。

近年来,人工智能(AI)为网文“出海”打开了一扇窗。日前,在第二届上海国际网络文学周上发布的《2023中国网络文学出海趋势报告》显示,截至2023年10月,阅文集团旗下海外门户起点国际已上线约3600部翻译作品,同比三年前增长110%。在人工智能的助力下,网文的翻译效率提升近百倍,成本降低超九成。

AI正推动网文规模化“出海”,让“一键出海”“全球追更”成为可能。

翻译效率提高3600倍,成本降到人工翻译的1%

中文翻译本来就难,文学翻译更难。“信达雅”是文学翻译的基本标准,网络文学翻译也不例外。

在中国社科院研究员陈定家看来,网文在翻译上要尽量满足三个标准:准确性、流畅性、艺术性,“网络文学的翻译应该尽可能准确地传达原文的意思,包括各种语义、文化和情感内涵。译者应该具有良好的语言表达能力,使译文在目标语言中能被自然流畅地阅读”。

北京大学中国语言文学系博士研究生雷宁观察到,对北美受众而言,太极、功夫、龙等中国元素并不陌生。然而好莱坞大片式的文化传播与网文翻译的本质区别在于,前者多用文化符号拼贴的方式打造“中国印象”,难以摆脱隔岸观火的猎奇目光,后者是爱好者主动进行的文化交流行为,借由逐字逐句的翻译来更深入地传导文化。这无疑对译者有很高的要求。

更新效率又关乎用户的黏度。根据艾瑞咨询发布的《2019年中国网络文学出海报告》,影响海外网文用户体验的最主要因素是网文“出海”的效率。超八成的用户会把“作品更新稳定,题材多样”作为选择平台的第一要素,他们常遇到的问题是“正在更新的小说更新太慢和突然停更”,“想看的小说没人翻译”。

翻译难度大,成本也高。有业内人士表示,网络文学请专业译者翻译的价格,基本是每1000字200元的报酬。而作品动辄几百万字,成本何其之高。即使这样,对优秀的翻译人才来说,也不具备吸引力,他们更愿意做同声传译或者金融、法律、医疗等领域的翻译。

技术革新开辟了一条新路。2018年,国内自主研发的首个网络文学人工智能翻译系统推出并应用,大大提升了翻译效率和作品“出海”数量。推文科技创始人童晔算了笔账,AI能使翻译效率提高3600倍。具体来说,对于1000字的翻译,人工需要1小时,AI只需要1秒;成本也降低到原来的1%,100万字的专业译者翻译需要20万元,AI只需要不到1000元。

中国音像与数字出版协会副秘书长李弘表示,目前,我们已经可以借助AI将网文翻译为英语、西班牙语、印尼语、葡萄牙语、德语、法语、日语等多种语言,不仅中国网文从中受益,海外原创网文也有了更大的传播空间。

人工智能翻译可以达到“理解上下文”的程度

人工智能翻译准不准呢?童晔给出直观答案:“100分的满分,专业译者可以拿到85分,AI翻译可以拿到75~80分。”

“比方说,翻译口语中的‘梗’,人工智能之前不行,现在可以了。”童晔说,人工智能先把“梗”变成平铺直叙的语言,再从目标语言中寻找一种相应的“梗”,这更符合“信达雅”的翻译要求。

精确度如何实现的呢?一些网文平台发布的资料显示,正如人类翻译受自身知识面的限制一样,AI模型达到的能力范围也受到语料范围的限制,所以要尽可能丰富地给AI“喂料”。平台基于自然语言理解技术,对网文内容进行深入挖掘。通过对大量网文内容和优质社区内容的标注和识别,使机器更好地理解网文内容。比如,AI可以自动识别角色、场景、题材、故事脉络等信息,构建网文的整体知识图谱。目前,AI翻译能够较好地翻译网文特殊领域中的词、句、段落,包括人名、地名以及类似“金丹”“解药”这种特有元素词,还能识别出各种代词指代的对象,尽可能避免传统机译中“一词多译”“张冠李戴”等现象。

彩云科技CEO袁行远解释说,人工智能在翻译时,会从原文中提取出人物并判断其性别。它在判断什么词是人名时,会依据一些语法规则,例如“××说”,“说”字前的名词一般是一个人。利用类似的方式,人工智能就能获得一张专有词表,使得翻译工作得以顺利推进。另一方面,过去常见的“逐句翻译”常常忽略语境,导致翻译结果僵硬、不知所云,而目前的机器翻译已经发展到“理解上下文”的程度。

不过,这只是技术上的进步,精准翻译具备了可能性,还无法进行规模化应用。业内人士指出,比较浅白的表述,AI可以“猜”出正确的翻译,但遇到比较迂回的表述,比如语料中从未出现过的成语,AI猜错的可能性就会变大。例如,“燃灯如豆”可能被直译成“火焰像豆子”,机器无法理解深层的内涵。同时,它也不能理解故事的复杂逻辑,无法判断前面一个伏笔会成为故事后面至关重要的因素,这都是尚需进一步探索的课题。

人工智能翻译还离不开人的“精加工”

是否使用人工智能翻译,不同的作家学者也有不同的理解。

人工智能追求效率提升的同时,难免会丢失文本质量、消损原著色泽。首都师范大学教授许苗苗观察到,对于热爱写情节、开脑洞,不太在意风格的作者,特别是那些热爱IP转化,从文字作者变成编剧的作者来说,机器翻译不成问题,而对于钟爱自己语言风格的作者来说是致命的,“这样的翻译缺乏独特性,翻译出来的文本只是内容而非风格”。

地域特色翻译、本土语境表达仍是很多作家关注的问题。陈定家指出,在翻译的过程中,基于海量信息的大型语言处理机器,难以处理一些复杂的语言现象,如文化差异、本土语境等,只能严格遵守语法规则与句式结构,无法准确传达作者的审美趣味与情感追求,导致扁平化的翻译结果。

阅文集团副总裁、总编辑杨晨也把术语翻译的准确性作为AI翻译的首要挑战,“像人物称谓、门派、功法、修炼等中国网文、中国文化中特有的语言术语和表达方式,单纯依靠AI翻译无法准确表达其内涵”。

目前,人工智能翻译还离不开人的“精加工”。中南大学教授欧阳友权认为,“人—机”协作才能保证质量。因为受目前技术水平所限,人工智能翻译的缺点是明显的,但“机译”的发展方向是对的,当弱人工智能升级为强人工智能时,也许这个问题就解决了。

艾瑞咨询发布的《2021年中国网络文学出海研究报告》指出,现阶段,通过出海服务商为内容平台提供优质的AI翻译,加上后期的专业译者校对润色,优势互补,正在帮助网络文学快速规模化出海,特别是在2020年多语种市场布局加速的背景下,人工智能翻译的应用能够帮助企业快速实现语言的迁移。

杨晨表示,阅文集团组织了超过3万人次的读者测试及反馈,对AI翻译的细节进行不断地微调,使翻译更贴近海外读者的阅读习惯。网文平台需要重建网文翻译的流程和体系,搭配人工校正来综合优化AI翻译内容。

(责编:杨曦、李楠桦)