X

译见||李长栓:机器翻译取代人工可能永远无法实现,为什么?

人工智能的发展非常迅速,翻译的准确性越来越高,以至于有人担心译员是否会失业,甚至有的家长担心孩子学习外语专业,将来找不到工作。本人的判断是:机器翻译可以极大方便人们获得国外的信息,提高专业译员的工作效率,但要想进行深度思想交流,还是必须依赖人工翻译,最好是直接学习外语。

作者认为,要想通过机器翻译,实现自然语言的处理,恐怕还有很长的路要走,也许永远不会实现。(互联网)

人工翻译的成本很高,速度很慢。以国际机构为例,专业译员每天的工作量大概是5个标准页(共1650个英文单词),按照中等级别译员的待遇折算,每个英文单词至少0.15美元。所以,普通的用户用不起专业翻译,也没有那么多专业译员可以满足海量的翻译需求。而成本低,速度快,正是机器翻译的优势,即使翻译不够准确,也能够在一定程度上满足用户需求况且,普通人最多只能熟练使用两三门语言,而机器翻译则不受语言的限制。所以,机器翻译的发展可以让普通大众轻易获取大量国外信息。

对于专业译员来说,可以利用机器翻译来做初稿,然后编辑加工。如果机器翻译准确率平均达到50%,就可以提高50%的效率。不准确部分虽然没有逻辑,但一些用词有可能是正确的,可以通过人工修改加以完善;起码可以省却一些打字时间。此外,机器翻译软件还有助于不同译者统一用词,对于需要分工合作的任务来说,可以节省统稿时间。

机器翻译难以克服的问题

机器翻译尽管发展迅猛,但不同语言之间的翻译,准确性有很大不同。对于结构比较相似、单词意思可以完整对应的语言,或者有一定转换规律的语言,比如欧洲语言之间,机器翻译已经达到相当高的水平,专业译员进行少量编辑,就可以做正式翻译文本使用。但对于概念对应不整齐、结构差异较大的语言,比如汉语和英语,机器翻译需要改进的空间还很大。

举个简单例子。mission一词,基本意思是“交给一个人或一群人的一项重要任务,通常需要旅行到国外完成”(牛津英语词典)。在这个意思基础上,引申出“使命”“任务”“特派任务”“出差”“使团”“代表团”“特派团”“传教团”“访问团”等具体意思。如果把mission翻译为法语,译者(包括机器翻译)不需要任何思考,因为法语中也有这个词,拼写相同,只是读法不同,每个义项也相同。

也就是说,在具体语境下,mission表示什么意思,译者并不需要关心,让译文读者去判断即可。但如果要翻译为汉语,译者就必须根据上下文判断翻译为“使命”还是“使团”等。这个判断并非一目了然。如果交给机器翻译,机器通常会根据统计得出的概率,选择最常见的那个意思,而这往往会出错。

英语的句子结构可能十分复杂,从句套从句,一句话好几行。一些介绍机器翻译的文献中称,政府文件、法律文献等比较正规的语言,机器翻译相对准确性较高。这可能是针对欧洲语言来说的。因为欧洲语言之间的结构比较相似,翻译不需要太多结构调整。但汉语结构简单,缺乏类似英语的从句结构,把英语翻译为汉语,需要译者反复思考,化整为零,把复杂结构变为简单结构,才能有效传达原文的意思。机器缺乏逻辑分析能力,很难把复杂的结构,转化为有意义的简单结构。

比如,这是机器翻译出来的一句话,看大家能否读懂:“政府有六项强制性质疑,当被告被控犯有可判处一年以上监禁的罪行时,被告或被告共同提出10项强制性质疑。”这句话来自美国的《刑事诉讼规则》,讲的是如何挑选陪审团成员,准确的意思是:“当被告人被控犯有可判处一年以上监禁的罪行时,公诉人可以不说明理由排除六名(候选陪审员),被告人(包括多名)总共可以不说明理由排除10名(候选陪审员)”。这还是英语中相对简单的复杂句。遇到真正的复杂句,机器更是弄不清各部分之间的关系。

顺便指出,机器翻译中的“被告或被告”,来自英文defendant or defendants。因为汉语无单复数之分,所以机器都翻译为“被告”。人工译员意识到此处的单复数有区别意思的作用,所以,变通处理为“被告人(包括多名)”。至于机器翻译用“被告”,人工翻译改为“被告人”,那是因为在中国的法律中,“被告人”用于刑事案件,相对于“公诉人”;“被告”用于民事案件,相对于“原告”。这些微小差别,更是不能指望机器分辨出来。

汉译英时,中文的句式虽然简单,但语言表达习惯独具特色,特别是政府文件,即使中文读者,也很难吃透文字之外的含义。比如:“学生的第一任务就是读书学习。高校必须围绕学生刻苦读书来办教育,要引导学生读“国情”书、“基层”书、“群众”书,读优秀传统文化经典、马列经典、中外传世经典和专业经典。”其中的“‘基层’”书、‘群众’书”,如果由人来翻译,会先调查一下两个说法背后的含义,然后换一种说法把意思表达出来。机器翻译则只会翻译文字,比如,某翻译软件就将“‘基层’”书、‘群众’书”翻译为“‘basic’books, ‘mass’books”,恐怕英文读者更难以看懂。

另外,人工翻译会注意到“读书学习”是一个概念,可以笼统翻译为study。但机器看到“读书”,就会翻译为study,看到“学习”,也会翻译为study。“读书学习”就会翻译为“study study”。在人看来,这是十分可笑的。

原文有瑕疵

译员每天翻译的文件,有很多是匆忙中炮制出来的,没有经过专门编辑,会出现不严谨的表达。人类译者遇到质量低劣的文件,会通过调查研究或询问作者,弄清原文的意思,然后在译文中予以改善。但机器翻译只会忠实地翻译。比如:“检察机关的监督只限于对劳动教养场所刮泥和教育改造工作的监督,而对至关重要的审查批准没有监督权。”其中的“刮泥”译者难以理解。劳动教养场所为什么要“刮泥”?哪里来的“泥”?有那么多泥可以刮吗?这样的工作不符合常识。

通过上网调查劳动教养场所的日常工作,确实没有“刮泥”这项任务。经过反复思考,突然醒悟:原来应该是“管理”。因为作者使用拼音输入法,guanli漏掉一个l,自然就成了“刮泥”。但机器翻译则会煞有介事地翻译为“mud-scraping”(“刮泥”)。

有的人喜欢用成语,但不一定恰当。译者要根据上下文,判断作者到底在说什么,不一定严格按照作者的说法来翻译。比如,前两年中国政府曾经出台一份文件,要求打掉大院的围墙,疏通毛细血管,改善城市交通。记者采访新加坡城市规划之父刘太格,提了这样的问题:“《意见》出台后,大家热议的焦点在是否该拆掉大院和封闭小区的院墙。而中国小区的发展史,也是从开放式小区,由基层组织如派出所引导建立封闭式小区,而现在又因为交通拥堵,希望开放小区释放道路的“毛细血管”,政策的“朝令夕改 ”,以及这条疏缓交通的新办法,你认为合理吗?”

其中的“朝令夕改”,是指政策变化很快。但从前面的铺垫来看,几十年间政策实际才变了一次,算不上“朝令夕改”。编辑恐怕也意识到了这一点,所以加了引号。如果要把“朝令夕改”翻译为英文,就不能按照成语的本义来翻译,而是变通地译为“变化”。如果是机器,恐怕就不会想这么多。实际上,本人试了一下某网络翻译引擎,它甚至不能理解这个成语,因为它把“朝令夕改”翻译为“changing the future”(改变未来)。

以上的例子说明,机器翻译还有很多盲点。这些盲点恐怕不是一时半会儿可以克服的。对于广大用户来说,如果要想利用机器翻译进行交流,必须使用结构最简单、语法最完整、用词最基础、对任何人都明白无误的语言。要想通过机器翻译,实现自然语言的处理,恐怕还有很长的路要走;也许永远没有实现的一天。

作者:北京外国语大学高级翻译学院李长栓教授

来源:联合早报