ChatGPT的翻译表现以及提示词技巧
ChatGPT发布以来,以其惊人的语言能力让各行各业的人都为止震颤,在翻译界也毫无疑问掀起了一波热潮。很多人都想了解它在翻译领域的表现。作为ChatGPT的深度用户,我也经常会用它来翻译一些内容,并且用它和其他翻译工具比如DeepL结合使用。本文是我的一些使用心得,探讨了它的翻译表现,和其他工具做了比较,并且在文章的最后用一些提示词技巧一步步优化《再别康桥》这首诗的英文版的翻译效果,希望读者能从中获得一些借鉴。
ChatGPT翻译的精度怎么样
ChatGPT翻译的精度取决于以下几点
- 所用的模型
- 翻译的语言
- 所用的提示词
- 翻译的领域
- 书面语还是口语
- 随机性
我们都知道,GPT的意思是生成式预训练Transfomer模型(Generative Pre-Trained Transformer)。它的能力很大程度上取决于用来训练的数据的数量和质量。GPT4训练的数据更为庞大,也纳入了更多人类的反馈来提升准确度,因而在翻译能力上有了很大提升。
和ChatGPT3.5不同的是,ChatGPT4在翻译一些小语种的过程中会采用两个步骤—首先会把文本翻译成英语,然后再翻译成目标语言。一些使用人数比较少的小语种,相应的训练数据也比较缺乏,因此翻译的精度也比较低。转化为英语之后,拥有了更庞大的数据支持,翻译的质量也相应得到提升。
下面的表格摘自一篇学术论文,从第一列到第五列依次是语言名称,编码,用该语言作为母语和第二语言的人数,语料库中的数据比例,语料库中的数据比例,以及分类(高资源H,中等资源M,低资源L,以及极低资源X)。
通常来说,对于那些训练语料非常丰富的语言,比如英语,西班牙语,德语,法语等,翻译的精度比较高,而对于那些没有足够语料的语言,比如印尼语,罗马尼亚语来说,精度就会差很多。
此外,和那些专门的翻译工具,如谷歌翻译,DeepL等相比,ChatGPT可以通过提示词来提升翻译的精度。Prompt Engineering已经成为使用ChatGPT等AI工具所必须的技能。清晰而准确的提示词有助于ChatGPT理解你的请求。在提示词中提供一些背景信息也可以引导ChatGPT去调用更相关的数据。在提示词中也可以指定自己想要的风格,比如更加口语化一些或者更加学术话一点。在后面的小结中,我会专门介绍一些能够提升翻译质量的提示词技术。
在不同的领域中,ChatGPT翻译的精度表现也会有所不同。对于那些比较热门的领域,比如新闻和电子商务来说,翻译的精度比较高。而对于那些比较专业冷门的领域,比如法律文件,医学报告等领域,精度会差一点。
ChatGPT在口语方面的翻译能力也更强一些,它能够理解包括俚语,习语等非正式语言,善于理解对话的背景,在这方面生成的翻译内容听上去也更加自然。
比较有趣的一点是,ChatGPT还有一些随机性,如果你觉得翻译的不够好,可以多试几次,也许就会得到比较满意的答案。
ChatGPT会取代人类翻译吗
虽然ChatGPT在机器翻译方面表现出卓越的能力,但是脱离了人工参与的话,在很多情况下翻译出来的文本效果不是很理想,尤其是处理一些冷门的小语种。
人类的语言是很复杂的,包含很多复杂而微妙的东西。一个优秀的译员不仅要拥有高超的语言技巧,还要深入了解不同国家的文化差异。比如对某个国家来说很礼貌的表达如果用机器翻译出来成另一种语言的话,可能听上去很粗鲁。
对于那些在非常专业的领域从事翻译的人来说,还要精通该领域的专业知识。很多专业领域的文献不一定会出现在互联网上,或者获取文献的成本很高,因此也就无法成为ChatGPT训练的语料。ChatGPT在这种情况下的翻译质量是很不理想的。
对比ChatGPT和其他翻译工具
ChatGPT和其他翻译工具如DeepL,谷歌翻译都是基于人工智能技术。
ChatGPT是一个大语言模型,它不是专门为翻译而设计的,尽管它在很多方面的翻译能力和其他两个翻译工具各有千秋。ChatGPT训练的数据更为庞大,因而除了翻译以外,它还可以做很多其他工作,比如写论文,写邮件,写代码等等。目前支持90多中语言。
DeepL是一个基于深度学习的机器翻译服务。它的神经网络使用互联网上的多语言文本进行训练,比如书籍和网站,来理解和学习句子的构造和单词在不同语境中的含义。截至2023年,它支持26种语言的翻译。
谷歌翻译是谷歌开发的一个多语言神经机器翻译服务。它支持133种不同的语言,使用多用技术组合来翻译,还提供网站翻译,语音翻译,图像翻译等服务。
简而言之,ChatGPT更多的是生成类似人类的文本,可以执行各种任务,DeepL重点是利用深度学习提供高质量的翻译,而谷歌翻译是一个全面的翻译工具,支持大量的语言,提供各种翻译功能。
ChatGPT和其他两个翻译工具相比,对口语的翻译能力更强一些,这得益于它更庞大的口语场景的训练数据。如果是同声传译的话,用ChatGPT的iOS APP会更加方便,它集成了快捷指令和Siri,用户只需要通过Siri唤醒ChatGPT,然后就可以跟它愉快地对话了。ChatGPT iOS版本在语言识别的精度上几乎达到了人类的水平,可以识别超过90种语言,甚至还支持某些国家的方言。
对于那些训练数据比较庞大的语言,比如英语、德语等,ChatGPT的翻译能力丝毫不弱于其他两个翻译工具,尤其是对于ChatGPT4而言。但是对于一些非常冷门的小语种,DeepL或者谷歌翻译可能表现会更好。
此外,ChatGPT的使用更复杂一些,要优化翻译的效果,需要掌握提示词的技巧。由于它不是专门的翻译工具,因此不像DeepL那样可以把两种语言并排对比,方便检查每一句的翻译效果。
而那些专门的翻译工具使用起来更加方便快捷,只要把要翻译的内容进行粘贴立刻就获得想要的翻译文本。
要获得最佳的翻译效果,可以把ChatGPT和其他翻译工具结合起来。先用专门的翻译工具进行翻译,如果翻译的效果不理想,可以用ChatGPT进行优化。比如很多时候专门的翻译工具翻译出来的文本不地道,显得比较生硬,这时候可以让ChatGPT把翻译的文本进行修饰,达到更自然的效果,在文章的后面我会专门进行介绍。
如何把ChatGPT融入翻译流程
- 首先要明确一点的是,无论ChatGPT的翻译能力能否超过DeepL或者谷歌翻译这样的工具,它都可以在后续的环节中优化翻译文本的质量,通过提示词让最终的文本更自然,后者生成自己想要的风格。
- 因此,我们首先要确定在翻译的第一个环节是用ChatGPT还是专门的翻译工具。为此可以做一个测试,把自己经常翻译的同类内容分别用ChatGPT和其他翻译工具进行测试,哪一个效果好就先用哪个。
- 用ChatGPT进行翻译要注意如果是两种非英语进行转换的话,最好先翻译成英文,再翻译成其他语言,这样的效果会更好些。
- 如果不是翻译主流语言的话,第一步得到的翻译文本的质量通常不理想。这时候可以给ChatGPT不同的提示词,使文本更加自然,或者文本的风格更加符合自己的需求。
如何写出最佳的翻译提示词
下面我将用ChatGPT来翻译英文版的《再别康桥》,看看通过提示词技术能否达到信、达、雅的效果。
指定翻译角色
在给ChatGPT提问的过程中,我们通过给ChatGPT指定一个角色,通常能达到更好的效果。比如这样来写提示词:
I want you to act as an English to Chinese translator.
你是一个同时精通汉语和英语的译者/诗人/作家/学者/医生/律师。
As a translator, you are proficient in Chinese and English.
现在你是一个精通汉语和英语的译者/诗人/作家/学者/医生/律师。
下图左边使用最基本的提示词,右边指定了角色为诗人:
指定了角色以后是否更有诗的感觉了呢?
给一些背景提示
很多时候我们给ChatGPT一些背景提示的话,ChatGPT会调用它完成任务所需要的背景知识,大大提高输出的质量。比如我让它翻译这首英文诗的时候跟它将这首是是《再别康桥》的英文版,它虽不会直接生成徐志摩中文原版的诗,但是它生成的诗跟原版已有些神似,比如在很多地方把“剑桥”都翻译成“康桥”。
指定翻译的领域
给ChatGPT指定要翻译的领域也会让它的精准度提高。比如我告诉它这是一首英文诗,它生成的中文诗也会多很多中文诗的味道。你还可指定其他要翻译的领域,比如法律文书,商业计划书,新闻,医学报告等等。
给一些实例
如果给ChatGPT一些实例的话,它会更懂你的要求,比如我告诉ChatGPT去参考徐志摩的诗歌风格,它生成的内容会更加有徐志摩的味道。
指定一位优秀的译者
给ChatGPT指定一位知名的翻译家也可以提升翻译的质量。比如给ChatGPT指定它的角色是中国翻译界泰斗许渊冲。
指定文本的风格
除此之外,还可以给ChatGPT指定想要的风格。或者在翻译过后进行风格的优化。比如让它把复杂的概念简单化:
Use simple language that a person would use in everyday to convey complex ideas so that they are clear and easy to understand.
让它用短句:
Bias toward short sentences.
用比喻和类比使文本更有吸引力:
Use metaphors, analogies and other literary devices to make points relatable and memorable
总之,各种风格都可以随意指定,直到你满意为止。
最后,让我们把所有提示词技巧都用起来,看看最终这首诗翻译的效果:
你是中国著名的新月派现代诗人徐志摩。请翻译下面这首英文诗,要求语言清新秀丽,情感细腻真挚,节奏柔婉轻盈,节节押韵,逐节换韵,每行两顿或三顿。这首诗的写作背景是诗人在剑桥大学文学研究院攻读研究生时,十分钟爱康桥这个地方。那里的西下夕阳、斜倚的垂柳和云霞给诗人留下不可磨灭的印象。诗人在英国留学期间,常常徜徉在康桥这片美丽、宁静的土地上。清晨在河边读书,黄昏里在河里划船,或躺在芳香的草地上看云、寻梦。正是康桥的这种独特美吸引了诗人,慰藉一个远离故乡之孤独心灵。