腾讯推出 DRT-o1 系列 AI 模型:长链思考推理实现文学翻译“信达雅”
GoodNav于12月26日报道,腾讯研究院新推出的DRT-o1系列模型,采用了长思维链(long chain-of-thought,简称CoT)方法,使其在理解比喻和隐喻等方面表现更佳,从而提升了文学作品的翻译质量。
项目背景
需说明的是,虽然神经机器翻译(NMT)在日常文本翻译中已取得显著成果,但在文学作品翻译,尤其是涉及隐喻和明喻等修辞手法时,依然面临巨大挑战。
这些表达常常蕴含深厚的文化和语境内涵,简单的直译往往无法准确传达其深意,而腾讯开发的DRT-o1系统为解决这一难题提供了新思路。
项目介绍
研究团队从古腾堡计划(Project Gutenberg)中选取了400本公共领域的英文书籍,提取了577600个句子,并筛选出63000个包含明喻和隐喻的句子,用于训练模型以进行“深度思考”。
DRT-o1采用了一种创新的多智能体框架,包含翻译员、顾问和评估员三个角色。翻译员负责初步翻译,顾问提供修改建议,而评估员根据预设指标对翻译质量进行评分,通过反复迭代提升翻译效果。
工作流程包括三个主要步骤:
-
关键词翻译:翻译者首先识别句子中的关键词,并提供其翻译。
-
初步翻译:接着,翻译者根据源句子和关键词的双语对应关系提供初步翻译。
-
翻译精炼循环:在精炼循环中,顾问评估前一步的翻译并提供反馈,评估员根据预定义的评分标准给出总体评分。翻译者依据反馈和评分进行新的翻译。当评分达到预设阈值或迭代次数达到最大值时,循环结束。
最终的翻译结果由GPT-4o进行润色,确保其流畅性和可读性,最终数据集中包含22264个经过深度思考的机器翻译样本。
开发者举了一个例子,原文为:
The mother, with her feet propped up on a stool, seemed to be trying to get to the bottom of that answer, whose feminine profundity had struck her all of a heap.
该句中的“struck her all of a heap”是一个成语,意指某事对她产生了强烈影响。经过长链思考的DRT-o1模型,最终将其翻译为:
母亲将双脚搭在凳子上,似乎在努力探究那个答案,那答案中女性特有的深刻性令她猛然心生震撼。
该翻译不仅准确传达了原意,还保留了情感色彩。相比之下,谷歌翻译则为:
母亲双脚撑在凳子上,似乎想弄清楚这个答案的真相,其女性的深刻性让她大吃一惊。
而Deepl的翻译为:
母亲把脚支在凳子上,似乎想弄清这个答案的来龙去脉,而这个答案的女性化深刻性让她茅塞顿开。
性能
DRT-o1系列分为DRT-o1-7B和DRT-o1-14B两个版本。
实验结果显示,与Qwen2.5-7B-Instruct相比,DRT-o1-7B的BLEU分数提升了8.26分,CometScore提高了3.36分;而DRT-o1-14B相较于Qwen2.5-14B-Instruct的BLEU提高了7.33,CometScore提升了1.66。
DRT-o1-7B的性能甚至超过了更大的模型QwQ-32B,其BLEU分数高出7.82分,CometScore高出1.46分,展示了其在处理复杂语言结构方面的卓越能力。