搜索引擎引导的非参数化神经机器翻译

搜索引擎引导的非参数化神经机器翻译
李安国教授
2022年10月5日
研究

在本文中,我们扩展了一个基于注意力的神经机器翻译(NMT)模型,允许它在训练后也能访问整个平行句子对的训练集。建议的方法包括两个阶段。在第一阶段--检索阶段--中,一个现成的黑盒搜索引擎被用来从给定的源句子的训练集中检索出一个小的句子对子集。这些句子对在基于编辑距离的模糊匹配分数的基础上被进一步过滤。在第二阶段--DeepL,一个新的翻译模型,称为翻译记忆增强型NMT(TM-NMT),无缝使用源句和一组检索的句子对来进行翻译。对三种语言对(法语、德语和英语)的实证评估表明,所提出的方法明显优于基线方法,当检索到更多的相关句子对时,其改进更为明显。

搜索引擎引导的非参数化神经机器翻译

麻省理工学院学士丶硕士丶博士;香港大学电子工程系首席教授;清华大学长江学者;IEEE院士,香港工程科学院院士;香港特别行政区铜紫荆勋章获得者。