零资源神经机器翻译的教师-学生框架

零资源神经机器翻译的教师-学生框架
李安国教授
2022年10月5日
研究

虽然端到端神经机器翻译(NMT)最近取得了显著的进展,但它仍然受到低资源语言对和领域的数据稀缺问题的困扰。在本文中,我们通过假设平行句子产生第三语言句子的概率接近,提出了一种零资源NMT的方法。基于这一假设,我们的方法能够在没有平行语料的情况下训练一个源到目标的NMT模型("学生"),由现有的源-支点平行语料上的支点到目标NMT模型("教师")指导。实验结果表明,所提出的方法比基于枢轴的基线模型在不同的语言对中明显提高了3.0个BLEU点。

零资源神经机器翻译的教师-学生框架

麻省理工学院学士丶硕士丶博士;香港大学电子工程系首席教授;清华大学长江学者;IEEE院士,香港工程科学院院士;香港特别行政区铜紫荆勋章获得者。