低资源环境下的端到端语音识别的领域适应性

低资源环境下的端到端语音识别的领域适应性
林潤生博士
2022年10月5日
研究

端到端自动语音识别(ASR)简化了传统的ASR系统构建管道,不再需要多个组件,也不再需要专家语言知识来创建发音词典。因此,在为新领域建立系统时,端到端ASR很适合。然而,端到端ASR的一个主要缺点是,与传统方法相比,它需要有大量的标记语音。因此,在本文中,我们探索了在低资源环境下端到端ASR的领域适应方法。我们表明,通过在标签序列的开头插入域的符号、因数化隐层适应和特定域的门控机制,联合域识别和语音识别提高了低资源目标域的性能。此外,我们还展示了所提出的适应方法对一个未见过的领域的鲁棒性,当只有3小时的未转录数据可用时,改进报告的相对值高达8.7%。

低资源环境下的端到端语音识别的领域适应性

工程学士。(2005), Ph.D. (2010), HKU.IEEE的高级会员。Croucher研究员。香港大学电子工程系兼职助理教授。加州大学伯克利分校博士后。香港浸会大学和香港大学研究助理教授。