低资源环境下的端到端语音识别的领域适应性

2022年10月5日

端到端自动语音识别(ASR)简化了传统的ASR系统构建管道，不再需要多个组件，也不再需要专家语言知识来创建发音词典。因此，在为新领域建立系统时，端到端ASR很适合。然而，端到端ASR的一个主要缺点是，与传统方法相比，它需要有大量的标记语音。因此，在本文中，我们探索了在低资源环境下端到端ASR的领域适应方法。我们表明，通过在标签序列的开头插入域的符号、因数化隐层适应和特定域的门控机制，联合域识别和语音识别提高了低资源目标域的性能。此外，我们还展示了所提出的适应方法对一个未见过的领域的鲁棒性，当只有3小时的未转录数据可用时，改进报告的相对值高达8.7%。

林潤生博士

首席科学家和首席技术官

工程学士。(2005), Ph.D. (2010), HKU.IEEE的高级会员。Croucher研究员。香港大学电子工程系兼职助理教授。加州大学伯克利分校博士后。香港浸会大学和香港大学研究助理教授。

低资源环境下的端到端语音识别的领域适应性

林潤生博士

最新文章

宣布获得 ISO27001:2022 信息安全认证

FANOVATION 2023 成功邀请 80 多位高层管理人员参与生成式人工智能讨论