FANOVATION 2023 成功邀请 80 多位高层管理人员参与生成式人工智能讨论
2023年10月31日
端到端自动语音识别(ASR)简化了传统的ASR系统构建管道,不再需要多个组件,也不再需要专家语言知识来创建发音词典。因此,在为新领域建立系统时,端到端ASR很适合。然而,端到端ASR的一个主要缺点是,与传统方法相比,它需要有大量的标记语音。因此,在本文中,我们探索了在低资源环境下端到端ASR的领域适应方法。我们表明,通过在标签序列的开头插入域的符号、因数化隐层适应和特定域的门控机制,联合域识别和语音识别提高了低资源目标域的性能。此外,我们还展示了所提出的适应方法对一个未见过的领域的鲁棒性,当只有3小时的未转录数据可用时,改进报告的相对值高达8.7%。