将先前的知识融入到话者分离和链接中以识别共同的发言者

将先前的知识融入到话者分离和链接中以识别共同的发言者
林潤生博士
2022年10月5日
研究

发言人日记和连接发现 "谁在什么时候说话 "的跨录音,而不需要任何发言人登记。对每个录音单独进行日记化,而连接则是将不同录音中同一说话人的群组结合起来。这是一个两步法,但是它存在着错误从日记化步骤传播到链接步骤的问题。在一个给定的录音中出现了一个独特的说话者的情况下,本文旨在利用他或她存在的预先知识来定位共同的说话者。这意味着没有这个共同发言人的注册数据。我们提出了成对共同说话人识别(PCSI)方法,与两步法相比,该方法将共同说话人的存在考虑在内。我们进一步表明,PCSI可以用来减少两步法的日记步骤中引入的错误。我们的实验是在一个由AMI语料库合成的语料库和一个与普通话混合的内部电话交谈语料库上进行的。我们显示,与最先进的X-矢量日记和链接系统相比,时间加权等值错误率有7.68%的相对改善。

将先前的知识融入到话者分离和链接中以识别共同的发言者

工程学士。(2005), Ph.D. (2010), HKU.IEEE的高级会员。Croucher研究员。香港大学电子工程系兼职助理教授。加州大学伯克利分校博士后。香港浸会大学和香港大学研究助理教授。