一种声纹识别模型的训练装置

传播影响力
本库下载频次:
本库浏览频次:
CNKI下载频次:0

归属学者:

谭铁君 ; 张翠玲

归属院系:

刑事侦查学院

摘要:

本发明一种声纹识别模型的训练装置,提取包含说话人身份信息的语音学特征作为输入特征,利用说话人的性别等标签进行多任务训练,并结合对抗训练方法来解决跨信道问题,最终提取反映说话人身份本质的、稳定的特征。本发明结合了语音学特征以及深度神经网络模拟人类大脑的学习机制,从而提高说话人身份本质特征的提取能力、稳定性和可解释性,最终提升自动声纹识别的准确率和召回率。

语种:

中文

提交日期

2021-03-10

引用参考

张翠玲;谭铁君;李稀敏;杨东升;叶志坚;肖龙源. 一种声纹识别模型的训练装置[P].:CN112259104A,2021-01-22.

全文附件授权许可

知识共享许可协议-署名

  • dc.description.category
  • 发明专利
  • dc.title
  • 一种声纹识别模型的训练装置
  • dc.contributor.author
  • 张翠玲;谭铁君;李稀敏;杨东升;叶志坚;肖龙源
  • dc.contributor.applicant
  • 西南政法大学;厦门快商通科技股份有限公司
  • dc.contributor.affiliation
  • 西南政法大学;厦门快商通科技股份有限公司
  • dc.identifier.applynum
  • CN202011076074.5
  • dc.identifier.opennum
  • CN112259104A
  • dc.date.applyed
  • 2020-10-10
  • dc.date.issued
  • 2021-01-22
  • dc.language.iso
  • 中文
  • dc.identifier.section
  • 语言分析或合成;语言识别;语言分析或合成;语言识别;语言分析或合成;语言识别;语言分析或合成;语言识别;语言分析或合成;语言识别;语言分析或合成;语言识别;语言分析或合成;语言识别;基于特定计算模型的计算机系统;基于特定计算模型的计算机系统
  • dc.subject
  • 声纹识别;说话人;分类器;连接层;语音段;神经网络模拟;embedding;损失函数;可解释性;提取能力
  • dc.description.abstract
  • 本发明一种声纹识别模型的训练装置,提取包含说话人身份信息的语音学特征作为输入特征,利用说话人的性别等标签进行多任务训练,并结合对抗训练方法来解决跨信道问题,最终提取反映说话人身份本质的、稳定的特征。本发明结合了语音学特征以及深度神经网络模拟人类大脑的学习机制,从而提高说话人身份本质特征的提取能力、稳定性和可解释性,最终提升自动声纹识别的准确率和召回率。
回到顶部