网络媒体语音的法庭说话人识别

传播影响力
本库下载频次:
本库浏览频次:
CNKI下载频次:0

归属学者:

张翠玲

归属院系:

刑事侦查学院

作者:

张翠玲 ;刘奔航

摘要:

司法实践中,案件语音数据的来源场景丰富多样,而不同场景的语音数据对法庭说话人识别的影响程度也有所差别。为了量化评估网络媒体场景下语音对法庭说话人识别的影响,验证该场景下法庭说话人自动识别系统的性能,采集了150名男性的网络媒体语音音频,基于深度神经网络模型的法庭说话人自动识别系统和似然比框架方法,进行了系列说话人识别测试和系统性能验证实验。通过对不同采样率、不同规模校准集、不同音频数量及不同音频时长条件下识别结果的分析与比较,测试验证了法庭说话人识别系统在该类场景下的良好识别性能,并量化评估了上述因素对系统识别性能的影响程度,进而为法庭说话人识别的研究与实践提供参考依据。

语种:

中文

出版日期:

2022-10-20

学科:

侦查学

提交日期

2022-12-06

引用参考

张翠玲;刘奔航. 网络媒体语音的法庭说话人识别[J]. 中国刑警学院学报,2022(05):115-121.

全文附件授权许可

知识共享许可协议-署名

  • dc.title
  • 网络媒体语音的法庭说话人识别
  • dc.contributor.author
  • 张翠玲;刘奔航
  • dc.contributor.affiliation
  • 西南政法大学刑事侦查学院;重庆高校刑事科学技术重点实验室
  • dc.publisher
  • 中国刑警学院学报
  • dc.identifier.year
  • 2022
  • dc.identifier.issue
  • 05
  • dc.identifier.page
  • 115-121
  • dc.date.issued
  • 2022-10-20
  • dc.language.iso
  • 中文
  • dc.subject
  • 网络媒体语音;法庭说话人自动识别;似然比;系统验证;
  • dc.description.abstract
  • 司法实践中,案件语音数据的来源场景丰富多样,而不同场景的语音数据对法庭说话人识别的影响程度也有所差别。为了量化评估网络媒体场景下语音对法庭说话人识别的影响,验证该场景下法庭说话人自动识别系统的性能,采集了150名男性的网络媒体语音音频,基于深度神经网络模型的法庭说话人自动识别系统和似然比框架方法,进行了系列说话人识别测试和系统性能验证实验。通过对不同采样率、不同规模校准集、不同音频数量及不同音频时长条件下识别结果的分析与比较,测试验证了法庭说话人识别系统在该类场景下的良好识别性能,并量化评估了上述因素对系统识别性能的影响程度,进而为法庭说话人识别的研究与实践提供参考依据。
  • dc.identifier.CN
  • 21-1310/N
  • dc.identifier.issn
  • 2095-7939
  • dc.identifier.if
  • 0.745
回到顶部