ZHCABF0A December 2021 – April 2022 PCM6120-Q1 , TLV320ADC5120 , TLV320ADC6120
本节介绍 VAD 结果。算法性能由 ROC 曲线显示,该曲线说明了不同工作阈值(–12dB 至 –3dB)下的检测性能。以下 ROC 图显示的是来自 Aurora 噪声数据库的噪声场景(图 3-1 表示汽车噪声,图 3-2 表示餐厅噪声,图 3-3 表示地铁噪声)和来自 NOIZEUS 语音数据库的语音信号。测试向量是通过以所需的 12、18 和 24dB SNR(SNR 是语音功率级别和噪声信号功率级别之间的差值)混合噪声和语音信号来生成的(例如,12dB SNR 意味着噪声功率级别比语音功率级别低 12dB)。工作点对于 12dB 阈值而言位于最左上角,并随着阈值的增加而向右移动,对于语音命中率和非语音命中率,图 3-4(–7dB 阈值)指示更高的性能。
在分析收集到的数据之后,选择了–7dB 阈值,以在不同噪声类型下提供最佳语音命中率和非语音命中率。针对不同噪声类型,在–7dB 阈值下的 ROC 曲线如图所示。