3.1.前端信号处理
顾名思义是指在语音交互之前对采集到的单路或多路音频信号进行处理,用以提取到用户输入、交互部分的音频信号,降低噪声干扰,提升信噪比,降低后端语音识别或者语音唤醒的难度。常见的前端信号处理技术包含:VAD(语音活动检测)、NR(降噪)、AEC(声学回声消除)、DOA(声源定位)、BF(波束成形) 等。
在SDK方案内,提供多种信号处理方案包含:echo(回升消除)、vad(人声检测)、fespCar(车载双麦)、dmasp(车载四麦) 等方案。具体使用方案可以参考相关文档。
注意事项
DUILite SDK 内所有引擎处理的音频标准皆需要按照 :16k(采样率)、16bit(位宽) 的原始音频,不要经过任何压缩转换。