2. 介绍¶

2.1. 概述¶

VQE(Voice Quality Enhancemen:语音音质增强模块)模块内包含
AGC(Auto Gain Control:自动增益控制),
ANR(Audio Noise Reduction:语音降躁),
AEC(Acoustic Echo Cancelling:听觉回声消除)
三大子功能, 主要用于收音时为满足客户端在不同产品形式及不同使用状况下, 能给予单纯麦克风收音外较佳的声音质量。
VQE使用音频基础主要为语音,因此取样率主要支持8kHz, 16Khz人声语音频信号。
本文主要讲解AEC调试部分。

[听觉回声消除的作用]：

从上面的图可以知道如果没有经过红色的VQE模块处理直接把Audio Input数据通过网络发给小王，那么深圳的小王将会听到“123456789”和“abcdefg”两种声音。

其中“123456789”是小王自己说的，这样小王的体验会很糟糕。

红色VQE的功能之一AEC就是用来把“123456789”这个声音过滤掉。

经过VQE的过滤后小王就只能听到小明说的“abcdefg”。

Audio Input的声音内容就是ain_record.pcm文件的内容。

[算法基础要求]：

录音要求

采样率只支持8kHz或者16kHz，播放和录音参数要一样。
AGC/ANR 仅支持单声道, 不支持立体声。
AEC需使用双声道录音( 左声道为mic录取的近端声, 右声道为远端发来的声音)。
采样位深16位(enBitwidth = AUDIO_BIT_WIDTH_16)。
录取到的 左右声道不能失真 （如：波形太大消顶，mic和speak质量不佳，pcb模拟电路被干扰等导致的失真）。
左声道mic录取到的近端人的声音幅度要比录取到喇叭的声音大（远端声音），否则会影响算法处理效果。
右声道参考信号幅度 要比左声道mic录取的声音中的远端声音大，否则会影响算法处理效果。

正常的波形图（mic通道和参考信号通道波形都适中，没有失真，没有底噪干扰等）：

如下面的波形图是不行的

调整方法：

把ADCR通道的gain减小。QFN封装的建议设置成1，BGA的封装自行减小。
如果第一步进行了还是出现消顶失真，则把Audio Output的gain减小。

注：参考信号的幅度受对方发来的原始数据幅度，Audio Output的gain，ADC R的gain共同影响。

硬件要求

板端硬件有mic 组件。
板端硬件有speaker可供播放出声。
板子有AEC回路: speaker声音硬件回采到录音的右声道（ADC_R），没有受到干扰。

详细见：《CViTEK 音频硬件、结构设计以及器件选用说明.docx》

整机结构要求

MIC要有单独的音腔设计并密封，MIC要有外带防震橡胶套，防震效果要好。
MIC拾音朝向最好与喇叭方向相反。
喇叭要有单独的音腔设计，要有橡胶减振，防震效果要好。
MIC 和喇叭的距离越远越好，两者的成的角度要保证声音耦合小。

详细见：《CViTEK 音频硬件、结构设计以及器件选用说明.docx》

[理想调试环境需求]

要使用客户完整的样机, 样机尽可能结构密封。
所使用的 mic & spk 必须在客户完整样机内。
调适适当的ADC/DAC gain level, 确保mic in(收音)及ref in(播音回路)的稳定性。
先确认没有 pop noise 或 circuit noise 或讯号不连续的干扰之后, 再开始抓正确的speech pattern。