2. 介绍

2.1. 概述

VQE(Voice Quality Enhancemen:语音音质增强模块)模块内包含
AGC(Auto Gain Control:自动增益控制),
ANR(Audio Noise Reduction:语音降躁),
AEC(Acoustic Echo Cancelling:听觉回声消除)
三大子功能, 主要用于收音时为满足客户端在不同产品形式及不同使用状况下, 能给予单纯麦克风收音外较佳的声音质量。
VQE使用音频基础主要为语音,因此取样率主要支持8kHz, 16Khz人声语音频信号。
本文主要讲解AEC调试部分。

[听觉回声消除的作用]:

_images/Introd002.png

从上面的图可以知道如果没有经过红色的VQE模块处理直接把Audio Input数据通过网络发给小王,那么深圳的小王将会听到“123456789”和“abcdefg”两种声音。

其中“123456789”是小王自己说的,这样小王的体验会很糟糕。

红色VQE的功能之一AEC就是用来把“123456789”这个声音过滤掉。

经过VQE的过滤后小王就只能听到小明说的“abcdefg”。

Audio Input的声音内容就是ain_record.pcm文件的内容。

[算法基础要求]:

录音要求

  • 采样率只支持8kHz或者16kHz,播放和录音参数要一样。

  • AGC/ANR 仅支持单声道, 不支持立体声 。

  • AEC需使用双声道录音( 左声道为mic录取的近端声, 右声道为远端发来的声音)。

  • 采样位深16位(enBitwidth = AUDIO_BIT_WIDTH_16)。

  • 录取到的 左右声道不能失真 (如:波形太大消顶,mic和speak质量不佳,pcb模拟电路被干扰等导致的失真)。

  • 左声道mic录取到的近端人的声音幅度要比录取到喇叭的声音大(远端声音),否则会影响算法处理效果。

  • 右声道参考信号幅度 要比左声道mic录取的声音中的远端声音大,否则会影响算法处理效果。

正常的波形图(mic通道和参考信号通道波形都适中,没有失真,没有底噪干扰等):

_images/image2.png

如下面的波形图是不行的

_images/image3.png
调整方法:
  1. 把ADCR通道的gain减小。QFN封装的建议设置成1,BGA的封装自行减小。

  2. 如果第一步进行了还是出现消顶失真,则把Audio Output的gain减小。

注:参考信号的幅度受对方发来的原始数据幅度,Audio Output的gain,ADC R的gain共同影响。

硬件要求

  • 板端硬件有mic 组件。

  • 板端硬件有speaker可供播放出声。

  • 板子有AEC回路: speaker声音硬件回采到录音的右声道(ADC_R),没有受到干扰。

详细见:《CViTEK 音频硬件、结构设计以及器件选用说明.docx》

整机结构要求

  • MIC要有单独的音腔设计并密封,MIC要有外带防震橡胶套,防震效果要好。

  • MIC拾音朝向最好与喇叭方向相反。

  • 喇叭要有单独的音腔设计,要有橡胶减振,防震效果要好。

  • MIC 和喇叭的距离越远越好,两者的成的角度要保证声音耦合小。

详细见:《CViTEK 音频硬件、结构设计以及器件选用说明.docx》

[理想调试环境需求]

  1. 要使用客户完整的样机, 样机尽可能结构密封。

  2. 所使用的 mic & spk 必须在客户完整样机内。

  3. 调适适当的ADC/DAC gain level, 确保mic in(收音)及ref in(播音回路)的稳定性。

  4. 先确认没有 pop noise 或 circuit noise 或讯号不连续的干扰之后, 再开始抓正确的speech pattern。