声学回声消除(AEC)参考的正确路由和处理对于防止会议室产生回声至关重要。这也是会议室设计中最具挑战性的方面之一。
会议室路由器 (CRR) 在很大程度上确保了 AEC 参考的正确性。但是,人们经常会问 CRR 外部的处理过程会如何影响 AEC 参考,而且有些设计可能会在不使用 CRR 的情况下使用 AEC。
以下是在良好的会议室设计中使用 AEC 标准的一些原则,以及有关常见应用的一些建议。
基准必须包含正确的信号
一般来说,AEC 参考系统应接收通过扬声器播放的所有远端和节目音频的混音。此外,房间内的所有扬声器都应播放相同的混音。
参考文献中缺失的信号
如果信号不在 AEC 参考点中,AEC 不会将其消除。如果远端输入和 AEC 参考之间的矩阵交叉点被误置为静音,则会从远端听到回声,但在本地房间内则听不到问题。这是 CRR 可以避免的一个常见误区。
如果基准中缺少节目音频,远端可能会听到混浊或混响版本的节目音频(包括发送到远端的节目音频直接混音,以及话筒在本地拾取的音频)。这种情况没有远端回音严重,但仍不理想。在大多数情况下,最好在 AEC 参考中包含节目音频。但位置音频的情况例外,具体如下。
参考文献中的额外信号
如果信号被发送到 AEC 参考点,但没有从扬声器中播放出来,那么只要信号处于激活状态,AEC 就会发散。AEC 将汇聚到没有回声的信号路径,当远端信号(属于 AEC 参考信号)激活时,必须重新汇聚。
语音提升
一些设计人员将麦克风信号放入自己的 AEC 基准中,试图改善扬声系统中的前馈增益。这样做的好处值得怀疑,但在某些房间中可能效果不错。在其他情况下,AEC 的反馈降低行为可能会不一致,或者在重复通话时,远端可能会听到残留的回声。
在大多数情况下,最好使用预 AEC 麦克风信号进行语音提升,而将麦克风排除在 AEC 参考之外。这样可以为本地增强提供最低的延迟,并且不会对 AEC 造成任何问题。
立体声
单声道 AEC 参考系统中的立体声信号理论上是个问题。如果立体声信号有很大的分离度,左右扬声器播放的信号就会有明显的不同。左右扬声器和麦克风之间的回声路径具有不同的脉冲响应,单声道 AEC 无法同时收敛到这两种信号。具有立体声参考的 AEC 可以正确处理这个问题,而单声道 AEC 则不能。
实际上,带有单声道参考的 AEC 在立体声会议室中大部分时间都能正常工作。除高度定制的网真会议室外,即使将麦克风发送到立体声编解码器,也很少进行平移。远端音频几乎总是单声道的,而远端音频是我们对 AEC 的主要关注点。
对白较多的节目音频也可能将其大部分能量转移到中心位置,即使使用单声道 AEC 参考也会被抵消。如果可以听到节目音频的残余回声,它的延迟较低,远端可能会感觉到额外的混响或浑浊,而不是明显的回声。
位置音频
定位音频与立体声不同,每个扬声器播放的是截然不同的声道。例如,网真房间可能有两个连接到不同站点的编解码器,并通过相应显示屏附近的扬声器播放来自每个站点的音频。在这种系统中,需要使用具有多通道基准的 AEC 来正确消除回声。如果使用单声道 AEC 参考,每当有人在不同的远端开始讲话时,就可能会经常听到这类系统的回声。
如果每次只使用一个扬声器位置,位置音频可能会奏效。例如,在纯语音会议期间,天花板或桌子上的扬声器可能是首选,因为本地与会者将面向桌子中央。在视频会议期间,扬声器应靠近显示屏。如果在视频会议期间也将纯语音远端音频传送到显示屏扬声器,则单声道 AEC 参考可同时处理这两种情况(尽管在两种模式之间切换后,AEC 在通话开始时收敛之前可能会听到回音)。
如果节目音频与远端音频由不同的扬声器呈现(例如,节目音频由前置扬声器呈现,而远端音频由天花板扬声器呈现),则最好将节目音频排除在 AEC 参考之外。这可能会导致从远端听到浑浊的节目音频,但不太可能引起可闻回声。
房间组合
房间组合本身并不会造成 AEC 问题。但是,如果使用调整矩阵交叉点的参数集手工进行房间组合,就很容易出错。一些 AEC 参考信号很容易包含额外的远端或节目音频信号,或者缺少所需的信号。相关麦克风会发出回声,而且问题很难诊断。幸运的是,会议室组合器为设计者减轻了这一负担,避免了此类错误的发生。
即使房间组合系统配置正确,在房间配置改变后也可能会短暂听到回声。这会改变不同分区的麦克风和扬声器之间的回声路径,AEC 需要在改变后重新进行会聚。
回波路径不得包含非线性或时变处理
AEC 的自适应滤波器只能模拟线性、时间不变的回声路径。回声路径中的任何非线性或时变因素都会严重影响 AEC 的性能。回声路径可描述为
- 对扬声器输出进行任何 AEC 参考系统没有的处理
- 扬声器和麦克风之间的声学路径(包括扬声器和麦克风本身)
- 在 AEC 之前对麦克风输入进行任何处理
典型的会议室设计如下图所示。属于回声路径的信号用红色标出。

动力
动态处理可能会不断改变其增益。在回声路径中应用时,AEC 必须不断重新适应这些变化,因此很有可能经常出现残余回声。
扬声器输出通常会使用压缩器/限幅器,以防止削波。如果需要进行此类处理,则必须在压缩/限制后从扬声器信号中创建 AEC 参考信号(这意味着 CRR 的 AEC 参考输出将不会被使用)。如果扬声器信号是立体声信号,则必须在压缩/限幅后混成单声道信号,然后再传给 AEC 参考信号。
如果试图通过在 AEC 参考之前放置具有相同设置的相同处理来补偿扬声器输出上的动态处理,效果可能并不可靠。两个动态处理模块可能无法同时应用相同的增益,特别是如果 CRR 中的立体声到单声道转换导致单声道压缩器/限制器的电平与扬声器输出上立体声压缩器/限制器的电平略有不同。

如果需要对麦克风输入进行动态处理,则应在 AEC 后进行。
自动麦克风混音
自动话筒混音器会经常改变每个话筒通道的增益。当它们在麦克风之间切换时,会极大地改变混音中的回声路径。由于 AEC 资源有限,因此很容易将 AMM 放在单个 AEC 通道之前。然而,回声路径中的增益变化会使 AEC 的性能普遍较差。应在 AMM 之前的每个麦克风信号上都放置一个 AEC。
音量控制
音量控制也有与动态控制相同的问题,但频率较低。如果在回声路径中应用音量控制,用户改变音量后可能会短暂听到残余回声。
失真
会议系统的信号路径不太可能故意引入失真。不良的增益结构或劣质组件可能会在回声路径中引入失真。AEC 无法模拟这种失真,因此会产生残余回声。这种回声听起来会明显失真(比 AEC 前的麦克风信号更严重)。
线性时不变处理(通常)是安全的
AEC 的自适应滤波器可以模拟任何线性和时间不变的处理过程。只有这类处理的极端设置才会产生问题。
获得
固定增益通常不会给 AEC 带来问题,除非使用了极端的增益设置(即不良的增益结构)。不良增益设置造成的问题往往是由此产生的失真,而不是增益本身。
在某些设计中,放大器的增益很大,音量控制对信号的衰减也很大。这会导致 AEC 参考电平非常低,从而影响 AEC 双音频检测器确定何时适应的能力。理想情况下,当音量控制处于舒适设置时,AEC 基准电压应能看到良好的标称电平。
均衡化
均衡通常可以在回声路径中应用,不会造成问题。没有必要以均衡后的信号版本作为 AEC 参考,也没有必要对 AEC 参考重复应用均衡器。如果均衡器用于平坦扬声器和房间的响应,那么未均衡的 AEC 参考信号可能更能代表回声路径。
同样,麦克风输入上的任何滤波器通常都是无害的,如果需要,可以在 AEC 前使用。在某些情况下,例如在有大量低频噪音的麦克风上使用 HPF,在 AEC 前应用均衡器会有好处。
如果使用分频器,AEC 基准必须接收全频段信号,而不是分频器输出之一。
如果均衡器应用了大量的增强功能,那么 AEC 的性能可能会稍好一些,如果在 AEC 参考中考虑了增强功能的话。
延时
回声路径中的适度延迟对 AEC 来说不是问题。由于扬声器和麦克风之间的距离以及系统中的音频缓冲,自然会存在一些延迟。
过长的延迟(超过几十毫秒)会给 AEC 带来问题。延迟会减少 AEC 自适应滤波器的可用尾音长度。它还会使 AEC 参考和回音的时间对齐出现偏差,从而混淆 AEC 的双音频检测器。
回声路径中的延迟不一定是设计者添加的。许多显示器都会为唇音同步添加延迟(有时超过 100 毫秒)。为了补偿这一点,可能有必要只在 AEC 参考中添加延迟。
必须注意不要在 AEC 参考之前插入比回声路径中存在的延迟更多的延迟。这将导致回声的非因果性(回声先于参考到达),而 AEC 无法对此进行建模,并将导致远端听到回声。