AEC: guía de referencia completa

Se aplica a:

ControlSpace Procesador de sonido para conferencias EX-1280C

El correcto enrutamiento y procesamiento de la referencia de Cancelación de Eco Acústico (AEC) es fundamental para prevenir el eco en las salas de conferencias. Además, es uno de los aspectos más desafiantes del diseño de salas de conferencias.

El enrutador de sala de conferencias (CRR) contribuye en gran medida a garantizar que la referencia AEC se realice correctamente. Sin embargo, a menudo surgen dudas sobre cómo el procesamiento fuera del CRR afecta a la referencia AEC, y puede haber diseños que utilicen AEC sin usar el CRR.

A continuación se presentan algunos principios del uso de la referencia AEC en buenos diseños de salas de conferencias y algunos consejos sobre aplicaciones comunes.

La referencia debe contener las señales correctas

En general, la referencia AEC debe recibir una mezcla de todo el audio remoto y de programa que se reproducirá a través de los altavoces. Además, todos los altavoces de la sala deben reproducir esa misma mezcla.

Señales faltantes en la referencia

Si una señal no está en la referencia AEC, esta no la cancelará. Si un punto de cruce de la matriz entre una entrada del extremo remoto y la referencia AEC se silencia por error, se oirá eco desde ese extremo, pero el problema no se notará en la sala local. Este es un problema común que la CRR previene.

Si falta el audio del programa en la referencia, el receptor podría escuchar una versión turbia o reverberante del audio (incluyendo la mezcla directa del audio del programa enviada al receptor, junto con lo que captan localmente los micrófonos). Esto es menos grave que el eco del receptor, pero sigue sin ser ideal. En la mayoría de los casos, es preferible incluir el audio del programa en la referencia AEC. Una excepción a esto es el audio posicional, que se describe a continuación.

Señales adicionales en la referencia

Si se envía una señal a la referencia AEC, pero no se reproduce por el altavoz, la AEC podría divergir cuando la señal esté activa. Cuando la señal esté activa, el micrófono no detectará el audio correspondiente. La AEC convergerá a una ruta de señal sin eco y deberá volver a converger cuando se active una señal del extremo lejano (que pertenece a la referencia AEC).

Elevación de voz

Algunos diseñadores incorporan señales de micrófono en sus propias referencias AEC para intentar mejorar la ganancia antes de la retroalimentación en sistemas de amplificación de voz. El beneficio de esto es cuestionable, pero podría funcionar bien en algunas salas. En otros casos, la reducción de retroalimentación del AEC podría ser inconsistente, o el eco residual podría ser audible en el extremo opuesto durante la conversación simultánea.

En la mayoría de los casos, es preferible usar señales de micrófono pre-AEC para la amplificación de voz y excluir los micrófonos de las referencias AEC. Esto proporciona la menor latencia para el refuerzo local y no causará problemas con el AEC.

Estéreo

Las señales estéreo en una referencia AEC mono son teóricamente un problema. Si la señal estéreo presenta mucha separación, se reproducirán señales significativamente diferentes desde los altavoces izquierdo y derecho. La trayectoria del eco entre los altavoces izquierdo y derecho y el micrófono tiene respuestas de impulso diferentes, y un AEC mono no puede converger a ambos simultáneamente. Un AEC con una referencia estéreo está diseñado para gestionar esto correctamente, mientras que un AEC mono no.

En la práctica, un AEC con una referencia mono funcionará bien la mayor parte del tiempo en una sala de conferencias estéreo. Salvo en salas de telepresencia altamente personalizadas, los micrófonos rara vez se panoramizan, incluso al enviarse a códecs estéreo. El audio del extremo remoto casi siempre es mono, y este es nuestra principal preocupación para el AEC.

También es probable que el audio de programa con muchos diálogos tenga la mayor parte de su energía panoramizada hacia el centro y se cancele incluso con una referencia AEC mono. Si se escucha un eco residual del audio de programa, tendrá baja latencia y probablemente el otro extremo lo perciba como reverberación adicional o distorsión, en lugar de como un eco distintivo.

Audio posicional

El audio posicional se diferencia del estéreo en que cada altavoz reproduce un canal distinto. Por ejemplo, una sala de telepresencia podría tener dos códecs conectados a diferentes sitios y reproducir el audio de cada sitio desde altavoces cercanos a la pantalla correspondiente. Se requiere un AEC con referencia multicanal para cancelar el eco correctamente en este tipo de sistema. Con una referencia AEC mono, es probable que se escuche eco con frecuencia en este tipo de sistema cuando alguien en un extremo diferente comience a hablar.

El audio posicional puede funcionar si solo se utiliza una posición de altavoz a la vez. Por ejemplo, durante una conferencia de solo voz, se prefieren altavoces en el techo o en una mesa, ya que los participantes locales estarán orientados hacia el centro de la mesa. Durante una videoconferencia, se prefieren altavoces cerca de la pantalla. Si el audio remoto de solo voz también se reproduce en los altavoces de la pantalla durante una videoconferencia, una referencia AEC mono puede gestionar ambos escenarios (aunque el eco puede ser audible hasta que el AEC converja al inicio de la llamada tras cambiar entre ambos modos).

Si el audio del programa se reproduce en altavoces distintos a los del extremo remoto (por ejemplo, el audio del programa proviene de los altavoces frontales y el audio del extremo remoto proviene de los altavoces de techo), puede ser preferible excluir el audio del programa de la referencia AEC. Esto puede provocar que el audio del programa se escuche turbio desde el extremo remoto, pero es menos probable que cause eco audible.

Combinación de habitaciones

La combinación de salas en sí no causa problemas de AEC. Sin embargo, si se realiza manualmente con conjuntos de parámetros que ajustan los puntos de cruce de la matriz, es fácil cometer errores. Algunas referencias de AEC podrían contener señales de audio de programa o de extremo remoto adicionales, o incluso faltar las necesarias. El eco será audible desde los micrófonos asociados y el problema podría ser muy difícil de diagnosticar. Afortunadamente, Conference Room Combiner elimina esta carga del diseñador y previene este tipo de error.

Incluso con un sistema de combinación de salas correctamente configurado, el eco puede ser audible brevemente tras un cambio en la configuración de la sala. Esto modifica la trayectoria del eco entre pares de micrófonos y altavoces en diferentes particiones, y el AEC debe volver a converger después de esto.

La ruta del eco no debe contener procesamiento no lineal o variable en el tiempo

El filtro adaptativo del AEC solo puede modelar una trayectoria de eco lineal e invariante en el tiempo. Cualquier componente no lineal o variable en el tiempo en la trayectoria de eco puede afectar gravemente el rendimiento del AEC. La trayectoria de eco puede describirse como

Cualquier procesamiento en la salida del altavoz que no esté presente en la referencia AEC
La trayectoria acústica entre el altavoz y el micrófono (incluidos el altavoz y el micrófono en sí)
Cualquier procesamiento en la entrada del micrófono antes del AEC

El diagrama a continuación muestra el diseño típico de una sala de conferencias. Las señales que forman parte de la trayectoria del eco están resaltadas en rojo.

La ruta del eco no debe contener una figura de procesamiento no lineal o variable en el tiempo

Dinámica

El procesamiento dinámico puede cambiar constantemente su ganancia. Al aplicarse en la trayectoria del eco, el AEC debe readaptarse constantemente a estos cambios, lo que crea una alta probabilidad de eco residual frecuente.

Se suelen aplicar compresores/limitadores a las salidas de los altavoces para evitar la saturación. Si se requiere dicho procesamiento, la referencia AEC debe crearse a partir de la señal del altavoz después de la compresión/limitación (lo que significa que la salida de referencia AEC del CRR no se utilizaría). Si la señal del altavoz es estéreo, debe mezclarse a mono después de la compresión/limitación antes de pasarla a la referencia AEC.

Intentar compensar el procesamiento dinámico en la salida del altavoz aplicando el mismo procesamiento con la misma configuración antes de la referencia AEC podría no ser tan fiable. Existe el riesgo de que ambos bloques de procesamiento dinámico no apliquen la misma ganancia simultáneamente, especialmente si la conversión de estéreo a mono en el CRR provoca un nivel ligeramente diferente en un compresor/limitador mono en comparación con el observado en un compresor/limitador estéreo en las salidas del altavoz.

Si se necesita dinámica en las entradas de micrófono, se debe aplicar después del AEC.

Mezcla automática de micrófonos

Los mezcladores automáticos de micrófonos cambian frecuentemente la ganancia de cada canal. Al alternar entre micrófonos, la ruta del eco en la mezcla cambia drásticamente. Resulta tentador colocar un AMM antes de un solo canal AEC, ya que los recursos de AEC son limitados. Sin embargo, los cambios de ganancia en la ruta del eco hacen que el AEC tenga un rendimiento deficiente en general. Se debe colocar un AEC en cada señal de micrófono antes del AMM.

Control de volumen

El control de volumen presenta el mismo problema que la dinámica, pero con menos frecuencia. Si se aplica el control de volumen en la ruta del eco, puede oírse brevemente un eco residual después de que el usuario cambie el volumen.

Distorsión

Es improbable que se introduzca distorsión intencionalmente en la trayectoria de la señal de un sistema de conferencias. Una mala estructura de ganancia o componentes de baja calidad podrían introducir distorsión en la trayectoria del eco. La distorsión no puede ser modelada por el AEC y causará un eco residual. Este eco sonará visiblemente distorsionado (mucho más que la señal del micrófono pre-AEC).

El procesamiento lineal e invariante en el tiempo es (generalmente) seguro

Cualquier procesamiento lineal e invariante en el tiempo puede modelarse mediante el filtro adaptativo del AEC. Solo las configuraciones extremas de este tipo de procesamiento pueden presentar problemas.

Ganar

Una ganancia fija no suele causar problemas en el AEC, a menos que se utilicen ajustes de ganancia extremos (es decir, una estructura de ganancia deficiente). A menudo, el problema causado por ajustes de ganancia incorrectos se debe a la distorsión resultante, más que a la ganancia en sí.

En algunos diseños, se aplica una gran ganancia al amplificador y el control de volumen aplica una gran atenuación a la señal. Esto puede resultar en un nivel muy bajo en la referencia AEC, lo que puede afectar la capacidad del detector de doble habla de la AEC para determinar cuándo adaptarse. Idealmente, la referencia AEC debería detectar buenos niveles nominales cuando el control de volumen se encuentra en un nivel cómodo.

Igualdad

Normalmente, la ecualización se puede aplicar en la ruta del eco sin problemas. No es necesario basar la referencia de AEC en la versión ecualizada de la señal ni aplicar una ecualización duplicada a la referencia de AEC. Si la ecualización se utiliza para aplanar la respuesta del altavoz y de la sala, una referencia de AEC sin ecualizar probablemente sea más representativa de la ruta del eco.

Asimismo, los filtros en las entradas de micrófono suelen ser inofensivos y pueden aplicarse antes del AEC si se desea. En algunos casos, como con un filtro de paso alto en un micrófono con mucho ruido de baja frecuencia, aplicar la ecualización antes del AEC puede ser beneficioso.

Si se utilizan cruces, la referencia AEC debe recibir la señal de banda completa y no una de las salidas del cruce.

Si el ecualizador aplica mucho impulso, el AEC puede funcionar levemente mejor si ese impulso se tiene en cuenta en la referencia del AEC.

Delay (Retraso)

Un ligero retraso en la trayectoria del eco no supone un problema para el AEC. Naturalmente, existe cierto retraso debido a la distancia entre el altavoz y el micrófono, y al búfer de audio del sistema.

Un retraso excesivo (superior a unas pocas decenas de milisegundos) puede ser un problema para el AEC. Este retraso reduce la longitud de cola disponible del filtro adaptativo del AEC. También puede confundir al detector de doble conversación del AEC al distorsionar la alineación temporal de la referencia del AEC y el eco.

El retraso en la ruta del eco no es necesariamente añadido por el diseñador. Muchas pantallas añaden un retraso (a veces superior a 100 ms) para la sincronización labial. Añadir un retraso solo a la referencia AEC puede ser necesario para compensarlo.

Se debe tener cuidado de no insertar un retardo mayor antes de la referencia AEC que el existente en la ruta del eco. Esto provoca que el eco no sea causal (llega antes de la referencia), lo cual no puede ser modelado por el AEC y provocará un eco audible en el extremo remoto.