L'acheminement et le traitement corrects de la référence d'annulation de l'écho acoustique (AEC) sont essentiels pour éviter l'écho dans les salles de conférence. C'est aussi l'un des aspects les plus difficiles de la conception des salles de conférence.
Le routeur de salle de conférence (CRR) contribue largement à garantir que la référence AEC est effectuée correctement. Cependant, on s'interroge souvent sur la manière dont le traitement en dehors du CRR affecte la référence AEC, et il peut y avoir des conceptions qui utilisent l'AEC sans utiliser le CRR.
Vous trouverez ci-dessous quelques principes d'utilisation de la référence AEC pour la conception de salles de conférence de qualité, ainsi que des conseils sur les applications courantes.
La référence doit contenir les bons signaux
En général, l'AEC de référence doit recevoir un mélange de tous les signaux audio de la partie distante et du programme qui seront diffusés sur le site enceintes. En outre, tous les sites enceintes de la pièce doivent diffuser ce même mélange.
Signaux manquants dans la référence
Si un signal n'est pas dans la référence AEC, l'AEC ne l'annulera pas. Si un point de croisement de la matrice entre une entrée éloignée et la référence du CCEA est coupé par erreur, l'écho sera entendu depuis cette entrée éloignée, mais le problème ne sera pas perceptible dans la pièce locale. Il s'agit d'un piège courant que le CRR permet d'éviter.
Si l'audio du programme est absent de la référence, la partie distante peut entendre une version boueuse ou réverbérante de l'audio du programme (y compris le mixage direct de l'audio du programme envoyé à la partie distante, ainsi que ce qui est capté localement par les micros). Ce phénomène est moins grave que l'écho provenant de l'extrémité la plus éloignée, mais il n'est pas idéal. Dans la plupart des cas, il est préférable d'inclure le son du programme dans la référence AEC. Une exception à cette règle est le cas de l'audio positionnel, décrit ci-dessous.
Signaux supplémentaires dans la référence
Si un signal est envoyé à l'AEC de référence, mais qu'il n'est pas diffusé sur le site enceinte, l'AEC peut diverger lorsque le signal est actif. Lorsque le signal est actif, le microphone ne détecte pas de son correspondant. L'AEC convergera vers un chemin de signal sans écho et devra se reconvertir lorsqu'un signal éloigné (qui appartient à la référence AEC) devient actif.
Voice-Lift
Certains concepteurs placent des signaux de microphone dans leurs propres références AEC pour essayer d'améliorer le gain avant rétroaction dans les systèmes d'élévation de la voix. L'avantage de cette méthode est discutable, mais elle peut donner de bons résultats dans certaines pièces. Dans d'autres cas, le comportement de réduction de l'effet Larsen de l'AEC peut être incohérent, ou un écho résiduel peut être audible à l'autre bout de la pièce lors d'une double conversation.
Dans la plupart des cas, il est préférable d'utiliser les signaux des microphones pré-AEC pour le voice-lift et de laisser les microphones en dehors des références AEC. Cela permet d'obtenir la latence la plus faible pour le renforcement local et n'entraîne aucun problème avec l'AEC.
Stéréo
Les signaux stéréo dans une référence AEC mono posent théoriquement un problème. Si le signal stéréo présente une séparation importante, des signaux sensiblement différents seront émis par la gauche et la droite enceintes. Le chemin de l'écho entre les sites enceintes gauche et droit et le microphone a des réponses impulsionnelles différentes, et une AEC mono ne peut pas converger vers les deux en même temps. Un AEC avec une référence stéréo est conçu pour gérer cela correctement, alors qu'un AEC mono ne l'est pas.
En pratique, un AEC avec une référence mono fonctionnera bien la plupart du temps dans une salle de conférence stéréo. Sauf dans les salles de téléprésence hautement personnalisées, les microphones sont rarement orientés, même lorsqu'ils sont envoyés à des codecs stéréo. L'audio lointain est presque toujours mono, et l'audio lointain est notre principale préoccupation en matière d'AEC.
Les programmes audio à forte intensité de dialogue sont également susceptibles d'avoir la plus grande partie de leur énergie orientée vers le centre et seraient annulés même avec une référence AEC mono. Si l'écho résiduel du programme audio est audible, il aura une faible latence et sera probablement perçu par l'extrémité la plus éloignée comme une réverbération supplémentaire ou un effet de boue, plutôt que comme un écho distinct.
Audio positionnelle
L'audio positionnel est différent de la stéréo dans la mesure où chaque site enceinte joue un canal différent. Par exemple, une salle de téléprésence peut avoir deux codecs connectés à des sites différents et diffuser l'audio de chaque site à partir de enceintes près de l'écran correspondant. Un AEC avec une référence multicanal est nécessaire pour annuler correctement l'écho dans ce type de système. Avec une référence AEC mono, il est probable que l'on entende fréquemment de l'écho dans ce type de système lorsque quelqu'un commence à parler à une autre extrémité.
L'audio positionnel peut éventuellement fonctionner si une seule position enceinte est utilisée à la fois. Par exemple, enceintes au plafond ou sur la table peut être préféré lors d'une conférence vocale uniquement, car les participants locaux feront face au centre de la table. Lors d'une vidéoconférence, il est préférable d'utiliser enceintes près de l'écran. Si l'audio de l'extrémité éloignée pour la voix seule est également rendu à l'écran enceintes pendant une vidéoconférence, une référence AEC mono peut gérer les deux scénarios (bien qu'un écho puisse être audible jusqu'à ce que l'AEC converge au début d'un appel après avoir basculé entre les deux modes).
Si l'audio du programme est rendu sur des sites enceintes différents de l'audio de l'extrémité (par exemple, l'audio du programme de l'avant enceintes et l'audio de l'extrémité du plafond enceintes), il peut être préférable de laisser l'audio du programme en dehors de la référence AEC. Cela peut se traduire par un son de programme brouillé à l'extrémité la plus éloignée, mais il est moins probable qu'il y ait un écho audible.
Salle combinée
La combinaison de pièces n'est pas en soi une cause de problèmes AEC. Cependant, si la combinaison de salles est effectuée à la main avec des jeux de paramètres qui ajustent les points de croisement de la matrice, il est facile de commettre des erreurs. Certaines des références AEC peuvent facilement contenir des signaux audio de programme ou d'extrémité lointaine supplémentaires, ou ne pas contenir les signaux nécessaires. L'écho sera audible à partir des microphones associés et le problème pourrait être très difficile à diagnostiquer. Heureusement, le Conference Room Combiner décharge le concepteur de ce fardeau et permet d'éviter ce type d'erreur.
Même avec un système de combinaison de salles correctement configuré, l'écho peut être brièvement audible après un changement de configuration de la salle. Cela modifie le chemin de l'écho entre les paires de microphones et enceintes dans les différentes partitions, et l'AEC doit reconverger après cela.
Le trajet de l'écho ne doit pas contenir de traitement non linéaire ou variable dans le temps.
Le filtre adaptatif de l'AEC ne peut modéliser qu'un trajet d'écho linéaire et invariant dans le temps. Tout ce qui est non linéaire ou variable dans le trajet de l'écho peut gravement nuire aux performances de l'AEC. Le trajet de l'écho peut être décrit comme suit
- Tout traitement sur la sortie enceinte qui n'est pas présent sur la référence AEC
- Le chemin acoustique entre le enceinte et le microphone (y compris le enceinte et le microphone eux-mêmes)
- Tout traitement sur l'entrée du microphone avant l'AEC
Une salle de conférence typique est illustrée dans le diagramme ci-dessous. Les signaux qui font partie du chemin de l'écho sont mis en évidence en rouge.

Dynamique
Le traitement de la dynamique peut modifier constamment son gain. Lorsqu'il est appliqué sur le trajet de l'écho, le CEA doit constamment se réadapter à ces changements, ce qui crée une forte possibilité d'écho résiduel fréquent.
Des compresseurs/limiteurs sont souvent appliqués aux sorties de enceinte pour éviter l'écrêtage. Si un tel traitement est nécessaire, la référence AEC doit être créée à partir du signal enceinte après compression/limitation (ce qui signifie que la sortie de référence AEC du CRR serait inutilisée). Si le signal enceinte est stéréo, il doit être mixé en mono après compression/limitation avant d'être transmis à la référence AEC.
Tenter de compenser le traitement dynamique sur la sortie enceinte en plaçant le même traitement avec les mêmes réglages avant la référence AEC peut ne pas fonctionner de manière aussi fiable. Il existe un certain risque que les deux blocs de traitement dynamique n'appliquent pas le même gain au même moment, en particulier si la conversion stéréo-mono dans le CRR fait apparaître un niveau légèrement différent au niveau d'un compresseur/limiteur mono par rapport à ceux perçus par un compresseur/limiteur stéréo sur les sorties enceinte .

Si des dynamiques sont nécessaires sur les entrées microphones, elles doivent être appliquées après l'AEC.
Mixage automatique des microphones
Les mélangeurs automatiques de microphones modifient fréquemment le gain de chaque canal de microphone. Lorsqu'ils passent d'un microphone à l'autre, le chemin de l'écho dans le mixage s'en trouve radicalement modifié. Il est tentant de placer un AMM avant un seul canal AEC, car les ressources AEC sont limitées. Cependant, les changements de gain dans le trajet de l'écho font que l'AEC n'est pas très performant en général. Un AEC doit être placé sur chaque signal de microphone avant l'AMM.
Contrôle du volume
Le contrôle du volume pose le même problème que la dynamique, mais moins fréquemment. Si le contrôle du volume est appliqué dans le chemin de l'écho, un écho résiduel peut être brièvement audible après que l'utilisateur a changé de volume.
Distorsion
Il est peu probable que la distorsion soit introduite intentionnellement dans le trajet du signal d'un système de conférence. Une mauvaise structure de gain ou des composants de mauvaise qualité peuvent introduire de la distorsion dans le trajet de l'écho. La distorsion ne peut pas être modélisée par l'AEC et provoquera un écho résiduel. Cet écho sera manifestement déformé (beaucoup plus que le signal du microphone avant l'AEC).
Le traitement linéaire et invariant dans le temps est (généralement) sûr
Tout traitement linéaire et invariant dans le temps peut être modélisé par le filtre adaptatif de l'AEC. Seules les configurations extrêmes de ce type de traitement peuvent poser problème.
Gain
Le gain fixe ne pose généralement pas de problèmes à l'AEC, à moins que des réglages de gain extrêmes (c.-à-d. une mauvaise structure de gain) ne soient utilisés. Souvent, le problème causé par de mauvais réglages de gain provient de la distorsion qui en résulte, plutôt que du gain lui-même.
Dans certaines conceptions, un gain important est appliqué dans l'amplificateur et la commande de volume applique une forte atténuation au signal. Il peut en résulter un niveau très bas au niveau de la référence du CEA, ce qui peut affecter la capacité du détecteur de double langage du CEA à déterminer le moment où il doit s'adapter. Idéalement, de bons niveaux nominaux devraient être perçus par la référence du CCEA lorsque la commande de volume est réglée à un niveau confortable.
Péréquation
L'égalisation peut normalement être appliquée dans le chemin de l'écho sans causer de problèmes. Il n'est pas nécessaire de baser la référence AEC sur la version égalisée du signal ou d'appliquer une égalisation en double à la référence AEC. Si l'égaliseur est utilisé pour aplanir la réponse de enceinte et de la pièce, une référence AEC non égalisée est probablement plus représentative du chemin de l'écho.
De même, les filtres sur les entrées de microphone sont généralement inoffensifs et peuvent être appliqués avant l'AEC si vous le souhaitez. Dans certains cas, comme celui d'un filtre HPF sur un micro avec beaucoup de bruit de basse fréquence, l'application d'un égaliseur avant l'AEC peut s'avérer bénéfique.
Si des crossovers sont utilisés, la référence AEC doit recevoir le signal pleine bande, et non l'une des sorties du crossover.
Si l'égaliseur applique une forte accentuation, l'AEC peut être légèrement plus performant si cette accentuation est prise en compte dans la référence de l'AEC.
Delay (retard)
Un léger retard dans le trajet de l'écho n'est pas un problème pour l'AEC. Un certain retard existe naturellement en raison de la distance entre enceinte et le microphone, et de la mémoire tampon audio dans le système.
Un retard excessif (plus de quelques dizaines de millisecondes) peut poser un problème à la CAE. Le retard a pour effet de réduire la longueur de queue disponible du filtre adaptatif de l'AEC. Il peut également perturber le détecteur de double langage de l'AEC en faussant l'alignement temporel de la référence de l'AEC et de l'écho.
Le retard dans le trajet de l'écho n'est pas nécessairement ajouté par le concepteur. De nombreux écrans ajoutent un retard (parfois plus de 100 ms) pour la synchronisation labiale. L'ajout d'un retard à la seule référence AEC peut s'avérer nécessaire pour compenser ce phénomène.
Il faut veiller à ne pas insérer plus de retard avant la référence du CEA qu'il n'y en a dans le trajet de l'écho. Dans ce cas, l'écho n'est pas causal (l'écho arrive avant la référence), ce qui ne peut pas être modélisé par le CEA et provoque un écho audible à l'extrémité éloignée.