AEC – Guide complet du signal de référence

Le routage et le traitement corrects du signal de référence pour l'annulation d'écho acoustique (AEC) sont essentiels pour éviter l'écho dans les salles de conférence. C'est également l'un des aspects les plus complexes de la conception de ces salles.

Le routeur de salle de conférence (CRR) contribue largement à garantir la bonne exécution de la référence AEC. Cependant, des questions se posent souvent quant à l'impact du traitement en dehors du CRR sur cette référence, et certaines conceptions peuvent utiliser l'AEC sans recourir au CRR.

Vous trouverez ci-dessous quelques principes d'utilisation du référentiel AEC pour la conception de salles de conférence de qualité, ainsi que des conseils sur les applications courantes.

La référence doit contenir les signaux corrects.

En général, la référence AEC doit recevoir un mix de tous les signaux audio distants et de programme qui seront diffusés via le système. enceintes De plus, tous les enceintes Dans la même pièce, il faudrait diffuser le même mix.

Signaux manquants dans la référence

Si un signal n'est pas présent dans la référence AEC, il ne sera pas annulé. Si un point de croisement de la matrice entre une entrée distante et la référence AEC est désactivé par erreur, un écho sera audible à cette extrémité, mais le problème sera imperceptible dans la pièce. Il s'agit d'un écueil courant que le CRR permet d'éviter.

Si le signal audio du programme est absent de la référence, le destinataire distant risque d'entendre une version brouillée ou réverbérée de ce signal (incluant le mixage direct du signal audio du programme qui lui est envoyé, ainsi que le signal capté localement par les microphones). Ce problème est moins grave qu'un écho provenant du destinataire distant, mais reste néanmoins indésirable. Dans la plupart des cas, il est préférable d'inclure le signal audio du programme dans la référence AEC. Une exception à cette règle concerne le signal audio positionnel, décrit ci-dessous.

Signaux supplémentaires dans la référence

Si un signal est envoyé à la référence AEC, mais n'est pas lu à partir de la enceinte Le système AEC peut diverger dès qu'un signal est actif. Lorsqu'un signal est actif, aucun signal audio correspondant n'est détecté par le microphone. Le système AEC converge alors vers un chemin de signal sans écho et doit reconverger lorsqu'un signal distant (appartenant à la référence AEC) devient actif.

Ascendance vocale

Certains concepteurs intègrent les signaux du microphone dans leurs propres références AEC afin d'améliorer le gain avant Larsen dans les systèmes d'amplification vocale. L'intérêt de cette pratique est discutable, mais elle peut s'avérer efficace dans certaines pièces. Dans d'autres cas, le comportement de réduction du Larsen du système AEC peut être inconstant, ou un écho résiduel peut être audible par l'interlocuteur distant lors de conversations simultanées.

Dans la plupart des cas, il est préférable d'utiliser les signaux des microphones pré-AEC pour l'amplification vocale et de ne pas inclure les microphones dans les références AEC. Cela permet d'obtenir la latence la plus faible pour le renforcement local et n'entraîne aucun problème avec l'AEC.

Stéréo

Les signaux stéréo dans une référence AEC mono constituent théoriquement un problème. Si le signal stéréo présente une forte séparation, des signaux significativement différents seront joués à gauche et à droite. enceintes Le trajet de l'écho entre la gauche et la droite enceintes Les microphones ayant des réponses impulsionnelles différentes, un correcteur d'émission automatique mono ne peut pas converger vers les deux simultanément. Un correcteur d'émission automatique avec référence stéréo est conçu pour gérer correctement cette situation, contrairement à un correcteur mono.

En pratique, un système d'annulation d'écho acoustique (AEC) avec une référence mono fonctionne généralement bien dans une salle de conférence stéréo. Hormis les salles de téléprésence hautement personnalisées, les microphones sont rarement panoramisés, même avec des codecs stéréo. L'audio distant est presque toujours mono et constitue notre principale préoccupation pour l'AEC.

Dans les programmes audio riches en dialogues, l'énergie est généralement concentrée au centre et serait annulée même avec une référence AEC mono. Si un écho résiduel est audible, sa latence sera faible et il sera probablement perçu par le destinataire comme une réverbération supplémentaire ou un son brouillé, plutôt que comme un écho distinct.

Audio positionnel

L'audio positionnel diffère de la stéréo en ce que chaque enceinte diffuse un canal distinct. Par exemple, une salle de téléprésence peut avoir deux codecs connectés à des sites différents et diffuser l'audio de chaque site à partir de enceintes À proximité de l'écran correspondant. Un système AEC multicanal est nécessaire pour annuler correctement l'écho dans ce type de système. Avec un système AEC monocanal, un écho serait fréquemment audible dès qu'une personne à l'autre extrémité prendrait la parole.

L'audio positionnel peut éventuellement fonctionner si une seule enceinte La position est utilisée une à une. Par exemple, enceintes Lors d'une conférence audio uniquement, il peut être préférable d'afficher l'écran au plafond ou sur la table, car les participants locaux seront face au centre de la table. Lors d'une visioconférence, enceintes L'affichage à proximité de l'écran serait préférable. Si le son distant (voix uniquement) est également rendu sur l'écran. enceintes Lors d'une vidéoconférence, une référence AEC mono peut gérer les deux scénarios (bien qu'un écho puisse être audible jusqu'à ce que l'AEC converge au début d'un appel après avoir basculé entre les deux modes).

Si le son du programme est rendu sur différents enceintes que l'audio distant (par exemple, l'audio du programme provenant de l'avant) enceintes et un son lointain provenant du plafond enceintes Il peut être préférable d'exclure le signal audio du programme de la référence AEC. Cela peut entraîner une distorsion du signal audio perçue à l'autre bout du dispositif, mais réduit le risque d'écho audible.

Combinaison de pièces

La combinaison de salles en elle-même n'est pas source de problèmes d'intégration audio-vidéo (IAE). Cependant, si elle est effectuée manuellement avec des paramètres ajustant les points de croisement de la matrice, les erreurs sont fréquentes. Certaines références IAE peuvent contenir des signaux audio supplémentaires provenant de l'extrémité distante ou du programme, ou être incomplètes. Un écho sera alors audible au niveau des microphones associés, rendant le diagnostic du problème très complexe. Heureusement, le combineur de salles de conférence simplifie cette tâche pour le concepteur et prévient ce type d'erreur.

Même avec un système de combinaison de salles correctement configuré, un écho peut être brièvement audible après un changement de configuration de la salle. Cela modifie le trajet de l'écho entre les paires de microphones et enceintes dans différentes partitions, et l'AEC doit converger à nouveau après que cela se soit produit.

Le chemin d'écho ne doit pas contenir de traitement non linéaire ou variable dans le temps.

Le filtre adaptatif du système AEC ne peut modéliser qu'un trajet d'écho linéaire et invariant dans le temps. Tout élément non linéaire ou variable dans le temps du trajet d'écho peut fortement dégrader les performances de l'AEC. Le trajet d'écho peut être décrit comme

  • Tout traitement sur le enceinte sortie qui n'est pas présente sur la référence AEC
  • Le trajet acoustique entre les enceinte et microphone (y compris le enceinte et le microphone eux-mêmes)
  • Tout traitement appliqué à l'entrée du microphone avant l'AEC

Le schéma ci-dessous illustre la configuration typique d'une salle de conférence. Les signaux faisant partie du trajet d'écho sont mis en évidence en rouge.

Le chemin d'écho ne doit pas contenir de traitement non linéaire ou variable dans le temps. Figure

Dynamique

Le traitement dynamique peut modifier constamment son gain. Appliqué au trajet de l'écho, le contrôle automatique d'émission (CAE) doit constamment s'adapter à ces variations, ce qui augmente considérablement le risque d'écho résiduel fréquent.

Les compresseurs/limiteurs sont souvent utilisés pour enceinte sorties pour éviter l'écrêtage. Si un tel traitement est nécessaire, la référence AEC doit être créée à partir de enceinte signal après compression/limitation (ce qui signifie que la sortie de référence AEC du CRR ne serait pas utilisée). Si le enceinte Le signal étant stéréo, il doit être mixé en mono après compression/limitation avant d'être transmis à la référence AEC.

Tentative de compensation du traitement dynamique sur le enceinte Appliquer le même traitement avec les mêmes paramètres avant la référence AEC peut ne pas donner des résultats aussi fiables. Il existe un risque que les deux blocs de traitement de la dynamique n'appliquent pas le même gain simultanément, notamment si la conversion stéréo vers mono dans le CRR entraîne un niveau légèrement différent au niveau d'un compresseur/limiteur mono par rapport à celui observé par un compresseur/limiteur stéréo. enceinte sorties.

Figure dynamique

Si une dynamique est nécessaire sur les entrées microphone, elle doit être appliquée après l'AEC.

Mixage automatique des microphones

Les mélangeurs automatiques de microphones (AMM) modifient fréquemment le gain de chaque canal de microphone. Lors du passage d'un microphone à l'autre, le trajet de l'écho dans le mixage est fortement perturbé. Il peut être tentant de placer un AMM avant un seul canal de réduction d'écho automatique (AEC), car les ressources de ce dernier sont limitées. Cependant, les variations de gain dans le trajet de l'écho dégradent généralement les performances de l'AEC. Il est donc recommandé de placer un AEC sur chaque signal de microphone avant l'AMM.

Contrôle du volume

Le contrôle du volume présente le même problème que la dynamique, mais moins fréquemment. Si le contrôle du volume est appliqué sur le trajet de l'écho, un écho résiduel peut être brièvement audible après une modification du volume par l'utilisateur.

Distorsion

Il est peu probable qu'une distorsion soit intentionnellement introduite dans le trajet du signal d'un système de visioconférence. Une structure de gain défectueuse ou des composants de mauvaise qualité pourraient introduire une distorsion dans le trajet de l'écho. Cette distorsion ne peut être modélisée par le système de contrôle automatique d'écho (CAE) et provoquera un écho résiduel. Cet écho sera nettement distordu (bien plus que le signal du microphone avant CAE).

Le traitement linéaire et invariant dans le temps est (généralement) sûr

Tout traitement linéaire et invariant dans le temps peut être modélisé par le filtre adaptatif du contrôle automatique d'émission (CAE). Seuls les réglages extrêmes de ce type de traitement peuvent poser problème.

Gagner

Le gain fixe ne pose généralement pas de problème pour le contrôle automatique d'émission (CAE), sauf en cas de réglages de gain extrêmes (c'est-à-dire une structure de gain inadaptée). Souvent, le problème causé par de mauvais réglages de gain provient de la distorsion qui en résulte, plutôt que du gain lui-même.

Dans certaines conceptions, l'amplificateur applique un gain important, et le contrôle de volume atténue fortement le signal. Il peut en résulter un niveau très faible au niveau de la référence AEC, ce qui peut affecter la capacité du détecteur de double conversation de l'AEC à déterminer le moment opportun pour l'adaptation. Idéalement, la référence AEC devrait afficher des niveaux nominaux corrects lorsque le contrôle de volume est réglé sur un niveau confortable.

Égalisation

L'égalisation peut généralement être appliquée sur le trajet d'écho sans problème. Il n'est pas nécessaire de baser la référence AEC sur la version égalisée du signal, ni d'appliquer une égalisation dupliquée à la référence AEC. Si l'égalisation est utilisée pour aplanir le signal, enceinte et la réponse de la pièce, une référence AEC non égalisée est probablement plus représentative du trajet de l'écho.

De même, les filtres appliqués aux entrées microphone sont généralement sans conséquence et peuvent être utilisés avant l'AEC si nécessaire. Dans certains cas, notamment avec un filtre passe-haut sur un microphone présentant beaucoup de bruit dans les basses fréquences, l'application d'une égalisation avant l'AEC peut s'avérer bénéfique.

Si des filtres de croisement sont utilisés, la référence AEC doit recevoir le signal pleine bande et non l'une des sorties du filtre.

Si l'égaliseur applique une forte amplification, le contrôle automatique d'exposition (AEC) pourrait être légèrement plus performant si cette amplification est prise en compte dans la référence AEC.

Delay (retard)

Un léger délai dans le trajet de l'écho ne pose pas de problème pour le contrôle automatique d'émission (CAE). Un certain délai existe naturellement en raison de la distance entre les deux sources. enceinte et le microphone, ainsi que la mise en mémoire tampon audio du système.

Un délai excessif (plusieurs dizaines de millisecondes) peut poser problème au système de contrôle automatique d'émission (CAE). Ce délai réduit la longueur de queue disponible du filtre adaptatif du CAE et peut perturber le détecteur de double parole en désynchronisant la référence du CAE et l'écho.

Le délai dans le trajet de l'écho n'est pas nécessairement ajouté par le concepteur. De nombreux écrans ajoutent un délai (parfois supérieur à 100 ms) pour la synchronisation labiale. Il peut être nécessaire d'ajouter un délai uniquement à la référence AEC pour compenser ce délai.

Il convient de veiller à ne pas introduire un délai supérieur à celui existant sur le trajet de l'écho avant la référence AEC. Un tel délai rend l'écho non causal (l'écho arrive avant la référence), ce qui ne peut être modélisé par l'AEC et provoque un écho audible à l'extrémité distante.