Die korrekte Weiterleitung und Verarbeitung des Referenzsignals für die akustische Echokompensation (AEC) ist entscheidend für die Vermeidung von Echos in Konferenzräumen. Sie zählt gleichzeitig zu den anspruchsvollsten Aspekten der Konferenzraumplanung.
Der Konferenzraum-Router (CRR) trägt wesentlich dazu bei, dass die AEC-Referenz korrekt erstellt wird. Häufig gibt es jedoch Fragen dazu, wie sich die Verarbeitung außerhalb des CRR auf die AEC-Referenz auswirkt, und es existieren möglicherweise Entwürfe, die AEC ohne den Einsatz des CRR verwenden.
Nachfolgend finden Sie einige Grundsätze für die Verwendung des AEC-Referenzmaterials bei der Gestaltung von Konferenzräumen sowie einige Hinweise zu gängigen Anwendungsbereichen.
Die Referenz muss die korrekten Signale enthalten.
Im Allgemeinen sollte die AEC-Referenz eine Mischung aller Fern- und Programm-Audiosignale empfangen, die über die Lautsprecher wiedergegeben werden. Darüber hinaus sollten alle Lautsprecher im Raum dieselbe Mischung wiedergeben.
Fehlende Signale in der Referenz
Liegt ein Signal außerhalb des AEC-Referenzbereichs, wird es vom AEC nicht unterdrückt. Wird ein Matrix-Kreuzpunkt zwischen einem entfernten Eingang und dem AEC-Referenzbereich fälschlicherweise stummgeschaltet, ist zwar ein Echo vom entfernten Eingang hörbar, im Raum selbst jedoch nicht wahrnehmbar. Dies ist eine häufige Fehlerquelle, die durch die CRR verhindert wird.
Fehlt das Programmsignal in der Referenz, kann der Empfänger am anderen Ende eine verwaschene oder hallige Version des Programmsignals wahrnehmen (einschließlich des direkten Mixes des an den Empfänger gesendeten Programmsignals sowie des von den Mikrofonen lokal aufgenommenen Signals). Dies ist zwar weniger gravierend als ein Echo vom Empfänger, aber dennoch nicht optimal. In den meisten Fällen ist es daher ratsam, das Programmsignal in die AEC-Referenz aufzunehmen. Eine Ausnahme bildet die Positionsaudiomessung, die weiter unten beschrieben wird.
Zusätzliche Signale in der Referenz
Wird ein Signal an die AEC-Referenz gesendet, aber nicht über den Lautsprecher ausgegeben, kann die AEC divergieren, sobald das Signal aktiv ist. Solange das Signal aktiv ist, wird vom Mikrofon kein entsprechendes Audiosignal erfasst. Die AEC konvergiert dann zu einem Signalweg ohne Echo und muss erneut konvergieren, sobald ein entferntes Signal (das zur AEC-Referenz gehört) aktiv wird.
Voice-Lift
Manche Entwickler koppeln Mikrofonsignale an ihre eigenen AEC-Referenzsignale, um die Rückkopplungsfestigkeit von Sprachverstärkungssystemen zu verbessern. Der Nutzen dieser Vorgehensweise ist fraglich, kann aber in manchen Räumen gut funktionieren. In anderen Fällen kann die Rückkopplungsunterdrückung der AEC inkonsistent sein, oder es kann bei Gegengesprächen ein Restecho hörbar sein.
In den meisten Fällen ist es ratsam, die Mikrofonsignale vor der automatischen Schallverstärkung (AEC) für die Sprachanhebung zu verwenden und die Mikrofone aus den AEC-Referenzen herauszuhalten. Dies gewährleistet die geringste Latenz für die lokale Verstärkung und verursacht keine Probleme mit der automatischen Schallverstärkung.
Stereo
Stereosignale in einem Mono-AEC-Referenzsystem stellen theoretisch ein Problem dar. Bei starker Kanaltrennung im Stereosignal werden deutlich unterschiedliche Signale über den linken und rechten Lautsprecher wiedergegeben. Der Echopfad zwischen den Lautsprechern und dem Mikrofon weist unterschiedliche Impulsantworten auf, die ein Mono-AEC nicht gleichzeitig auf beide ausrichten kann. Ein AEC mit Stereo-Referenzsystem ist für die korrekte Verarbeitung dieses Problems ausgelegt, ein Mono-AEC hingegen nicht.
In der Praxis funktioniert eine automatische Belichtungskorrektur (AEC) mit Mono-Referenz in Stereo-Konferenzräumen meist gut. Abgesehen von hochgradig individualisierten Telepräsenzräumen werden Mikrofone selbst bei Stereo-Codecs selten im Stereobild positioniert. Das Audiosignal der Gegenseite ist fast immer mono, und genau darauf haben wir bei der automatischen Belichtungskorrektur (AEC) unsere Priorität.
Dialoglastige Programmaudiosignale werden wahrscheinlich größtenteils in die Mitte des Lautsprechers gepannt und würden selbst mit einer Mono-AEC-Referenz eliminiert. Falls Restechos des Programmaudios hörbar sind, weisen sie eine geringe Latenz auf und werden vom entfernten Zuhörer eher als zusätzlicher Hall oder dumpfer Klang denn als deutliches Echo wahrgenommen.
Positionsaudio
Positioniertes Audio unterscheidet sich von Stereo dadurch, dass jeder Lautsprecher einen deutlich anderen Kanal wiedergibt. Beispielsweise könnten in einem Telepräsenzraum zwei Codecs an verschiedene Standorte angeschlossen sein und den Ton jedes Standorts über Lautsprecher in der Nähe des jeweiligen Bildschirms wiedergeben. Um in einem solchen System Echos korrekt zu unterdrücken, ist eine automatische Echokompensation (AEC) mit Mehrkanalreferenz erforderlich. Mit einer Mono-AEC-Referenz würde in einem solchen System wahrscheinlich häufig ein Echo auftreten, sobald jemand am anderen Ende zu sprechen beginnt.
Positionsaudio kann funktionieren, wenn jeweils nur eine Lautsprecherposition genutzt wird. Beispielsweise sind Lautsprecher an der Decke oder auf dem Tisch während einer reinen Telefonkonferenz empfehlenswert, da die Teilnehmer vor Ort zur Tischmitte blicken. Bei einer Videokonferenz sind Lautsprecher in der Nähe des Bildschirms besser geeignet. Wird während einer Videokonferenz zusätzlich der Ton des Gegenübers über die Bildschirmlautsprecher wiedergegeben, kann eine Mono-AEC-Referenz beide Szenarien abdecken (allerdings kann zu Beginn eines Anrufs nach dem Umschalten zwischen den beiden Modi ein Echo hörbar sein, bis die AEC-Einstellungen angepasst sind).
Wird der Programmton über andere Lautsprecher als der Ton am anderen Ende wiedergegeben (z. B. Programmton über Frontlautsprecher und Ton am anderen Ende über Deckenlautsprecher), kann es ratsam sein, den Programmton aus der AEC-Referenz auszuschließen. Dies kann zwar zu einem undeutlichen Klang des Programmtons am anderen Ende führen, verursacht aber seltener hörbare Echos.
Raumkombination
Die Raumkombination selbst verursacht keine AEC-Probleme. Erfolgt die Raumkombination jedoch manuell mit Parametersätzen, die Matrix-Kreuzungspunkte anpassen, sind Fehler leicht möglich. Einige der AEC-Referenzen können zusätzliche Fern- oder Programm-Audiosignale enthalten oder benötigte Signale vermissen. Echos sind dann von den zugehörigen Mikrofonen hörbar, und die Fehlersuche kann sehr schwierig sein. Glücklicherweise nimmt der Konferenzraumkombinierer dem Planer diese Last ab und verhindert solche Fehler.
Selbst bei einem korrekt konfigurierten Raumkombinationssystem kann nach einer Änderung der Raumkonfiguration kurzzeitig ein Echo hörbar sein. Dies liegt daran, dass sich der Echopfad zwischen Mikrofon- und Lautsprecherpaaren in verschiedenen Bereichen ändert, und die automatische Echokompensation (AEC) muss anschließend neu eingestellt werden.
Der Echopfad darf keine nichtlineare oder zeitlich veränderliche Verarbeitung enthalten.
Der adaptive Filter des AEC kann nur einen linearen, zeitinvarianten Echopfad modellieren. Jegliche Nichtlinearität oder Zeitvarianz im Echopfad kann die Leistung des AEC erheblich beeinträchtigen. Der Echopfad lässt sich wie folgt beschreiben:
- Jegliche Signalverarbeitung am Lautsprecherausgang, die in der AEC-Referenz nicht vorhanden ist
- Der akustische Pfad zwischen Lautsprecher und Mikrofon (einschließlich Lautsprecher und Mikrofon selbst)
- Jegliche Signalverarbeitung am Mikrofoneingang vor der automatischen Geräuschunterdrückung
Die folgende Abbildung zeigt einen typischen Konferenzraumaufbau. Die Signale, die Teil des Echopfads sind, sind rot hervorgehoben.
Dynamik
Die Dynamikverarbeitung kann ihre Verstärkung ständig ändern. Wird sie im Echopfad angewendet, muss sich die automatische Belichtungssteuerung (AEC) ständig an diese Änderungen anpassen, was die Wahrscheinlichkeit häufiger Restechos erhöht.
Kompressoren/Limiter werden häufig auf Lautsprecherausgänge angewendet, um Übersteuerungen zu vermeiden. Ist eine solche Bearbeitung erforderlich, muss die AEC-Referenz aus dem komprimierten/limitierten Lautsprechersignal erstellt werden (d. h. der AEC-Referenzausgang des CRR bleibt ungenutzt). Liegt ein Stereo-Lautsprechersignal vor, muss es nach der Komprimierung/dem Limiting auf Mono heruntergemischt werden, bevor es an die AEC-Referenz weitergeleitet wird.
Der Versuch, die Dynamikbearbeitung am Lautsprecherausgang durch eine identische Bearbeitung mit denselben Einstellungen vor der AEC-Referenz zu kompensieren, ist möglicherweise nicht zuverlässig. Es besteht das Risiko, dass die beiden Dynamikbearbeitungsblöcke nicht gleichzeitig dieselbe Verstärkung anwenden, insbesondere wenn die Stereo-Mono-Wandlung im CRR zu einem leicht abweichenden Pegel am Mono-Kompressor/Limiter im Vergleich zum Pegel am Stereo-Kompressor/Limiter an den Lautsprecherausgängen führt.
Falls Dynamikbearbeitung bei Mikrofoneingängen erforderlich ist, sollte diese nach der akustischen Belichtungskorrektur (AEC) erfolgen.
Automatische Mikrofonmischung
Automatische Mikrofonmischer ändern häufig die Verstärkung jedes Mikrofonkanals. Beim Umschalten zwischen Mikrofonen verändert sich der Echopfad im Mix drastisch. Es liegt nahe, einen automatischen Mikrofonmischer (AMM) vor einen einzelnen Kanal der automatischen Echounterdrückung (AEC) zu schalten, da die AEC-Ressourcen begrenzt sind. Die Verstärkungsänderungen im Echopfad beeinträchtigen jedoch generell die Leistung der AEC. Daher sollte vor dem AMM ein AEC auf jedes Mikrofonsignal geschaltet werden.
Lautstärkeregler
Die Lautstärkeregelung weist dasselbe Problem wie die Dynamik auf, jedoch seltener. Wird die Lautstärkeregelung im Echopfad angewendet, kann nach einer Lautstärkeänderung durch den Benutzer kurzzeitig ein Restecho hörbar sein.
Verzerrung
Es ist unwahrscheinlich, dass Verzerrungen absichtlich in den Signalweg eines Konferenzsystems eingebracht werden. Eine ungünstige Verstärkungsstruktur oder minderwertige Bauteile können jedoch Verzerrungen im Echopfad verursachen. Diese Verzerrungen lassen sich von der automatischen Belichtungskorrektur (AEC) nicht kompensieren und führen zu einem Restecho. Dieses Echo klingt deutlich verzerrt (viel stärker als das Mikrofonsignal vor der AEC).
Lineare, zeitinvariante Verarbeitung ist (normalerweise) sicher
Jede lineare und zeitunabhängige Signalverarbeitung kann durch den adaptiven Filter des AEC modelliert werden. Lediglich extreme Einstellungen dieser Art von Signalverarbeitung können problematisch sein.
Gewinnen
Eine feste Verstärkung verursacht in der Regel keine Probleme für die automatische Verstärkungsregelung (AEC), es sei denn, es werden extreme Verstärkungseinstellungen (d. h. eine ungünstige Verstärkungsstruktur) verwendet. Häufig liegt das Problem bei ungünstigen Verstärkungseinstellungen eher in den daraus resultierenden Verzerrungen als in der Verstärkung selbst.
Bei manchen Konstruktionen wird im Verstärker eine hohe Verstärkung eingesetzt, und der Lautstärkeregler dämpft das Signal stark. Dies kann zu einem sehr niedrigen Pegel am AEC-Referenzsignal führen, was die Fähigkeit des Doppelsprechdetektors des AEC beeinträchtigen kann, den richtigen Zeitpunkt für die Anpassung zu bestimmen. Idealerweise sollte das AEC-Referenzsignal gute Nennpegel messen, wenn der Lautstärkeregler auf eine angenehme Einstellung eingestellt ist.
Ausgleich
Eine Entzerrung kann im Echopfad in der Regel problemlos angewendet werden. Es ist nicht nötig, die AEC-Referenz auf der entzerrten Version des Signals zu basieren oder eine doppelte Entzerrung auf die AEC-Referenz anzuwenden. Wird die Entzerrung verwendet, um den Frequenzgang von Lautsprecher und Raum zu glätten, ist eine nicht entzerrte AEC-Referenz wahrscheinlich repräsentativer für den Echopfad.
Ebenso sind Filter an Mikrofoneingängen im Allgemeinen unschädlich und können bei Bedarf vor der automatischen Verstärkungsregelung (AEC) eingesetzt werden. In manchen Fällen, beispielsweise bei einem Hochpassfilter (HPF) an einem Mikrofon mit vielen tieffrequenten Störgeräuschen, kann die Anwendung eines Equalizers vor der AEC von Vorteil sein.
Wenn Frequenzweichen verwendet werden, muss die AEC-Referenz das Vollbandsignal empfangen und nicht einen der Ausgänge der Frequenzweiche.
Wenn der Equalizer eine starke Verstärkung anwendet, kann die automatische Geräuschunterdrückung (AEC) möglicherweise etwas besser funktionieren, wenn diese Verstärkung in der AEC-Referenz berücksichtigt wird.
Delay
Eine geringfügige Verzögerung im Echopfad stellt für die automatische Echokompensation (AEC) kein Problem dar. Eine gewisse Verzögerung ist naturgemäß durch die Entfernung zwischen Lautsprecher und Mikrofon sowie die Audiopufferung im System bedingt.
Eine übermäßige Verzögerung (mehr als einige zehn Millisekunden) kann für die automatische Belichtungskorrektur (AEC) problematisch sein. Sie reduziert die verfügbare Nachlauflänge des adaptiven Filters der AEC und kann zudem den Doppelsprechdetektor der AEC beeinträchtigen, indem sie die zeitliche Ausrichtung von Referenzsignal und Echo der AEC stört.
Verzögerungen im Echopfad werden nicht zwangsläufig vom Entwickler hinzugefügt. Viele Displays fügen eine Verzögerung (manchmal mehr als 100 ms) zur Lippensynchronisation hinzu. Um dies zu kompensieren, kann es erforderlich sein, die AEC-Referenz zusätzlich zu verzögern.
Es ist darauf zu achten, dass die Verzögerung vor dem AEC-Referenzsignal nicht größer ist als die im Echopfad vorhandene. Andernfalls wird das Echo nicht kausal (es trifft vor dem Referenzsignal ein), was vom AEC nicht modelliert werden kann und zu einem hörbaren Echo am entfernten Ende führt.