AEC – Leitfaden zum Thema AEC-Referenz

Gilt für:

ControlSpace EX-1280C Audiokonferenzprozessor

Die korrekte Weiterleitung und Verarbeitung der Acoustic Echo Cancellation (AEC)-Referenz ist entscheidend für die Vermeidung von Echos in Konferenzräumen. Dies ist auch einer der schwierigsten Aspekte bei der Gestaltung von Konferenzräumen.

Der Conference Room Router (CRR) trägt wesentlich dazu bei, dass der AEC-Bezug korrekt hergestellt wird. Es gibt jedoch häufig Fragen dazu, wie sich die Verarbeitung außerhalb des CRR auf den AEC-Bezug auswirkt, und es kann Entwürfe geben, die AEC ohne Verwendung des CRR nutzen.

Im Folgenden finden Sie einige Grundsätze für die Verwendung der AEC-Referenz bei der Gestaltung von Konferenzräumen und einige Ratschläge für gängige Anwendungen.

Die Referenz muss die korrekten Signale enthalten

Im Allgemeinen sollte die AEC-Referenz eine Mischung aus allen Fernbedienungs- und Programmtönen erhalten, die über die Lautsprecher wiedergegeben werden. Außerdem sollten alle Lautsprecher im Raum die gleiche Mischung wiedergeben.

Signale, die in der Referenz fehlen

Wenn sich ein Signal nicht in der AEC-Referenz befindet, wird der AEC es nicht auslöschen. Wenn ein Matrix-Kreuzungspunkt zwischen einem Eingang der Gegenseite und der AEC-Referenz fälschlicherweise stummgeschaltet wird, ist das Echo von der Gegenseite zu hören, aber das Problem wird im lokalen Raum nicht wahrnehmbar sein. Dies ist ein häufiger Fallstrick, den die CRR verhindert.

Wenn das Programm-Audio in der Referenz nicht vorhanden ist, kann die Gegenseite eine vermatschte oder hallige Version des Programm-Audios hören (einschließlich der direkten Mischung des Programm-Audios, das an die Gegenseite gesendet wird, zusammen mit dem, was lokal von den Mikrofonen aufgenommen wird). Dies ist weniger schlimm als ein Echo von der Gegenseite, aber immer noch nicht ideal. In den meisten Fällen ist es besser, den Programmton in die AEC-Referenz aufzunehmen. Eine Ausnahme hiervon ist der Fall des Positionaltons, der weiter unten beschrieben wird.

Zusatzsignale in der Referenz

Wenn ein Signal an die AEC-Referenz gesendet, aber nicht aus dem Lautsprecher wiedergegeben wird, kann die AEC abschweifen, wenn das Signal aktiv ist. Die AEC konvergiert zu einem Signalpfad ohne Echo und muss erneut konvergieren, wenn ein Signal der Gegenseite (das zur AEC-Referenz gehört) aktiv wird.

Sprachaufzug

Einige Designer setzen Mikrofonsignale in ihre eigenen AEC-Referenzen ein, um die Verstärkung vor der Rückkopplung in Voice-Lift-Systemen zu verbessern. Der Nutzen dieser Maßnahme ist fraglich, könnte aber in einigen Räumen gut funktionieren. In anderen Fällen könnte die Rückkopplungsreduzierung des AEC inkonsistent sein, oder ein Restecho könnte bei Doppelgesprächen an der Gegenseite hörbar sein.

In den meisten Fällen ist es vorzuziehen, die Mikrofonsignale vor der AEC für die Stimmanhebung zu verwenden und die Mikrofone aus den AEC-Referenzen herauszulassen. Dies bietet die geringste Latenz für die lokale Verstärkung und verursacht keine Probleme mit der AEC.

Stereo

Stereosignale in einer Mono-AEC-Referenz sind theoretisch ein Problem. Wenn das Stereosignal eine starke Trennung aufweist, werden deutlich unterschiedliche Signale von den linken und rechten Lautsprechern wiedergegeben. Der Echopfad zwischen den linken und rechten Lautsprechern und dem Mikrofon hat unterschiedliche Impulsantworten, und ein Mono-AEC kann nicht auf beide gleichzeitig konvergieren. Ein AEC mit einer Stereoreferenz ist dafür ausgelegt, dies richtig zu handhaben, ein Mono-AEC hingegen nicht.

In der Praxis wird ein AEC mit einer Monoreferenz die meiste Zeit in einem Stereokonferenzraum gut funktionieren. Außer in hochgradig angepassten Telepräsenzräumen werden Mikrofone selten geschwenkt, selbst wenn sie an Stereo-Codecs gesendet werden. Der Ton auf der Gegenseite ist fast immer mono, und der Ton auf der Gegenseite ist unser Hauptanliegen für AEC.

Bei dialoglastigem Programmton ist der größte Teil der Energie wahrscheinlich in die Mitte verlagert und würde selbst bei einer Mono-AEC-Referenz ausgelöscht werden. Wenn ein Restecho von Programmtönen hörbar ist, hat es eine geringe Latenz und wird von der Gegenseite wahrscheinlich eher als zusätzlicher Nachhall oder Unschärfe wahrgenommen als ein deutliches Echo.

Positionsbezogenes Audio

Positional Audio unterscheidet sich von Stereo dadurch, dass jeder Lautsprecher einen deutlich anderen Kanal wiedergibt. In einem Telepräsenzraum könnten beispielsweise zwei Codecs an verschiedenen Standorten angeschlossen sein und die Audiosignale von jedem Standort aus Lautsprechern in der Nähe des jeweiligen Displays wiedergeben. Ein AEC mit einer mehrkanaligen Referenz ist erforderlich, um das Echo in dieser Art von System richtig zu unterdrücken. Mit einer Mono-AEC-Referenz wäre bei dieser Art von System wahrscheinlich häufig ein Echo zu hören, wenn jemand an einem anderen entfernten Ende zu sprechen beginnt.

Positional Audio kann möglicherweise funktionieren, wenn jeweils nur eine Lautsprecherposition verwendet wird. Bei einer reinen Sprachkonferenz können beispielsweise Lautsprecher an der Decke oder am Tisch bevorzugt werden, da die Teilnehmer vor Ort in die Mitte des Tisches blicken werden. Bei einer Videokonferenz werden Lautsprecher in der Nähe des Bildschirms bevorzugt. Wenn während einer Videokonferenz auch der Ton der Gegenseite an die Display-Lautsprecher übertragen wird, kann eine Mono-AEC-Referenz beide Szenarien abdecken (obwohl ein Echo hörbar sein kann, bis das AEC zu Beginn eines Anrufs nach dem Wechsel zwischen den beiden Modi konvergiert).

Wenn der Programmton auf anderen Lautsprechern wiedergegeben wird als der Ton der Gegenseite (z.B. der Programmton auf den Frontlautsprechern und der Ton der Gegenseite auf den Deckenlautsprechern), kann es besser sein, den Programmton aus der AEC-Referenz herauszulassen. Dies kann dazu führen, dass der Programmton von der Gegenseite nur noch undeutlich zu hören ist, aber es ist weniger wahrscheinlich, dass ein hörbares Echo entsteht.

Zimmer-Kombination

Die Raumkombination selbst ist keine Ursache für AEC-Probleme. Wenn die Raumkombination jedoch von Hand mit Parametersätzen durchgeführt wird, die Matrix-Kreuzungspunkte anpassen, können leicht Fehler gemacht werden. Einige der AEC-Referenzen können leicht zusätzliche Far-End- oder Programm-Audiosignale enthalten, oder es fehlen erforderliche Signale. Von den zugehörigen Mikrofonen wird ein Echo hörbar sein, und das Problem könnte sehr schwer zu diagnostizieren sein. Glücklicherweise nimmt der Conference Room Combiner dem Planer diese Last ab und verhindert diese Art von Fehlern.

Selbst bei einem richtig konfigurierten Raumkombinierungssystem kann nach einer Änderung der Raumkonfiguration kurzzeitig ein Echo hörbar sein. Dadurch ändert sich der Echopfad zwischen Mikrofon- und Lautsprecherpaaren in verschiedenen Trennwänden, und das AEC muss nach diesem Vorgang erneut konvergieren.

Der Echopfad darf keine nichtlineare oder zeitvariable Verarbeitung enthalten

Der adaptive Filter des AEC kann nur einen linearen, zeitlich unveränderlichen Echopfad modellieren. Alles, was im Echopfad nichtlinear oder zeitvariabel ist, kann die Leistung des AEC stark beeinträchtigen. Der Echopfad kann wie folgt beschrieben werden

Jegliche Verarbeitung am Lautsprecherausgang, die nicht auf der AEC-Referenz vorhanden ist
Der akustische Weg zwischen dem Lautsprecher und dem Mikrofon (einschließlich des Lautsprechers und des Mikrofons selbst)
Jegliche Bearbeitung des Mikrofoneingangs vor der AEC

Ein typischer Konferenzraum ist in der folgenden Abbildung dargestellt. Die Signale, die Teil des Echopfads sind, sind rot hervorgehoben.

Der Echopfad darf keine nichtlineare oder zeitvariable Verarbeitung enthalten Abbildung

Dynamics

Die Dynamikverarbeitung kann ihre Verstärkung ständig ändern. Wenn sie im Echopfad angewendet wird, muss sich die AEC ständig an diese Änderungen anpassen, wodurch die Möglichkeit eines häufigen Restechos besteht.

Kompressoren/Begrenzer werden oft auf Lautsprecherausgänge angewendet, um Clipping zu verhindern. Wenn eine solche Verarbeitung erforderlich ist, muss die AEC-Referenz aus dem Lautsprechersignal nach der Kompression/Begrenzung erzeugt werden (was bedeutet, dass der AEC-Referenzausgang des CRR unbenutzt wäre). Wenn das Lautsprechersignal Stereo ist, muss es nach der Kompression/Begrenzung auf Mono heruntergemischt werden, bevor es an die AEC-Referenz weitergeleitet wird.

Der Versuch, die Dynamikverarbeitung am Lautsprecherausgang zu kompensieren, indem die gleiche Verarbeitung mit den gleichen Einstellungen vor der AEC-Referenz platziert wird, funktioniert möglicherweise nicht so zuverlässig. Es besteht ein gewisses Risiko, dass die beiden Dynamikverarbeitungsblöcke nicht die gleiche Verstärkung zur gleichen Zeit anwenden, insbesondere wenn die Umwandlung von Stereo in Mono in der CRR dazu führt, dass an einem Monokompressor/Limiter ein etwas anderer Pegel erscheint als bei einem Stereokompressor/Limiter an den Lautsprecherausgängen.

Wenn für die Mikrofoneingänge eine Dynamik benötigt wird, sollte sie nach der AEC angewendet werden.

Automatische Mikrofonabmischung

Automatische Mikrofonmischer ändern häufig die Verstärkung der einzelnen Mikrofonkanäle. Wenn sie zwischen den Mikrofonen umschalten, verändert dies den Echopfad in der Mischung drastisch. Es ist verlockend, einen AMM vor einen einzelnen AEC-Kanal zu setzen, da die AEC-Ressourcen begrenzt sind. Die Verstärkungsänderungen im Echopfad führen jedoch dazu, dass der AEC im Allgemeinen eine schlechte Leistung erbringt. Ein AEC sollte auf jedes Mikrofonsignal vor dem AMM gelegt werden.

Lautstärkeregelung

Bei der Lautstärkeregelung tritt das gleiche Problem wie bei der Dynamik auf, allerdings weniger häufig. Wenn die Lautstärkeregelung im Echopfad angewendet wird, kann das Restecho kurzzeitig hörbar sein, nachdem der Benutzer die Lautstärke geändert hat.

Verzerrung

Es ist unwahrscheinlich, dass Verzerrungen absichtlich in den Signalweg eines Konferenzsystems eingeführt werden. Eine schlechte Verstärkungsstruktur oder minderwertige Komponenten könnten Verzerrungen in den Echopfad einbringen. Die Verzerrung kann von der AEC nicht modelliert werden und verursacht ein Restecho. Dieses Echo klingt deutlich verzerrt (viel stärker als das Mikrofonsignal vor dem AEC).

Lineare, zeitinvariante Verarbeitung ist (normalerweise) sicher

Jede Verarbeitung, die linear und zeitinvariant ist, kann durch den adaptiven Filter des AEC modelliert werden. Nur extreme Einstellungen dieser Art von Verarbeitung können ein Problem darstellen.

Gewinnen

Eine feste Verstärkung verursacht normalerweise keine Probleme für das AEC, es sei denn, es werden extreme Verstärkungseinstellungen (d.h. eine schlechte Verstärkungsstruktur) verwendet. Das Problem, das durch schlechte Gain-Einstellungen verursacht wird, liegt oft in der resultierenden Verzerrung und nicht in der Verstärkung selbst.

In einigen Designs wird im Verstärker eine große Verstärkung angewendet, und der Lautstärkeregler dämpft das Signal stark ab. Dies kann zu einem sehr niedrigen Pegel an der AEC-Referenz führen, was die Fähigkeit des AEC-Doppelsprechdetektors beeinträchtigen kann, zu bestimmen, wann er sich anpassen muss. Idealerweise sollte die AEC-Referenz einen guten Nennpegel aufweisen, wenn der Lautstärkeregler auf eine angenehme Einstellung eingestellt ist.

Entzerrung

Die Entzerrung kann normalerweise im Echopfad angewendet werden, ohne Probleme zu verursachen. Es besteht keine Notwendigkeit, die AEC-Referenz auf die entzerrte Version des Signals zu beziehen oder einen doppelten EQ auf die AEC-Referenz anzuwenden. Wenn der EQ verwendet wird, um die Lautsprecher- und Raumantwort zu glätten, ist eine nicht entzerrte AEC-Referenz wahrscheinlich repräsentativer für den Echopfad.

Ebenso sind Filter an Mikrofoneingängen im Allgemeinen unbedenklich und können auf Wunsch vor der AEC angewendet werden. In einigen Fällen, z. B. bei einem HPF an einem Mikrofon mit viel tieffrequentem Rauschen, kann die Anwendung eines EQ vor der AEC von Vorteil sein.

Wenn Frequenzweichen verwendet werden, muss die AEC-Referenz das Vollbandsignal empfangen und nicht einen der Frequenzweichenausgänge.

Wenn der EQ eine starke Anhebung vornimmt, kann die AEC etwas besser abschneiden, wenn diese Anhebung in der AEC-Referenz berücksichtigt wird.

Delay

Eine geringfügige Verzögerung im Echopfad ist für das AEC kein Problem. Eine gewisse Verzögerung ist aufgrund des Abstands zwischen Lautsprecher und Mikrofon und der Audiopufferung im System natürlich vorhanden.

Eine übermäßige Verzögerung (mehr als ein paar Dutzend Millisekunden) kann ein Problem für den AEC darstellen. Die Verzögerung führt dazu, dass die verfügbare Schwanzlänge des adaptiven Filters des AEC reduziert wird. Sie kann auch den Double-Talk-Detektor des AEC verwirren, indem sie die zeitliche Ausrichtung der AEC-Referenz und des Echos verzerrt.

Die Verzögerung im Echopfad wird nicht unbedingt vom Designer hinzugefügt. Viele Displays fügen eine Verzögerung (manchmal mehr als 100 ms) für die Lippensynchronisation hinzu. Die Hinzufügung einer Verzögerung nur zur AEC-Referenz kann notwendig sein, um dies zu kompensieren.

Es muss darauf geachtet werden, dass vor der AEC-Referenz nicht mehr Verzögerung eingefügt wird, als im Echopfad vorhanden ist. Dies führt dazu, dass das Echo nicht kausal ist (das Echo kommt vor der Referenz an), was von der AEC nicht modelliert werden kann und ein hörbares Echo an der Gegenseite verursacht.