提案

特徴

AEC – リファレンス詳細ガイド

音響エコーキャンセレーション(AEC)リファレンスの正しいルーティングと処理は、会議室でのエコーを防ぐために非常に重要です。また、会議室設計の最も難しい側面の一つでもあります。

会議室ルーター(CRR)は、AEC参照が正しく行われることを保証するために大きな役割を果たします。しかし、CRRの外部での処理がAEC参照にどのような影響を与えるかについては、しばしば疑問があり、CRRを使用せずにAECを使用する設計もあるかもしれない。

以下は、優れた会議室設計におけるAECリファレンスの使用原則と、一般的な用途に関するアドバイスである。

リファレンスには正しい信号が含まれていなければならない

一般的に、AECリファレンスは、スピーカーから再生されるすべてのファーエンドオーディオとプログラムオーディオのミックスを受信する必要があります。さらに、部屋のすべてのスピーカーが同じミックスを再生する必要があります。

リファレンスから消えた信号

信号が AEC リファレンスにない場合、AEC はそれをキャンセルしません。ファーエンドの入力と AEC リファレンスの間のマトリックス・クロスポイントが誤ってミュートされた場合、そのファーエンドからエコーが聞こえますが、ローカルの部屋では問題は目立ちません。これはよくある落とし穴で、CRR はこれを防ぎます。

リファレンスからプログラムオーディオが欠落している場合、ファーエンドはプログラムオーディオ(ファーエンドに送られたプログラムオーディオのダイレクトミックスと、マイクによってローカルに拾われたものを含む)の濁ったバージョンや残響バージョンを聞くかもしれません。これは、ファーエンドからのエコーよりは深刻ではありませんが、それでも理想的ではありません。ほとんどの場合、番組音声を AEC リファレンスに含めることが望ましいです。ただし、ポジションオーディオの場合は例外です。

リファレンスの余分なシグナル

信号が AEC リファレンスに送られ、スピーカーから再生されない場合、信号がアクティブになるたびに AEC が発散する可能性がある。AEC は、エコーのない信号経路に収束し、(AEC リファレンスに属する)ファーエンド信号がアクティブになると、再収束する必要があります。

ボイスリフト

ボイスリフトシステムのゲイン・ビフォア・フィードバックを改善するために、マイク信号をAECリファレンスに入れる設計者もいる。このようなことをするメリットは疑問ですが、部屋によってはうまくいくかもしれません。他のケースでは、AEC のハウリング低減動作に一貫性がなかったり、ダブルトークの際にファーエンドで残留エコーが聴こえたりする可能性があります。

ほとんどの場合、ボイスリフトにはプリ AEC のマイク信号を使用し、マイクを AEC のリファレンスから外すことが望ましい。こうすることで、ローカル・リインフォースメントのレイテンシーが最も低くなり、AECとの間に問題は生じません。

ステレオ

モノラルAECリファレンスにおけるステレオ信号は、理論的には問題である。ステレオ信号が大きく分離している場合、左右のスピーカーから著しく異なる信号が再生される。左右のスピーカーとマイクロホン間のエコー経路は異なるインパルス応答を持っており、モノラルAECはその両方に同時に収束することはできません。ステレオ・リファレンスを持つ AEC は、これを適切に処理するように設計されていますが、モノラル AEC はそうではありません。

実際には、モノラルのリファレンスを持つAECは、ステレオの会議室でもたいていの場合うまく機能する。高度にカスタマイズされたテレプレゼンスルームを除けば、ステレオコーデックに送 られてもマイクがパンされることはほとんどありません。ファーエンドオーディオはほとんどの場合モノラルで、ファーエンドオーディオはAECの最大の関心事です。

ダイアログを多用する番組音声は、そのエネルギーの殆どがセンターにパンされる可能性が高く、 モノラル AEC リファレンスでもキャンセルされるでしょう。番組音声からの残留エコーが聴こえる場合、それはレイテンシーが低く、ファーエンドでは明瞭なエコーとし てではなく、付加的な残響や濁りとして知覚される可能性が高い。

ポジション・オーディオ

ポジショナルオーディオはステレオとは異なり、それぞれのスピーカーが明確に異なるチャンネルを再生します。例えば、テレプレゼンス・ルームでは、2つのコーデックが異なるサイトに接続され、対応するディスプレイの近くのスピーカーから、それぞれのサイトの音声が再生されます。このようなシステムでエコーを適切にキャンセルするには、マルチチャンネル・リファレンスを備えたAECが必要です。モノラルのAECリファレンスでは、このタイプのシステムでは、異なるファーエンドの誰かが話し始めると、エコーが頻繁に聞こえる可能性があります。

ポジショナルオーディオは、一度に1つのスピーカーポジションしか使用しない場合、機能する可能性があります。たとえば、音声のみの会議では、参加者がテーブルの中央を向くので、天井やテーブルのスピーカーが好まれるかもしれません。ビデオ会議では、ディスプレイ近くのスピーカーが好ましい。ビデオ会議中に、音声のみのファーエンドオーディオもディスプレイのスピーカーにレンダリングされる場合、モノラルAECリファレンスは両方のシナリオに対応できます(ただし、2つのモードを切り替えた後、通話開始時にAECが収束するまで、エコーが聞こえる可能性があります)。

プログラムオーディオがファーエンドオーディオと異なるスピーカーでレンダリングされる場合(例えば、プログラムオーディオはフロントスピーカーから、ファーエンドオーディオはシーリングスピーカーから)、プログラムオーディオをAECリファレンスから外す方が望ましいかもしれません。この場合、ファーエンドから聴こえるプログラムオーディオは濁ってしまいますが、聴こえるエコーが発生する可能性は低くなります。

ルーム・コンビネーション

ルームコンバイニング自体はAECの問題の原因ではない。しかし、マトリクスクロスポイントを調整するパラメータセットを使ってルームコンバイニングを手作業で行う場合、ミスが起こりやすい。AECリファレンスの中には、余分なファーエンド信号やプログラムオーディオ信号が含まれていたり、必要な信号が欠落していたりする可能性があります。関連するマイクからはエコーが聞こえ、問題を診断するのは非常に難しいでしょう。幸いなことに、会議室コンバイナーは設計者からこの負担を取り除き、この種のミスを防ぎます。

適切に設定されたルームコンバインシングシステムでも、ルームコンフィギュレーションが変わると、エコーが短時間聞こえることがあります。この場合、異なるパーティションにあるマイクロホンとスピーカーのペア間のエコー経路が変化するため、AECはこの後に再コンバージョンを行う必要があります。

エコー経路に非線形処理や時変処理が含まれてはならない

AEC の適応フィルタは、線形で時間不変のエコー経路しかモデル化できない。エコー経路に非線形なものや時間的に変化するものがあると、AEC の性能が著しく損なわれる。エコー経路は次のように記述できる。

  • AECリファレンスにはないスピーカー出力の処理
  • スピーカーとマイクロホンの間の音響経路(スピーカーとマイクロホン自体を含む)
  • AECの前に、マイク入力に対するあらゆる処理を行う。

典型的な会議室の設計を下図に示します。エコー経路の一部となる信号は、赤で強調表示されています。

エコー・パスには非線形または時間変化する処理を含んではならない。

ダイナミクス

ダイナミクス処理は、そのゲインを常に変化させる可能性がある。エコー経路に適用した場合、AECはこれらの変化に常に再適応しなければならず、残留エコーが頻発する可能性が高い。

コンプレッサー/リミッターは、クリッピングを防ぐためにスピーカー出力に適用されることが多い。そのような処理が必要な場合、AECリファレンスは、コンプレッサー/リミッター後のスピーカー信号から作成されなければならない(つまり、CRRのAECリファレンス出力は未使用となる)。スピーカー信号がステレオの場合、圧縮/制限後にモノラルにミックスダウンしてからAECリファレンスに渡す必要があります。

スピーカー出力のダイナミック処理を、AECリファレンスの前に同じ設定で同じ処理を配置することで補正しようとすると、信頼性が低くなる可能性があります。2つのダイナミクス処理ブロックが同時に同じゲインを適用しないリスクもあります。特に、CRRでステレオからモノラルに変換した場合、スピーカー出力のステレオ・コンプレッサー/リミッターで見たレベルとモノラル・コンプレッサー/リミッターで見たレベルがわずかに異なることがあります。

ダイナミック・フィギュア

マイク入力にダイナミクスが必要な場合は、ポストAECで適用する。

自動マイク・ミキシング

自動マイクミキサーは、各マイクチャンネルのゲインを頻繁に変更します。自動マイクミキサーは、各マイクチャンネルのゲインを頻繁に変更しますが、マイクを切り替えると、ミックス中のエコー経路が大きく変化します。AEC のリソースは限られているので、AMM を 1 つの AEC チャンネルの前に置きたくなる。しかし、エコー経路のゲイン変化によって、AEC は一般的にパフォーマンスが低下します。AEC は、AMM の前の各マイク信号に配置する必要があります。

ボリューム・コントロール

ボリュームコントロールは、ダイナミクスと同じ問題がありますが、発生頻度は低くなります。エコー経路にボリュームコントロールが適用されている場合、ユーザーがボリュームを変更した後、残留エコーが短時間聞こえることがあります。

ディストーション

会議システムの信号経路に意図的に歪みを導入することは考えにくい。悪い利得構造や質の悪い部品は、エコー経路に歪みをもたらす可能性があります。この歪みは AEC ではモデリングできず、残留エコーの原因となります。このエコーは明らかに歪んで聞こえます(AEC 以前のマイク信号よりもはるかに歪んでいます)。

線形、時間不変処理は(通常は)安全である

線形で時間不変な処理であれば、AECの適応フィルターでモデル化できる。問題になるのは、この種の処理の極端な設定だけかもしれない。

ゲイン

極端なゲイン設定(つまり、貧弱なゲイン構造)が使用されない限り、固定ゲインでAECに問題が生じることは通常ありません。多くの場合、悪いゲイン設定によって引き起こされる問題は、ゲインそのものではなく、結果として生じる歪みによるものです。

設計によっては、アンプで大きなゲインが適用され、ボリューム・コントロールで信号が大きく減衰します。その結果、AECリファレンスでのレベルが非常に低くなり、AECのダブルトーク検出器がいつ適応すべきかを判断する能力に影響を与える可能性があります。理想的には、ボリューム・コントロールが快適な設定になっているときに、AECリファレンスで良好な公称レベルが確認されるべきです。

イコライゼーション

イコライゼーションは、通常、エコー・パス内で問題なく適用できる。イコライズされた信号の AEC リファレンスをベースにしたり、AEC リファレンスに重複した EQ を適用する必要はありません。もし EQ がスピーカーや部屋のレスポンスをフラットにするために使用されるのであれば、イコライジング されていない AEC リファレンスの方が、おそらくエコー経路を代表するものである。

同様に、マイク入力のフィルターは一般的に無害であり、必要に応じてプリ AEC を適用することができます。低域ノイズの多いマイクにHPFをかけるなど、EQをプリAECでかけると効果的な場合もあります。

クロスオーバーを使用する場合、AECリファレンスはフルバンド信号を受信しなければならず、クロスオーバー出力の1つを受信してはならない。

EQが多くのブーストをかけている場合、AECのリファレンスにそのブーストが考慮されていれば、AECの方がわずかに性能が良くなるかもしれない。

ディレイ

エコー経路に若干の遅延があっても、AEC では問題ありません。スピーカーとマイクの距離や、システム内の音声バッファリングにより、ある程度の遅延は当然存在します。

過度の遅延(数十ミリ秒以上)はAECにとって問題となる。遅延は、AEC の適応フィルタの利用可能なテール長を減少させる効果がある。また、AEC のリファレンスとエコーのタイムアライメントを歪めることで、AEC のダブルトーク検出器を混乱させることもあります。

エコー経路の遅延は、必ずしもデザイナーが加えるとは限らない。多くのディスプレイは、リップシンクのためにディレイ(時には 100 ms 以上)を加えます。これを補正するために、AECリファレンスのみにディレイを追加する必要があるかもしれません。

AEC 基準の前に、エコー経路に存在する以上の遅延を挿入しないように注意しなければならない。これは、エコーが非因果的(エコーがリファレンスより前に到着する)であることを引き起こし、AEC によってモデル化することができず、遠端に可聴エコーを引き起こす。