提案

トップ

AEC - 基礎

アコースティック・エコー・キャンセレーション(AEC)は、電話会議の相手側参加者に自分の声が反響して聞こえるのを防ぎます。電話や電話会議では、ニアエンドとファーエンドがあります。ニアエンドは自分の位置で、ファーエンドは通話に参加している相手の位置です。それぞれの場所に、少なくともマイクとスピーカーが1つずつあります。

AECの基本ステップ1

あなたが話すと、マイクがあなたの声を拾い、それが遠端に送信され、遠端のスピーカーがあなたの声を聞くことができます。遠端が話すと、遠端のマイクと近端のスピーカーによって、遠端で話されていることが聞こえます。

AECの基本ステップ2

常に1つの部屋のマイクだけがオンになっていれば問題はない。これは半二重通信と呼ばれ、あまり満足のいくものではありません。相手が話しているときは、各人のマイクはミュートされます。そのため、自分が話している間、相手側の声は聞こえず、自分が言いたいことを挟んだり、説明を求めたりしたい場合、相手が話している間、自分のマイクがミュートされているため、相手が話を止めるまで、相手側とコミュニケーションをとる方法がないことになります。このような理由から、ほとんどの場合、半二重会議は受け入れられません。

この問題は、両方のマイクを同時にオンにした場合に発生します。これを全二重会議と呼びます。遠端が話し始めると、遠端の話し手は遠端マイクで拾われ、近端スピーカーに送られます。そして、近端スピーカーの音声は近端マイクで拾われ、再び遠端スピーカーに送られます。これは最初は問題に思えないかもしれませんが、アナログ回線を使った電話の往復遅延は通常少なくとも80~100ミリ秒です。VoIP通話はさらに長いレイテンシーを持ち、ビデオ会議のレイテンシーは1秒以上になることがよくあります。つまり、相手側の話者が話すたびに自分の声がエコーバックされることになり、このエコーによって通信がほとんど不可能になるのだ。

AECの基本ステップ3

オーディオ信号は、それ自身の反転バージョンとミックスすることで消去することができるので、スピーカーから出てくる音をマイクに無視させることは可能なはずです。スピーカに送られる音声信号がどのようなものか、私たちは正確に知っています。しかし、それはマイクが拾った音声とは正確には一致しません。スピーカーから出てきた音声は、部屋の表面によって何度も反射され、これらの反射がマイクに到達するタイミングはそれぞれ異なります。それぞれの反射は、部屋の様々な表面や物体によって、異なる周波数が吸収されたりブロックされたりしています。それぞれの反射音は、元の信号や他の信号とは全く異なる音に聞こえます。

AECの基本ステップ4

マイク信号からスピーカー音声を除去するために、AEC アルゴリズムはまず、スピーカー音声がマイクに到達したときにどのように聞こえるかを把握する必要があります。AEC アルゴリズムは、マイク音声とスピーカーに送られる音声を比較し、部屋のインパルス応答を生成します。このルームインパルス応答が、マイク信号からスピーカー音声を除去するフィルタの基となります。