• Espressifの音響フロントエンドアルゴリズム

    Espressif SoCで音声ユーザーインターフェースを
    実現する高性能音響アルゴリズム

ノイズの多い遠距離環境でも優れた音声インタラクション性能を実現するためには、スマート音声デバイスにおける音響フロントエンド(Audio Front-End、AFE)アルゴリズムが不可欠です。EspressifのAIラボでは、独自開発のAFEアルゴリズムフレームワークを提供しており、高性能なESP32およびESP32-S3 SoC上で音響信号処理を実行することが可能です。これにより、ユーザーは高品質かつ安定した音声データを取得でき、優れた性能と高いコストパフォーマンスを両立するスマート音声製品の構築が可能となります。

AEC
BSS
NS
WakeNet

音響エコーキャンセレーション

音響エコーキャンセレーション(Acoustic Echo Cancellation, AEC)アルゴリズムは、適応フィルタを用いて、マイク入力時に発生するエコー成分を除去する技術です。このアルゴリズムは、スマート音声デバイスがスピーカーで音声を再生しながら、マイクで音声を同時に収音するようなシナリオに適しています。

ブラインドソースセパレーション (BSS)

ブラインドソースセパレーション(Blind Source Separation, BSS)アルゴリズムは、複数のマイクロフォンを用いて音源の方向を推定し、特定の方向からの音声信号を強調する技術です。このアルゴリズムにより、ノイズの多い環境下でも目的とする音声ソースの音質を向上させることが可能です。

ノイズリダクション(NS)

ノイズリダクション アルゴリズムは、単一チャネルの音声信号処理に対応しており、掃除機やエアコンの動作音など、不要な非音声ノイズを効果的に除去します。これにより、処理対象となる音声信号の明瞭度と品質が大幅に向上します。

ウェイクワードエンジン(WakeNet)

WakeNetは、Espressifが独自に開発した高性能かつ低リソース消費のウェイクワード検出アルゴリズムであり、「Alexa」「ハイ、Espressif」「Hi, ESP」などのウェイクワードに対して素早く反応することができます。

アルゴリズムの特長

優れた音響性能

EspressifのAFEアルゴリズムは、Amazon Alexaのファーフィールド音声認識テストに合格しています。 本アルゴリズムには、Espressif独自開発のウェイクワードエンジン「WakeNet」が搭載されており、Amazonの多言語テスト要件にも対応可能です。

低リソース消費

EspressifのAFEアルゴリズムは、ESP32-S3 SoCに搭載されたAIアクセラレータ向けに最適化されており、わずか約22%のCPU使用率、48 KBのSRAM、1.1 MBのPSRAMしか消費しません。 これにより、ESP32-S3をベースとしたお客様のアプリケーションにおいても、十分なリソースを確保することが可能です。

柔軟な製品設計

EspressifのAFEアルゴリズムは、シンプルかつ直感的なAPIインターフェースを提供しており、お客様は製品要件に応じて性能を動的に調整することが可能です。また、20~80mmのマイク間隔に対応しており、ハードウェア設計においても高い柔軟性を実現します。

Amazon認証取得済みのAFEソリューション

EspressifのAFEアルゴリズムは、Amazon Alexa内蔵デバイス向けのAudio Front-End(AFE)認証に合格しています。本アルゴリズムは、ESP32-S3に搭載されたAIアクセラレータ向けに最適化されており、ハードウェアと組み合わせることで、わずか2つのマイクだけで360度の音声収音が可能です。