音声処理
エッジでの音声処理を実現する包括的なソフトウェア。
お客様の素早い設計とより早い製品化を実現する、技術情報と専門知識をご紹介します。
重要: このページには 当社の製品に関するセキュア情報が 記載されています サインイン 承認されたリソースにアクセスします。
重要: このページには当社製品に関する安全な情報が記載されています。
セキュア情報を表示する重要: セキュアなコンテンツを表示するには認証が必要です。
パスワードの再入力エッジでの音声処理を実現する包括的なソフトウェア。
NXPは、ヒューマン・ツー・ヒューマン (H2H) およびヒューマン・ツー・マシン (H2M) のローカル音声アプリケーション向けの高品質で信頼性の高い組込み音声処理を実現する、音声制御、オーディオと通信用ソフトウェアおよびソリューションを幅広く提供しています。NXPの音声通信ソフトウェア製品は、NXPのMCU、MPU、DSPポートフォリオで動作する省フットプリントで低消費電力のアプリケーション向けに設計されています。
再生およびチューニング用の高度なオーディオ・ツール:イコライザ、3Dサウンド、低音域/高音域エンハンスメント、リミッタ、ステレオPCMのサポート。
ハイパス・フィルタリング、ビームフォーミング、アコースティック・エコー・キャンセルにより、ウェイクワード、ASR、AIチャット向けに最適化されています。
エンド・ツー・エンドの音声AI:ウェイクワード検出、ASR、コンテキスト・アウェアな応答のためのRAG強化型LLM、自然な音声出力のためのTTS。
完全なAIパイプライン:ウェイクワード検出、ASR、スマート応答用のRAG強化型LLM、TTS出力、マニュアルからのチャットボットのファインチューニング。
包括的な音声ソリューション:ウェイクワード検出、音声コマンド、speech-to-intent (S2I)、ASR書き起こし、TTS変換。
小規模および大規模AIモデルを使用したスマート・ノイズ・リダクションやエコー・キャンセルにより、一方向または全二重通信でのクリアな音声を実現。
|
NXPは、人間と機械の音声処理に対応する信頼性の高い音声、オーディオ、および通信ソリューションを提供します。 |
ファクト・シート |
2023年9月19日 |
Rev 1 |
VITウェイクワードおよび音声コマンド・エンジンには、オンライン・ツールおよびNXPのMCUXpresso SDKからアクセスできます。VIT Speech to Intentについては、リクエストの内容を記載し、voice@nxp.comまで電子メールでお問い合わせください。
はい。NXPのアプリケーション・ソフトウェア・パックまたはアプリケーション・コード・ハブのページをご覧ください。また、NXPの音声ソフトウェアについて紹介しているデモ・ビデオも閲覧できます。
音声UIとは、音声をユーザー・インターフェースとして使用する「音声ファースト」のデバイスを指します。NXPの音声UIソフトウェア・テクノロジには、VIT、VoiceSpot、VoiceSeekerがあります。
音声通信とは、音声を使用した人対人の双方向通信、すなわち電話を指します。NXPの音声通信ソフトウェア・テクノロジには、Conversaがあります。
VoiceSpotは、非常に正確で高度に最適化されたウェイクワードおよび音響イベント検出エンジンです。これはディープ・ラーニングのニューラル・ネットワーク・テクノロジをベースとしており、トレーニングには大規模なデータセットが必要です。VoiceSpotは、最小の誤警報で最高の応答率を必要とするお客様や、音声/音響のトリガの待機中は超低消費電力状態で動作させる必要があるお客様に適しています。
VITソフトウェア・スイートは、音素ベースの自動音声認識テクノロジに基づいて構築されています。このテクノロジは、発話の音素(音声の基本構成要素)を単語にマッピングした後、ウェイクワードおよびコマンドとして認識し、インテントやアクションに変換することができます。VITは音素をベースにしているため、キーボードとNXPのオンライン・モデル作成ツールを使用して、ウェイクワードやコマンド・モデルをすばやく作成できます。VITウェイクワードおよび音声コマンド・エンジンは、カスタム・ウェイクワードや音声コマンドを独自に作成したいお客様や、音声をユーザー・インターフェースとしてすぐに試してみたいお客様に適しています。VIT Speech to Intentは、クラウド接続やクラウドASR書き起こしサービスを使用せずに、エッジ・プロセッサなどで自然言語理解を作成してみたいお客様に適しています。
VoiceSeekerは、複数のマイクでのビームフォーミングを使用した、音声ユーザー・インターフェース向けオーディオ・フロントエンド信号処理ソリューションです。VoiceSeekerは信号とノイズを識別し、遠距離で残響がある状況において特に効果を発揮します。VoiceSeekerには、無料で使用できる標準オプションと、プレミアム・オプションがあります。AECなしのVoiceSeekerは、NXPのMCUXpresso SDKを介して無料で利用でき、VoiceSpotまたはVITと簡単に統合できます。VoiceSeekerのプレミアム・オプションには、音響エコー・キャンセラ (AEC) が含まれており、NXPから限定配布を通じて入手できます。VoiceSeekerは、スマート・スピーカやホーム・コントローラなどの遠距離音声制御アプリケーションでよく使用されていますが、干渉しているノイズをキャンセルする必要がある場合には、中距離や近距離でも使用可能です。