アマゾンが新しいAI音声モデル「Nova Sonic」を発表 | TechCrunch

Amazon unveils a new AI voice model, Nova Sonic | TechCrunch

Amazon unveils a new AI voice model, Nova Sonic | TechCrunch
Amazon has unveiled a new AI voice model, Nova Sonic, the company claims is competitive with frontier voice models from ...続きを読む

Amazonは2025年4月8日に、新しい生成AIモデル「Nova Sonic」を発表しました。このモデルは音声をネイティブに処理し、自然な音声を生成する能力を持ち、OpenAIやGoogleの最先端音声モデルと比較して、速度、音声認識、会話の質において競争力があります。Nova Sonicは「市場で最もコスト効率の良い」AI音声モデルとされ、OpenAIのGPT-4oよりも約80%安価です。

このモデルはAmazonの開発者プラットフォーム「Bedrock」を通じて利用可能で、企業向けAIアプリケーションを構築するための新しい双方向ストリーミングAPIを提供します。音声認識精度も高く、Multilingual LibriSpeechベンチマークでは、英語、フランス語、イタリア語、ドイツ語、スペイン語において平均4.2%の単語誤認識率を達成しました。

また、ユーザーの発話の間隔や中断を考慮し、適切なタイミングで発言する能力があり、発話をテキストに変換する機能も備えています。さらに、平均応答時間は1.09秒で、OpenAIのGPT-4oよりも速いとされています。

AmazonはNova Sonicを通じて、人工一般知能(AGI)の構築を目指しており、今後は画像、動画、音声など、さまざまなモダリティを理解できるAIモデルをリリースする計画です。

この新しいモデルは、Amazonのデジタルアシスタント「Alexa+」にも組み込まれており、ユーザー体験の向上に寄与しています。

Amazon’s Nova Sonic foundation model understands voice in a whole new way
https://www.aboutamazon.com/news/innovation-at-amazon/nova-sonic-voice-speech-foundation-model

Translate »
タイトルとURLをコピーしました