アマゾンが新しいAI音声モデル「Nova Sonic」を発表

Amazon unveils a new AI voice model, Nova Sonic | TechCrunch

Amazon unveils a new AI voice model, Nova Sonic | TechCrunch

Amazon has unveiled a new AI voice model, Nova Sonic, the company claims is competitive with frontier voice models from ...続きを読む

Amazonは2025年4月8日に、新しい生成AIモデル「Nova Sonic」を発表しました。このモデルは音声をネイティブに処理し、自然な音声を生成する能力を持ち、OpenAIやGoogleの最先端音声モデルと比較して、速度、音声認識、会話の質において競争力があります。Nova Sonicは「市場で最もコスト効率の良い」AI音声モデルとされ、OpenAIのGPT-4oよりも約80%安価です。

このモデルはAmazonの開発者プラットフォーム「Bedrock」を通じて利用可能で、企業向けAIアプリケーションを構築するための新しい双方向ストリーミングAPIを提供します。音声認識精度も高く、Multilingual LibriSpeechベンチマークでは、英語、フランス語、イタリア語、ドイツ語、スペイン語において平均4.2%の単語誤認識率を達成しました。

また、ユーザーの発話の間隔や中断を考慮し、適切なタイミングで発言する能力があり、発話をテキストに変換する機能も備えています。さらに、平均応答時間は1.09秒で、OpenAIのGPT-4oよりも速いとされています。

AmazonはNova Sonicを通じて、人工一般知能（AGI）の構築を目指しており、今後は画像、動画、音声など、さまざまなモダリティを理解できるAIモデルをリリースする計画です。

この新しいモデルは、Amazonのデジタルアシスタント「Alexa+」にも組み込まれており、ユーザー体験の向上に寄与しています。

Amazon’s Nova Sonic foundation model understands voice in a whole new way
https://www.aboutamazon.com/news/innovation-at-amazon/nova-sonic-voice-speech-foundation-model

🗣️ Announcing Amazon Nova Sonic, a new speech-to-speech foundation model that can understand voice as input & generate a human-like voice as output.

➡️ Available via a new API in Amazon Bedrock, the model simplifies the development of voice applications: https://t.co/nbZQvrIFnF
— Amazon Science (@AmazonScience) April 8, 2025

月	火	水	木	金	土	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31