Sesame, the startup behind the viral virtual assistant Maya, releases its base AI model | TechCrunch

Sesame, the startup behind the viral virtual assistant Maya, releases its base AI model | TechCrunch
Sesame, the AI startup behind the impressively realistic voice assistant Maya, has released the base AI model powering M...続きを読む
Sesameは、リアルな音声アシスタントMayaを支える基盤AIモデルCSM-1Bを発表しました。このモデルは1億のパラメータを持ち、Apache 2.0ライセンスの下で商業利用が可能です。RVQ(Residual Vector Quantization)技術を使用して音声をエンコードし、MetaのLlamaファミリーのモデルを基にしています。
Sesameは、CSM-1Bがさまざまな声を生成できるものの、特定の声に対しては微調整されていないと述べています。また、トレーニングデータの汚染により非英語の言語にも一定の能力があるとしていますが、性能は期待できない可能性があります。
セキュリティ面では、モデルに実質的な安全策がないことを認めており、他人の声を無断で模倣したり、誤解を招くコンテンツを作成しないように促しています。
Sesameは未公表の資金を調達しており、AIグラスのプロトタイプも開発中です。
sesame/csm-1b ・ Hugging Face
https://huggingface.co/sesame/csm-1b
GitHub – SesameAILabs/csm: A Conversational Speech Generation Model
https://github.com/SesameAILabs/csm?tab=readme-ov-file

