Podcasting platform Podcastle launches a text-to-speech model with more than 450 AI voices | TechCrunch

Podcasting platform Podcastle launches a text-to-speech model with more than 450 AI voices | TechCrunch
Podcast recording and editing platform Podcastle is now joining other companies in the AI-powered, text-to-speech race b...続きを読む
PodcastingプラットフォームのPodcastleは、AIを活用したテキスト読み上げモデル「Asyncflow v1.0」を発表しました。このモデルは、開発者がアプリに直接統合できるAPIも提供されます。Podcastleは、450以上のAI音声を用いてテキストをナレーションすることが可能です。
Podcastleは、低コストでのトレーニングと推論を実現し、競合他社に対する優位性を持っています。
ElevenLabs、Speechify、WellSaidなどの他のスタートアップと競争しています。
創業者のアルト・イェリツィアン氏は、初期からテキスト読み上げモデルの構築を目指していましたが、開発コストが高かったため、最近の大規模言語モデルの進展によりブレークスルーを達成したと述べています。
Podcastleは500分のテキスト読み上げに約40ドルを請求しており、競合のElevenLabsは99ドルです。
音声クローン機能の改善: 新しいプロセスでは、数秒の録音で音声クローンを作成できるようになりました。Podcastleは、音声、ビデオ、ポッドキャスト、AIナレーションのツールを一つのサイトで提供することで、競合に対する優位性を確保しようとしています。
Text-to-Speech Generator with 450+ AI Voices | podcastle.ai
https://podcastle.ai/ai-voices

