Podcastleが450以上のAI音声を持つテキスト読み上げモデルを発表

Podcasting platform Podcastle launches a text-to-speech model with more than 450 AI voices | TechCrunch

Podcasting platform Podcastle launches a text-to-speech model with more than 450 AI voices | TechCrunch

Podcast recording and editing platform Podcastle is now joining other companies in the AI-powered, text-to-speech race b...続きを読む

PodcastingプラットフォームのPodcastleは、AIを活用したテキスト読み上げモデル「Asyncflow v1.0」を発表しました。このモデルは、開発者がアプリに直接統合できるAPIも提供されます。Podcastleは、450以上のAI音声を用いてテキストをナレーションすることが可能です。

Podcastleは、低コストでのトレーニングと推論を実現し、競合他社に対する優位性を持っています。
ElevenLabs、Speechify、WellSaidなどの他のスタートアップと競争しています。
創業者のアルト・イェリツィアン氏は、初期からテキスト読み上げモデルの構築を目指していましたが、開発コストが高かったため、最近の大規模言語モデルの進展によりブレークスルーを達成したと述べています。
Podcastleは500分のテキスト読み上げに約40ドルを請求しており、競合のElevenLabsは99ドルです。
音声クローン機能の改善: 新しいプロセスでは、数秒の録音で音声クローンを作成できるようになりました。

Podcastleは、音声、ビデオ、ポッドキャスト、AIナレーションのツールを一つのサイトで提供することで、競合に対する優位性を確保しようとしています。

Text-to-Speech Generator with 450+ AI Voices | podcastle.ai
https://podcastle.ai/ai-voices

月	火	水	木	金	土	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31