Language:

Nền tảng podcast Podcastle ra mắt mô hình chuyển văn bản thành giọng nói với hơn 450 giọng nói AI

By Sumo Tech

Th03 04, 2025

Nền tảng podcast Podcastle ra mắt mô hình chuyển văn bản thành giọng nói với hơn 450 giọng nói AI

Nền tảng chỉnh sửa và ghi podcast Podcastle hiện đang cùng các công ty khác tham gia cuộc đua chuyển văn bản thành giọng nói được hỗ trợ bởi AI bằng cách phát hành mô hình AI của riêng mình có tên Asyncflow v1.0. API dành cho nhà phát triển cũng sẽ có sẵn, cho phép họ tích hợp trực tiếp mô hình chuyển văn bản thành giọng nói vào ứng dụng của mình.

Nhờ mô hình mới, công ty có thể cung cấp hơn 450 giọng nói AI có thể tường thuật văn bản của bạn. Công ty khởi nghiệp này cho biết họ đã phát triển công nghệ và mô hình theo cách sao cho chi phí đào tạo và suy luận thấp, mang lại lợi thế so với các đối thủ cạnh tranh.

Với động thái này, Podcastle gia nhập một số công ty khởi nghiệp, bao gồm ElevenLabs, Speechify và WellSaid, những công ty đã phát triển công nghệ và mô hình AI để chuyển đổi bất kỳ loại văn bản nào thành clip thoại do AI thuật lại. Công nghệ này mở rộng các trường hợp sử dụng như tiếp thị, quảng cáo, tạo nội dung, giáo dục và đào tạo doanh nghiệp.

Người sáng lập Podcastle, Arto Yeritsyan, nói với TechCrunch rằng công ty luôn muốn xây dựng mô hình chuyển văn bản thành giọng nói, nhưng chi phí đào tạo và yêu cầu dữ liệu cho mô hình đó rất cao.

“Chúng tôi muốn xây dựng một mô hình chuyển văn bản thành giọng nói mạnh mẽ ngay từ khi thành lập. Tuy nhiên, chi phí phát triển rất cao. Nhờ sự phát triển mô hình ngôn ngữ lớn gần đây, chúng tôi đã có thể đạt được bước đột phá vào năm ngoái để đạt đến mức có thể xây dựng mô hình giọng nói chất lượng cao mà không cần nhiều dữ liệu,”” Yeritsyan nói.

Công ty cũng được hỗ trợ trong những nỗ lực của mình thông qua Gây quỹ Series A trị giá 13,5 triệu USD năm ngoái.

Yeritsyan cho biết trong khi Podcastle tính phí khoảng 40 USD cho mỗi 500 phút chuyển đổi văn bản sang giọng nói thì ElevenLabs tính phí tương tự là 99 USD.

Tính năng sao chép giọng nói của Podcastle cũng đang được nâng cấp để tạo ra quy trình đào tạo nhanh hơn.

Trước đó, quá trình đào tạo bao gồm việc đọc khoảng 70 câu khác nhau. Bây giờ bạn chỉ cần vài giây ghi âm để tạo bản sao giọng nói của bạn. Quy trình mới cũng sử dụng Magic Dust AI của Podcastle, được phát hành vào năm ngoái, để cải thiện chất lượng ghi âm.

Trong thử nghiệm của chúng tôi, giọng nói được tạo bằng quy trình mới nghe có vẻ hơi giống robot, mặc dù nó bắt chước giọng điệu của chúng tôi. Công ty cho biết, theo thời gian, nó sẽ cải thiện tính năng này. Ngoài ra, bạn có thể huấn luyện các mẫu giọng nói khác nhau để có được kết quả khác nhau.

Podcastle cho biết ngoài chi phí, việc có các công cụ âm thanh, video, podcast và tường thuật được hỗ trợ bởi AI trên một trang web được thiết kế lại sẽ giúp nó có lợi thế hơn so với các đối thủ cạnh tranh. Yeritsyan cho biết trong khi phần lớn người dùng sử dụng Podcastle để xử lý nội dung âm thanh thì video cũng đang bắt kịp xu hướng này.

Tech Crunch

Ứng dụng hay

10 cách dùng Google AI Studio (10X HIệu Suất)

Podcastle, nền tảng chỉnh sửa và ghi podcast, đã phát hành mô hình AI chuyển văn bản thành giọng nói mang tên Asyncflow v1.0, cho phép tích hợp trực tiếp vào ứng dụng với hơn 450 giọng nói AI. Công ty khởi nghiệp này được cho là có chi phí...

Th08 03, 2025

Ứng dụng hay

AI Này LipSync Nhép Miệng Như Thật 🔥 Cách Tạo Video Viral Triệu View Với Công Cụ Này

Th08 01, 2025

Đừng Lãng Phí Credit – Dùng Google Veo 3 Như PRO || OpenArt

Th07 24, 2025 84 views
🚀 Thay thế Veo 3 & Runway Tốt Nhất Miễn Phí

Th07 24, 2025 92 views

Nền tảng podcast Podcastle ra mắt mô hình chuyển văn bản thành giọng nói với hơn 450 giọng nói AI

Related posts

10 cách dùng Google AI Studio (10X HIệu Suất)

AI Này LipSync Nhép Miệng Như Thật 🔥 Cách Tạo Video Viral Triệu View Với Công Cụ Này

You might be interested in

Đừng Lãng Phí Credit – Dùng Google Veo 3 Như PRO || OpenArt

🚀 Thay thế Veo 3 & Runway Tốt Nhất Miễn Phí