Nền tảng podcast Podcastle ra mắt mô hình chuyển văn bản thành giọng nói với hơn 450 giọng nói AI
By Sumo Tech
Th03 04, 2025
Share this:
Nền tảng chỉnh sửa và ghi podcast Podcastle hiện đang cùng các công ty khác tham gia cuộc đua chuyển văn bản thành giọng nói được hỗ trợ bởi AI bằng cách phát hành mô hình AI của riêng mình có tên Asyncflow v1.0. API dành cho nhà phát triển cũng sẽ có sẵn, cho phép họ tích hợp trực tiếp mô hình chuyển văn bản thành giọng nói vào ứng dụng của mình.
Nhờ mô hình mới, công ty có thể cung cấp hơn 450 giọng nói AI có thể tường thuật văn bản của bạn. Công ty khởi nghiệp này cho biết họ đã phát triển công nghệ và mô hình theo cách sao cho chi phí đào tạo và suy luận thấp, mang lại lợi thế so với các đối thủ cạnh tranh.
Với động thái này, Podcastle gia nhập một số công ty khởi nghiệp, bao gồm ElevenLabs, Speechify và WellSaid, những công ty đã phát triển công nghệ và mô hình AI để chuyển đổi bất kỳ loại văn bản nào thành clip thoại do AI thuật lại. Công nghệ này mở rộng các trường hợp sử dụng như tiếp thị, quảng cáo, tạo nội dung, giáo dục và đào tạo doanh nghiệp.
Người sáng lập Podcastle, Arto Yeritsyan, nói với TechCrunch rằng công ty luôn muốn xây dựng mô hình chuyển văn bản thành giọng nói, nhưng chi phí đào tạo và yêu cầu dữ liệu cho mô hình đó rất cao.
“Chúng tôi muốn xây dựng một mô hình chuyển văn bản thành giọng nói mạnh mẽ ngay từ khi thành lập. Tuy nhiên, chi phí phát triển rất cao. Nhờ sự phát triển mô hình ngôn ngữ lớn gần đây, chúng tôi đã có thể đạt được bước đột phá vào năm ngoái để đạt đến mức có thể xây dựng mô hình giọng nói chất lượng cao mà không cần nhiều dữ liệu,”” Yeritsyan nói.
Yeritsyan cho biết trong khi Podcastle tính phí khoảng 40 USD cho mỗi 500 phút chuyển đổi văn bản sang giọng nói thì ElevenLabs tính phí tương tự là 99 USD.
Tính năng sao chép giọng nói của Podcastle cũng đang được nâng cấp để tạo ra quy trình đào tạo nhanh hơn.
Trong thử nghiệm của chúng tôi, giọng nói được tạo bằng quy trình mới nghe có vẻ hơi giống robot, mặc dù nó bắt chước giọng điệu của chúng tôi. Công ty cho biết, theo thời gian, nó sẽ cải thiện tính năng này. Ngoài ra, bạn có thể huấn luyện các mẫu giọng nói khác nhau để có được kết quả khác nhau.
Podcastle cho biết ngoài chi phí, việc có các công cụ âm thanh, video, podcast và tường thuật được hỗ trợ bởi AI trên một trang web được thiết kế lại sẽ giúp nó có lợi thế hơn so với các đối thủ cạnh tranh. Yeritsyan cho biết trong khi phần lớn người dùng sử dụng Podcastle để xử lý nội dung âm thanh thì video cũng đang bắt kịp xu hướng này.
Podcastle, nền tảng chỉnh sửa và ghi podcast, đã phát hành mô hình AI chuyển văn bản thành giọng nói mang tên Asyncflow v1.0, cho phép tích hợp trực tiếp vào ứng dụng với hơn 450 giọng nói AI. Công ty khởi nghiệp này được cho là có chi phí...
Podcastle, nền tảng chỉnh sửa và ghi podcast, đã phát hành mô hình AI chuyển văn bản thành giọng nói mang tên Asyncflow v1.0, cho phép tích hợp trực tiếp vào ứng dụng với hơn 450 giọng nói AI. Công ty khởi nghiệp này được cho là có chi phí...