Chuyên ngành tiếp theo của Meta “mở” Mô hình AI có thể tập trung vào giọng nói, theo báo cáo trên Financial Times.
Theo bài viết, Meta đang có kế hoạch giới thiệu các tính năng giọng nói cải tiến với Llama 4, sản phẩm chủ lực tiếp theo trong dòng mô hình Llama, dự kiến sẽ xuất hiện “tuần.” Được biết, Meta đã đặc biệt tập trung vào việc cho phép người dùng ngắt đoạn mô hình đang nói, tương tự như Chế độ giọng nói của OpenAI dành cho ChatGPT và Trải nghiệm Gemini Live.
Trong các bình luận tuần này tại hội nghị Morgan Stanley , giám đốc sản phẩm của Meta, Chris Cox đã nói rằng Llama 4 sẽ là một “toàn năng” mô hình, có khả năng diễn giải và xuất ra lời nói cũng như văn bản và các loại dữ liệu khác.
Sự thành công của các mô hình mở từ phòng thí nghiệm AI DeepSeek của Trung Quốc, hoạt động ngang bằng hoặc tốt hơn các mô hình Llama của Meta, đã thúc đẩy quá trình phát triển Llama tăng tốc. Meta được cho là đã nỗ lực thiết lập các phòng chiến tranh để giải mã cách DeepSeek giảm chi phí vận hành và triển khai các mô hình.
Tech Crunch