Trung Quốc vừa ra mắt AI mã nguồn mở thông minh nhất từ trước đến nay (vượt DeepSeek và các bài đánh giá chuẩn)
By Sumo Tech
Th07 30, 2025
Share this:
Z.AI ra mắt GLM 4.5: Mô hình AI mã nguồn mở "khủng" thách thức GPT-4 với mức giá không tưởng
Mô hình 355 tỷ tham số, khả năng xử lý đa dạng, giá rẻ và mã nguồn mở - GLM 4.5 đang tạo nên cơn sốt trong giới AI toàn cầu.
SumoTech - Công ty Z.AI (trước đây là Zepu AI) vừa chính thức trình làng dòng mô hình ngôn ngữ lớn (LLM) thế hệ mới, GLM 4.5 và phiên bản rút gọn GLM 4.5 Air. Được giới chuyên gia đánh giá là một trong những bản phát hành mã nguồn mở ấn tượng nhất năm 2025, GLM 4.5 gây chú ý không chỉ bởi sức mạnh mà còn ở thiết kế tối ưu hóa hiệu suất, khả năng hoạt động như một AI Agent, tính dễ tiếp cận và đặc biệt là mức giá cạnh tranh.
Điểm đáng chú ý nhất của GLM 4.5 là kiến trúc Mixture of Experts (MoE) với 355 tỷ tham số, nhưng chỉ 32 tỷ tham số được kích hoạt trong mỗi truy vấn. Điều này cho phép mô hình đạt hiệu suất cao, đồng thời giảm thiểu chi phí và yêu cầu phần cứng. Phiên bản GLM 4.5 Air, với 106 tỷ tham số (chỉ 12 tỷ hoạt động), được thiết kế để chạy trên các GPU phổ thông, thậm chí cả phần cứng tiêu dùng với 32-64 GB VRAM.
Không chỉ là một chatbot thông thường, GLM 4.5 được xây dựng để hoạt động như một AI Agent tự động, có khả năng suy luận theo từng bước, sử dụng công cụ bên ngoài, lên kế hoạch hành động, gọi API và điều khiển giao diện. Mô hình này cung cấp hai chế độ: "Thinking mode" (chế độ suy luận sâu) và "Fast response mode" (chế độ phản hồi nhanh), mang lại sự linh hoạt cho nhiều ứng dụng khác nhau.
Tốc độ xử lý cũng là một ưu điểm nổi bật của GLM 4.5. Nhờ công nghệ speculative decoding và multi-token prediction layers, mô hình có thể tạo ra hơn 100 token mỗi giây trên API tốc độ cao, thậm chí đạt tới 200 token mỗi giây trong thực tế. Đặc biệt, GLM 4.5 sở hữu context window cực lớn, lên tới 128.000 token cho đầu vào và 96.000 token cho đầu ra - vượt trội so với GPT-4 (khoảng 32.000 token) và Claude 2 (100.000 token).
Hiệu năng ấn tượng, giá "mềm", mã nguồn mở
GLM 4.5 được huấn luyện trên 15 nghìn tỷ token dữ liệu tổng quát, sau đó tinh chỉnh thêm với 7-8 nghìn tỷ token chuyên biệt cho code, suy luận và tác vụ AI Agent. Z.AI cũng phát triển hạ tầng reinforcement learning tùy chỉnh mang tên "Slime" để thực hiện các phiên huấn luyện dài hạn phức tạp.
"Thay vì đi theo hướng mở rộng chiều rộng như nhiều mô hình lớn khác, Zippu đã làm cho GLM 4.5 sâu hơn. Họ giảm kích thước ẩn và số lượng chuyên gia được định tuyến, nhưng tăng thêm nhiều lớp. Độ sâu đó mang lại cho nó khả năng suy luận tốt hơn" - trích dẫn từ video, cho thấy sự khác biệt trong thiết kế của GLM 4.5.
Về hiệu năng, GLM 4.5 đạt vị trí thứ ba toàn cầu trên 12 đánh giá chính, bao gồm suy luận, toán học, coding và hành vi AI Agent. Mô hình này vượt trội so với Claude 4 Opus, Deepseek R1 và Google Gemini 2.5 Flash trong nhiều lĩnh vực. Đáng chú ý, GLM 4.5 đạt tỷ lệ thành công 90.6% trong việc gọi công cụ (tool calling), cao hơn đáng kể so với các đối thủ cạnh tranh.
Mức giá sử dụng API của GLM 4.5 chỉ khoảng 0.39 USD cho một triệu token (kết hợp cả đầu vào và đầu ra), rẻ hơn hơn 10 lần so với Claude và cạnh tranh hơn nhiều so với GPT-4. Hơn nữa, GLM 4.5 được phát hành dưới giấy phép MIT, cho phép sử dụng mã nguồn mở và thương mại. Người dùng có thể tải xuống trọng số từ HuggingFace hoặc Model Scope, chạy cục bộ, triển khai trên cơ sở hạ tầng riêng, tinh chỉnh hoặc tích hợp vào sản phẩm của mình.
Kỳ vọng và tương lai
Với những ưu điểm vượt trội về hiệu năng, giá cả và tính mở, GLM 4.5 đang tạo ra một làn sóng quan tâm lớn trong cộng đồng AI. Z.AI, với sự hậu thuẫn mạnh mẽ từ Tencent, Alibaba và các chính quyền địa phương Trung Quốc, đang hướng tới mục tiêu trở thành một trong những "AI6 Tigers" hàng đầu của Trung Quốc, cạnh tranh trực tiếp với các mô hình độc quyền của Mỹ như GPT-4 và Claude 3. GLM 5 đang được phát triển và công ty cũng đang khám phá các mô hình đa phương thức, hứa hẹn sẽ mang đến nhiều đột phá hơn nữa trong tương lai.
Công ty Unitree vừa giới thiệu R1, một robot hình người kích thước đầy đủ với giá chỉ 5.900 đô la, trở thành một trong những robot hỗ trợ AI rẻ nhất hiện nay. R1 được trang bị khả năng di chuyển linh hoạt và học hỏi thông minh, hứa...
Công ty Unitree vừa giới thiệu R1, một robot hình người kích thước đầy đủ với giá chỉ 5.900 đô la, trở thành một trong những robot hỗ trợ AI rẻ nhất hiện nay. R1 được trang bị khả năng di chuyển linh hoạt và học hỏi thông minh, hứa...