Unitree R1: Robot AI Trung Quốc quá rẻ và thông minh đến mức đáng sợ
Tác tử Google DeepThink mới ra đời và làm được những gì? Hãy cùng chúng tôi khám phá nhé!
Search
Google vừa ra mắt Gemini Deep Think, một mô hình AI được mệnh danh là "mạnh mẽ nhất thế giới". Tuy nhiên, những thử nghiệm ban đầu cho thấy mô hình này có thể không thực sự xứng đáng với mức giá 250 USD/tháng mà Google đưa ra.
Trong một video đánh giá được thực hiện gần đây, người dùng đã thử nghiệm Gemini Deep Think bằng cách yêu cầu nó tạo ra một trò chơi Flappy Bird đơn giản và sau đó là một trò chơi Pong "hyperdopamine". Mặc dù Deep Think hứa hẹn khả năng xử lý các vấn đề phức tạp và lập luận logic cao cấp, kết quả thực tế lại gây thất vọng.
Theo người thử nghiệm trong video, "Deep Think mất quá nhiều thời gian để phản hồi, thậm chí có lúc không đưa ra bất kỳ phản hồi nào". Cụ thể, trong thử nghiệm tạo trò chơi Pong, Gemini Deep Think không đưa ra được kết quả nào sau 5 phút chờ đợi. Trong khi đó, các mô hình AI khác như Claude Sonnet 4 đã tạo ra các phiên bản trò chơi có thể chơi được một cách nhanh chóng và hiệu quả hơn.
Người thử nghiệm cũng so sánh kết quả của Gemini Deep Think với các mô hình khác như ChatGPT-3 Pro và Gemini 2.5 Pro (không có Deep Think). Kết quả cho thấy Gemini 2.5 Pro, mặc dù chậm hơn so với Claude Sonnet 4, lại cho ra kết quả tốt hơn và nhanh hơn đáng kể so với Deep Think trong một số trường hợp.
"Thật nực cười khi phải trả 250 đô la một tháng cho một thứ gì đó lãng phí thời gian của tôi," người thử nghiệm phát biểu trong video. Ông cũng nhấn mạnh rằng Gemini 2.5 Pro (không có Deep Think) đã cho ra kết quả tốt hơn và nhanh hơn trong một số thử nghiệm.
Mặc dù Gemini Deep Think đạt được những thành tích ấn tượng trong các bài kiểm tra chuẩn, như giành huy chương vàng tại Olympic Toán học Quốc tế, nhưng hiệu suất thực tế trong các ứng dụng hàng ngày có vẻ chưa thực sự tương xứng với tiềm năng và mức giá của nó. Video đánh giá này cho thấy rằng, ít nhất ở thời điểm hiện tại, Gemini Deep Think có thể chưa phải là lựa chọn lý tưởng cho đại đa số người dùng.