Language:

Search

GPT 5 VS Grok 4: Ai thắng?

  • Share this:
GPT 5 VS Grok 4: Ai thắng?

GPT-5 "Thinking Mode" Vượt Mặt Grok 4 trong Thử Nghiệm Khả Năng Lập Trình và Thiết Kế Web

ChatGPT Logo, symbol, meaning, history, PNG, brand

So sánh trực tiếp cho thấy Grok 4 gặp nhiều vấn đề kỹ thuật, trong khi GPT-5 thể hiện khả năng hiểu ngữ cảnh và tạo ra sản phẩm hoàn thiện hơn.A Complete Guide on ChatGPT - Perzonalization

SumoTech - Một thử nghiệm trực tiếp gần đây so sánh khả năng của GPT-5 và Grok 4 trong việc tạo ra các ứng dụng đơn giản và trang web đã cho thấy sự khác biệt đáng kể về hiệu suất giữa hai mô hình AI này. Theo đó, GPT-5 thể hiện ưu thế vượt trội, đặc biệt là nhờ khả năng "Thinking Mode" - một cơ chế giúp AI lập kế hoạch trước khi viết code, xem xét các trường hợp ngoại lệ và xây dựng kiến trúc tổng thể.

Trong các thử nghiệm bao gồm tạo game đơn giản (Pixel Ninja Dash, Candy Match Blast, Jungle Run Adventure) và thiết kế trang web (trang đích VR, trang đích tiền điện tử metaverse), Grok 4 thường xuyên gặp phải các vấn đề kỹ thuật nghiêm trọng. Thậm chí, có những trường hợp code do Grok 4 tạo ra không thể chạy được, chứa lỗi cú pháp, sử dụng ngôn ngữ lập trình sai hoặc gọi các thư viện không tồn tại. Theo video được trích dẫn, "Grock 4 viết những đoạn code rời rạc, thiếu các hàm, biến chưa xác định, sai cú pháp, lẫn lộn ngôn ngữ."

Ngược lại, GPT-5 tuy cũng gặp một số lỗi nhỏ, nhưng nhìn chung đã tạo ra các sản phẩm có tính thẩm mỹ và chức năng tốt hơn nhiều. Trong thử nghiệm thiết kế trang web tiền điện tử metaverse, GPT-5 đã tạo ra một trang web có logo 3D xoay, hiệu ứng phát sáng, hình nền tinh vân và timeline hiển thị lộ trình phát triển – những chi tiết mà Grok 4 không thể tái tạo.

Điểm đáng chú ý khác là GPT-5 có khả năng hiểu ngữ cảnh tốt hơn. Khi yêu cầu tạo trang web theo phong cách "pixel art," GPT-5 đã tạo ra các sprite thô và giao diện retro. Còn khi được yêu cầu tạo trang web tiền điện tử metaverse, GPT-5 đã tự động chọn chủ đề tối và hiệu ứng phát sáng. Grok 4 dường như chỉ thực hiện các yêu cầu một cách máy móc, thiếu sự sáng tạo và không hiểu ý nghĩa sâu xa của các thuật ngữ chuyên môn.

Mặc dù giá thành của Grok 4 (đặc biệt là các gói cao cấp) cao hơn đáng kể so với GPT-5 Plus, thử nghiệm này cho thấy GPT-5 mang lại giá trị sử dụng thực tế cao hơn, đặc biệt trong các tác vụ phức tạp đòi hỏi sự hiểu biết sâu sắc về ngữ cảnh và khả năng lập kế hoạch.