Language:

Search

GPT-5 MỚI hoàn toàn điên rồ!

  • Share this:
GPT-5 MỚI hoàn toàn điên rồ!

`html

GPT-5 ra mắt: Bước nhảy vọt trong khả năng AI, cạnh tranh trực tiếp với Claude OpusOpenAI's GPT-5 Is Coming to iPhones with iOS 26 | Controverity

AI có thể tự viết code tốt hơn người? GPT-5 với nhiều cải tiến đáng chú ý vừa được OpenAI trình làng, hứa hẹn thay đổi cuộc chơi trong ngành công nghiệp phần mềm.

[SumoTech] - OpenAI vừa chính thức ra mắt GPT-5, phiên bản mới nhất của mô hình ngôn ngữ lớn (LLM) đình đám, với những cải tiến vượt bậc so với GPT-4. Theo như video đánh giá của Julian Goldie, CEO của Goldie Agency, GPT-5 không chỉ là một bản nâng cấp đơn thuần mà là một "hệ thống thông minh" hoàn toàn mới.

Một trong những điểm nhấn lớn nhất của GPT-5 là khả năng lập trình ấn tượng. Goldie cho biết mô hình này đạt 74.9% trên S. Benbench verified, một bài kiểm tra đánh giá khả năng giải quyết các vấn đề lập trình thực tế từ GitHub, vượt trội hơn tất cả các mô hình AI khác hiện có. "Chúng ta đang nói về AI có thể viết code tốt hơn hầu hết các lập trình viên là người," Goldie nhận định.

Ngoài ra, GPT-5 còn gây ấn tượng với khả năng giải toán cao cấp, đạt 94.6% trong các bài toán cấp đại học. Mô hình này cũng được thiết kế để tự động lựa chọn phiên bản phù hợp nhất để xử lý từng yêu cầu cụ thể, giống như một đội ngũ chuyên gia với các thế mạnh khác nhau.

Một điểm đáng chú ý khác là việc OpenAI cung cấp quyền truy cập vào "AI lý luận" (reasoning AI) cho người dùng miễn phí. Tính năng này giúp GPT-5 suy luận từng bước để giải quyết vấn đề, giảm thiểu sai sót và ảo giác so với GPT-4. Theo Goldie, GPT-5 ít có khả năng đưa ra lỗi sai thực tế hơn 45% và ít "ảo giác" hơn 80% so với phiên bản tiền nhiệm khi sử dụng chế độ tư duy.

GPT-5 cũng hỗ trợ "vibe coding," cho phép người dùng tạo ứng dụng chỉ bằng cách mô tả ý tưởng của mình. Mô hình này cũng được cải thiện khả năng "tool calling," tức là khả năng sử dụng nhiều công cụ và ứng dụng khác nhau để hoàn thành các tác vụ phức tạp.

So sánh trực tiếp với Claude Opus 4.1

Mặc dù được đánh giá cao, GPT-5 không phải là hoàn hảo. Trong các thử nghiệm trực tiếp của Goldie, Claude Opus 4.1, một mô hình LLM khác, đã chiến thắng trong một số tác vụ nhất định. "Đối với việc tạo nội dung, tôi vẫn gắn bó với Claude. Nó mang lại cảm giác tự nhiên và giống con người hơn," Goldie cho biết. Anh cũng nhận thấy Claude Opus 4.1 hoạt động tốt hơn GPT-5 trong bài test tạo game.

Tuy nhiên, GPT-5 tỏ ra vượt trội hơn trong việc tạo ra các ứng dụng tương tác phức tạp và sửa lỗi code. Goldie nhấn mạnh rằng GPT-5 có thể viết code "sạch, hiệu quả, được ghi chép đầy đủ và thực sự hoạt động," cho phép người dùng xây dựng các công cụ kinh doanh thực tế mà không cần đội ngũ phát triển.

GPT-5 có nhiều kích thước khác nhau: GPT-5 tiêu chuẩn, GPT-5 Mini và GPT-5 Nano, mỗi loại được tối ưu hóa cho các trường hợp sử dụng khác nhau, mang lại sự linh hoạt cho người dùng trong việc cân bằng chi phí và hiệu suất.

Sự ra mắt của GPT-5 cho thấy cuộc đua trong lĩnh vực AI ngày càng trở nên gay gắt, với nhiều mô hình khác nhau cạnh tranh để mang lại những khả năng tốt nhất cho người dùng. Dù vậy, GPT-5 vẫn là một bước tiến đáng kể và hứa hẹn sẽ có tác động lớn đến nhiều ngành công nghiệp.