Language:

Search

DeepSeek Bùng Nổ: Mọi Thứ Bạn Cần Biết Về Ứng Dụng Chatbot AI

  • Share this:
DeepSeek Bùng Nổ: Mọi Thứ Bạn Cần Biết Về Ứng Dụng Chatbot AI

DeepSeek, phòng thí nghiệm trí tuệ nhân tạo (AI) Trung Quốc, đã nhanh chóng thu hút sự chú ý toàn cầu sau khi ứng dụng chatbot của nó vươn lên đứng đầu trên cả Apple App Store và Google Play. Các mô hình AI của DeepSeek được đào tạo bằng các kỹ thuật tiết kiệm tài nguyên tính toán đã khiến các nhà phân tích Wall Street và công nghệ đặt câu hỏi liệu Mỹ có thể duy trì vị thế dẫn đầu trong cuộc đua AI và liệu nhu cầu về chip AI có tiếp tục bền vững hay không.

Nguồn Gốc Của DeepSeek

DeepSeek được hỗ trợ bởi High-Flyer Capital Management, một quỹ đầu tư mạo hiểm định lượng Trung Quốc sử dụng AI trong việc ra quyết định giao dịch. Liang Wenfeng, một người đam mê AI, đã đồng sáng lập High-Flyer vào năm 2015. Wenfeng, người đã từng thử nghiệm giao dịch khi còn là sinh viên tại Đại học Chiết Giang, đã khởi xướng High-Flyer Capital Management như một quỹ đầu cơ vào năm 2019, tập trung vào phát triển và triển khai các thuật toán AI. Vào năm 2023, High-Flyer thành lập DeepSeek như một phòng thí nghiệm chuyên nghiên cứu các công cụ AI, tách biệt khỏi hoạt động tài chính của họ. Với High-Flyer là một trong những nhà đầu tư, phòng thí nghiệm này trở thành một công ty độc lập, cũng mang tên DeepSeek.

Xây Dựng Hệ Thống Máy Chủ và Thách Thức Phần Cứng

Ngay từ ngày đầu, DeepSeek đã thiết lập các cụm trung tâm dữ liệu riêng cho việc đào tạo mô hình. Tuy nhiên, giống như nhiều công ty AI khác ở Trung Quốc, DeepSeek đã bị ảnh hưởng bởi lệnh cấm xuất khẩu phần cứng của Mỹ. Để đào tạo một trong những mô hình gần đây của mình, công ty buộc phải sử dụng chip Nvidia H800, một phiên bản yếu hơn của chip H100 mà các công ty Mỹ có thể sử dụng.

Đội Ngũ Kỹ Thuật Trẻ

Đội ngũ kỹ thuật của DeepSeek được cho là trẻ trung, với việc công ty tích cực tuyển dụng các nhà nghiên cứu AI có bằng tiến sĩ từ các trường đại học hàng đầu Trung Quốc. Đáng chú ý hơn, DeepSeek cũng tuyển dụng người không có nền tảng về khoa học máy tính để giúp công nghệ của họ hiểu biết rộng hơn về nhiều chủ đề khác nhau, theo The New York Times.

Sự Nổi Lên Của Các Mô Hình DeepSeek

DeepSeek đã ra mắt bộ mô hình đầu tiên của mình — DeepSeek Coder, DeepSeek Large Language Model (LLM), và DeepSeek Chat — vào tháng 11 năm 2023. Tuy nhiên, phải đến mùa xuân năm ngoái, khi startup này phát hành thế hệ mô hình tiếp theo DeepSeek-V2, ngành công nghiệp AI mới thực sự bắt đầu chú ý. DeepSeek-V2, một hệ thống phân tích văn bản và hình ảnh đa mục đích, đã hoạt động tốt trong nhiều chuẩn AI khác nhau, và vận hành với chi phí rẻ hơn nhiều so với các mô hình tương đương lúc bấy giờ.

DeepSeek-V3 và Mô Hình Tư Duy R1

DeepSeek-V3, ra mắt tháng 12 năm 2024, càng nâng cao danh tiếng của DeepSeek. Theo các bài kiểm tra chuẩn nội bộ của công ty, DeepSeek V3 vượt trội hơn cả những mô hình tải về miễn phí, như Llama của công ty Meta, và các mô hình "đóng" chỉ có thể truy cập thông qua API, như GPT-4o của OpenAI. Ngoài ra, model R1 "reasoning" (suy luận) phát hành vào tháng Giêng cũng gây ấn tượng mạnh. DeepSeek tuyên bố R1 có hiệu suất ngang bằng với model o1 của OpenAI trên các chuẩn mực quan trọng. Là một model suy luận, R1 có khả năng tự kiểm tra thông tin, giúp tránh những sai lầm thường gặp ở các mô hình khác.

Những Hạn Chế Liên Quan Đến Quy Định

Tuy nhiên, các mô hình của DeepSeek, do được phát triển tại Trung Quốc, chịu sự đánh giá của cơ quan quản lý Internet Trung Quốc để đảm bảo phản hồi của chúng "thể hiện các giá trị xã hội chủ nghĩa cốt lõi." Ví dụ, trong ứng dụng chatbot của DeepSeek, R1 sẽ không trả lời các câu hỏi về sự kiện Thiên An Môn hay vấn đề tự trị của Đài Loan.

Mô Hình Kinh Doanh Còn Nhiều Bí Ẩn

Nếu DeepSeek có một mô hình kinh doanh, vẫn chưa rõ chính xác mô hình đó là gì. Công ty định giá sản phẩm và dịch vụ của mình thấp hơn nhiều so với giá thị trường — và thậm chí cung cấp một số dịch vụ miễn phí. Theo DeepSeek, các đột phá về hiệu quả đã giúp công ty duy trì được cạnh tranh chi phí cực kỳ mạnh mẽ, dù một số chuyên gia nghi ngờ về các con số mà công ty này cung cấp.

Phản Ứng Từ Thị Trường và Đối Thủ

Sự thành công của DeepSeek đối với các đối thủ lớn và đã có tên tuổi được mô tả là "lật đổ AI" và "được thổi phồng quá mức." Thành công này đã góp phần đáng kể vào sự sụt giảm 18% giá cổ phiếu của Nvidia vào ngày thứ Hai, và tạo ra sự phản hồi công khai từ Sam Altman, CEO của OpenAI. Microsoft công bố rằng DeepSeek đã có mặt trên dịch vụ Azure AI Foundry, nền tảng của Microsoft giúp tổng hợp các dịch vụ AI cho doanh nghiệp dưới một nhãn hiệu chung. Khi được hỏi về tác động của DeepSeek đối với chi tiêu AI của Meta trong cuộc gọi báo cáo kết quả quý đầu tiên, CEO Mark Zuckerberg nói rằng chi tiêu cho cơ sở hạ tầng AI sẽ tiếp tục là "một lợi thế chiến lược" cho Meta.

Phản Ứng Từ Các Chính Phủ và Tổ Chức

Trong khi đó, một số công ty và cả chính phủ các nước đang cấm DeepSeek. Bang New York cũng đã cấm sử dụng DeepSeek trên các thiết bị của chính phủ. Tương lai của DeepSeek vẫn còn nhiều ẩn số. Các mô hình được cải tiến là điều chắc chắn, nhưng chính phủ Mỹ dường như ngày càng lo ngại về điều họ coi là ảnh hưởng ngoại quốc có hại.