Trang chủ >  Tin tức >  Khả năng chi trả của Deepseek là một huyền thoại: AI cách mạng thực sự có giá 1,6 tỷ đô la để phát triển

Khả năng chi trả của Deepseek là một huyền thoại: AI cách mạng thực sự có giá 1,6 tỷ đô la để phát triển

Authore: DanielCập nhật:Mar 16,2025

Chatbot mới của Deepseek tự hào về phần giới thiệu ấn tượng: "Xin chào, tôi được tạo ra để bạn có thể hỏi bất cứ điều gì và nhận được câu trả lời thậm chí có thể làm bạn ngạc nhiên." AI này, một sản phẩm của công ty khởi nghiệp Trung Quốc Deepseek, đã nhanh chóng trở thành một người chơi thị trường lớn, thậm chí góp phần làm giảm đáng kể giá cổ phiếu của NVIDIA. Thành công của nó xuất phát từ một phương pháp đào tạo và kiến ​​trúc độc đáo, kết hợp một số công nghệ sáng tạo.

Dự đoán đa điểm (MTP): Không giống như dự đoán từng từ truyền thống, MTP dự báo đồng thời nhiều từ, phân tích các phần câu khác nhau để nâng cao độ chính xác và hiệu quả.

Hỗn hợp các chuyên gia (MOE): Kiến trúc này sử dụng nhiều mạng lưới thần kinh để xử lý dữ liệu đầu vào, tăng tốc đào tạo AI và cải thiện hiệu suất. Deepseek V3 sử dụng 256 mạng thần kinh, kích hoạt tám mạng cho mỗi nhiệm vụ xử lý mã thông báo.

Sự chú ý tiềm ẩn đa đầu (MLA): MLA tập trung vào các yếu tố câu quan trọng, liên tục trích xuất các chi tiết chính từ các đoạn văn bản để giảm thiểu mất thông tin và nắm bắt các sắc thái tinh tế.

Deepseek ban đầu tuyên bố chi phí đào tạo thấp đáng kể là 6 triệu đô la cho mẫu Deepseek V3 mạnh mẽ của mình, chỉ sử dụng GPU 2048. Tuy nhiên, bán phân giải cho thấy cơ sở hạ tầng đáng kể hơn nhiều: khoảng 50.000 GPU phễu NVIDIA (bao gồm 10.000 H800, 10.000 H100 và GPU H20 bổ sung) được phân phối trên nhiều trung tâm dữ liệu. Điều này có nghĩa là đầu tư máy chủ khoảng 1,6 tỷ đô la và chi phí hoạt động ước tính là 944 triệu đô la.

Deepseek, một công ty con của Quỹ phòng hộ Trung Quốc High Flyer, sở hữu các trung tâm dữ liệu của mình, không giống như nhiều công ty khởi nghiệp dựa vào dịch vụ đám mây. Điều này cung cấp quyền kiểm soát tốt hơn đối với tối ưu hóa và thực hiện đổi mới nhanh hơn. Bản chất tự tài trợ của công ty giúp tăng cường tính linh hoạt và tốc độ ra quyết định. Hơn nữa, Deepseek thu hút tài năng hàng đầu, với một số nhà nghiên cứu kiếm được hơn 1,3 triệu đô la hàng năm, chủ yếu tuyển dụng từ các trường đại học hàng đầu Trung Quốc.

Con số 6 triệu đô la ban đầu, DeepSeek làm rõ, chỉ phản ánh chi phí GPU trước khi đào tạo, không bao gồm nghiên cứu, tinh chỉnh, xử lý dữ liệu và cơ sở hạ tầng tổng thể. Tổng đầu tư của công ty vào phát triển AI vượt quá 500 triệu đô la. Mặc dù đầu tư đáng kể này, cấu trúc hợp lý của Deepseek cho phép thực hiện đổi mới hiệu quả.

Thành công của Deepseek nhấn mạnh tiềm năng cạnh tranh của một công ty AI độc lập được tài trợ tốt. Mặc dù yêu cầu "ngân sách cách mạng" được cho là phóng đại, nhưng thành tích của công ty là không thể phủ nhận, do đầu tư đáng kể, đột phá công nghệ và một nhóm mạnh mẽ. Sự tương phản là rõ ràng khi so sánh chi phí đào tạo: R1 của Deepseek có giá 5 triệu đô la, trong khi TATGPT4 có giá trị 100 triệu đô la báo cáo, điều khiển hiệu quả chi phí tương đối của Deepseek, ngay cả với khoản đầu tư đáng kể của nó.

DeepSeek TestDeepseek v3DeepseekDeepseek