Ev >  Haberler >  Deepseek'in karşılanabilirliği bir efsanedir: Devrimci AI aslında 1,6 milyar dolara mal oldu

Deepseek'in karşılanabilirliği bir efsanedir: Devrimci AI aslında 1,6 milyar dolara mal oldu

Authore: DanielGüncelleme:Mar 16,2025

Deepseek'in yeni sohbet botu etkileyici bir tanıtımla övünüyor: "Merhaba, yaratıldım, böylece bir şey sorabilir ve sizi şaşırtabilecek bir cevap alabilirsiniz." Çin girişiminin bir ürünü olan bu AI, hızla önemli bir pazar oyuncusu haline geldi ve hatta Nvidia'nın hisse senedi fiyatında önemli bir düşüşe katkıda bulundu. Başarısı, çeşitli yenilikçi teknolojileri içeren eşsiz bir mimari ve eğitim metodolojisinden kaynaklanmaktadır.

Çoklu Tahmini Tahmin (MTP): Geleneksel kelime tahmininin aksine, MTP aynı anda birden fazla kelimeyi tahmin ederek, daha fazla doğruluk ve verimlilik için çeşitli cümle parçalarını analiz eder.

Uzmanların Karışımı (MOE): Bu mimari, girdi verilerini işlemek, AI eğitimini hızlandırmak ve performansı iyileştirmek için birden fazla sinir ağını kullanır. Deepseek V3, her bir jeton işleme görevi için sekiz'i etkinleştiren 256 sinir ağı kullanır.

Çok Baş Gizli Dikkat (MLA): MLA, bilgi kaybını en aza indirmek ve ince nüansları yakalamak için metin parçalarından önemli ayrıntıları tekrar tekrar çıkararak önemli cümle öğelerine odaklanır.

Deepseek başlangıçta güçlü Deepseek V3 modeli için sadece 2048 GPU kullanarak 6 milyon dolarlık bir eğitim maliyeti talep etti. Bununla birlikte, semianaliz çok daha önemli bir altyapı ortaya çıkarmıştır: yaklaşık 50.000 NVIDIA Hopper GPU'ları (10.000 H800, 10.000 H100 ve ek H20 GPU'lar dahil) birden fazla veri merkezine dağıtılmıştır. Bu, yaklaşık 1,6 milyar dolarlık bir sunucu yatırımına ve 944 milyon dolar olarak tahmin edilen operasyonel giderlere dönüşüyor.

Çin Hedge Fonu High-Flyer'in bir yan kuruluşu olan Deepseek, bulut hizmetlerine dayanan birçok girişimin aksine veri merkezlerinin sahibi. Bu, optimizasyon ve daha hızlı inovasyon uygulaması üzerinde daha fazla kontrol sağlar. Şirketin kendini finanse ettiği doğası esnekliği ve karar verme hızını artırır. Dahası, Deepseek en iyi yetenekleri çekiyor ve bazı araştırmacılar yılda 1,3 milyon doların üzerinde kazanıyor ve öncelikle önde gelen Çin üniversitelerinden işe alıyorlar.

İlk 6 milyon dolarlık rakam olan Deepseek, sadece araştırma, arıtma, veri işleme ve genel altyapı hariç, sadece eğitim öncesi GPU maliyetlerini yansıtıyor. Şirketin AI gelişimine toplam yatırımı 500 milyon doları aşıyor. Bu önemli yatırıma rağmen, Deepseek'in aerodinamik yapısı verimli inovasyon uygulamasına izin vermektedir.

Deepseek'in başarısı, iyi finanse edilen bağımsız bir AI şirketinin rekabet potansiyelini vurgular. "Devrimci bütçe" iddiası tartışmalı olarak abartılı olsa da, şirketin başarıları yadsınamaz, önemli yatırımlar, teknolojik atılımlar ve güçlü bir ekipten kaynaklanmaktadır. Eğitim maliyetlerini karşılaştırırken kontrast keskindir: Deepseek'in R1'si 5 milyon dolara mal olurken, ChatGPT4, bildirilen 100 milyon dolara mal oldu-Deepseek'in göreceli maliyet etkinliğini, önemli genel yatırımıyla bile.

Deepseek TestiDeepseek V3DeepseekDeepseek