SemiAnalysis raporuna göre, DeepSeek V3’ün eğitim maliyeti 6 milyon dolardan fazla

SemiAnalysis raporuna göre, DeepSeek V3’ün eğitim maliyeti 6 milyon dolardan fazla


Araştırma şirketi SemiAnalysis, DeepSeek’in gerçekte ne kadara mal olduğuna dair geniş bir analiz yaptı, bu da R1’in o kadar verimli hale geldiği ve NVIDIA ve diğerlerinden gelen hesaplama kaynaklarına ihtiyaç duyulmadığı hikayesini çürüttü.

DeepSeek’in R1 modeli için yalnızca “5 milyon dolar” kullandığı iddia edildi ki bu, OpenAI GPT’nin o1 modeliyle aynı seviyede olup, bunun Amerika Birleşik Devletleri borsasında perakende paniğine yol açtı; ancak şimdi söylenti çürütüldüğünde, gerçek rakamlara bakmak gerekir.

Bilinmeyenler için, DeepSeek’in söylenene göre Çinli hedge fonu High-Flyer’ın bir yan projesi olduğu ve SemiAnalysis’in raporuna göre, onlar 2021’de dışa çıkarma sınırları daha agresif olmadığı zaman NVIDIA A100 birimlerinden 10000 tane satın aldı. Sonrasında DeepSeek, ana şirket High-Flyer proje üzerinde ayrı bir organizasyon olarak yoluna devam etmeye karar verdiği için, işte o zaman her şey gerçekten başladı. Bu noktadan itibaren hesaplama kaynaklarını biriktirmeye başladılar.

Raporda, DeepSeek’in “Çin pazarı” için tasarlanmış olan yaklaşık 10000 NVIDIA H800 AI grafik işlemcisine ve 10000 adet daha pahalı H100 AI çipine sahip olduğu belirtiliyor. Ayrıca, şirket NVIDIA H20 AI hızlandırıcılarına yatırım yapmış ve DeepSeek ile High-Flyer’ın “ticaret, türetme, eğitim ve araştırma” için ortaklaşa kullandıkları bir “kaynak havuzu”na sahipler. Bu, DeepSeek için yaklaşık 1,6 milyar dolarlık sermaye yatırımlarına ve işletme giderlerinin dedikodulara göre yaklaşık 944 milyon dolar olduğuna işaret ediyor. Bu rakamlar, piyasaların başlangıçta tahmin ettiğinden yaklaşık dört yüz kat daha yüksek.

Açıklık adına, ilk rakamın, muhtemelen nihai modelin başlatılmasıyla ilişkili olan eğitim giderlerinin “belirli bir kısmı” olduğu söyleniyor. DeepSeek aslında yerel yeteneklerden faydalanma konusunda başarılı oldu, en iyi yerel üniversitelerde işe alma etkinlikleri ile belli çalışanlar için 1,3 milyon doların üzerinde maaşlarla. DeepSeek’in R1 modelinin arkasındaki zekalar, OpenAI gibi benzerlerle rekabet edebilecek etkili bir çözüm sunabilmiş, ancak “yanlış temsil edilen” finansal göstergeler geçen hafta bir kara kuğu olayında katalizör görevi gördü.

Bunun dışında, SemiAnalysis, daha fazla ayrıntıya ulaşmak isteyenler için DeepSeek’in yapay zeka modelinin kapsamlı bir testini gerçekleştirdi, çünkü ilginç detaylar belirtiliyor.