Dom Aktualności Deepseek AI Development kosztuje 1,6 miliarda dolarów, obalając mit przystępności cenowej

Deepseek AI Development kosztuje 1,6 miliarda dolarów, obalając mit przystępności cenowej

Autor : Gabriel Aktualizacja:Apr 21,2025

Jest jednak nadal tańszy niż jego konkurenci.

Nowy chatbot z Deepseek powitał mnie intrygującym wprowadzeniem:

Cześć, zostałem stworzony, abyś mógł zapytać o wszystko i uzyskać odpowiedź, która może cię nawet zaskoczyć.

Dzisiaj sztuczna inteligencja Deepseek pojawiła się jako potężny gracz na rynku, nawet powodując jeden z najważniejszych spadków cen akcji Nvidii.

Test Deepseek Zdjęcie: engame.com

To, co wyróżnia ten model, to jego innowacyjna architektura i metody szkolenia. Deepseek stosuje kilka najnowocześniejszych technologii:

Prognozowanie wielu tokenów (MTP): Zamiast przewidywać jedno słowo jednocześnie, model prognozuje wiele słów jednocześnie poprzez analizę różnych części zdania. Podejście to znacznie zwiększa zarówno dokładność, jak i wydajność modelu.

Mieszanka ekspertów (MOE): Architektura ta wykorzystuje różne sieci neuronowe do przetwarzania danych wejściowych. Technologia przyspiesza szkolenie AI i poprawia wydajność. W Deepseek V3 stosuje się 256 sieci neuronowych, z ośmioma aktywowanymi dla każdego zadania przetwarzania tokenu.

Utrzymująca uwaga wielowłócona (MLA): Ten mechanizm pomaga skupić się na najważniejszych częściach zdania. MLA wielokrotnie wyodrębnia kluczowe szczegóły z fragmentów tekstu, a nie tylko raz, zmniejszając prawdopodobieństwo braku ważnych informacji. Umożliwia to efektywne przechwytywanie kluczowych niuansów w danych wejściowych.

Wybitny chiński startup Deepseek twierdzi, że opracował konkurencyjny model AI przy minimalnych kosztach, stwierdzając, że wydali tylko 6 milionów dolarów na szkolenie potężnej sieci neuronowej Deepseek V3 i zastosowali zaledwie 2048 procesorów graficznych.

Deepseek v3 Zdjęcie: engame.com

Jednak analitycy z semianalizy odkryli, że Deepseek prowadzi dużą infrastrukturę obliczeniową obejmującą około 50 000 GPU Nvidia Hopper. Obejmuje to 10 000 jednostek H800, 10 000 bardziej zaawansowanych H100 i dodatkowe partie H20 GPU. Zasoby te są dystrybuowane w kilku centrach danych i są wykorzystywane do szkolenia AI, badania i modelowanie finansowe.

Całkowita inwestycja Spółki w serwerach wynosi około 1,6 miliarda dolarów, a wydatki operacyjne szacują na 944 mln USD.

Deepseek jest spółką zależną chińskiego funduszu hedgingowego High-Flyer, która odrzuciła start-upa jako odrębny podział koncentrujący się na technologiach AI w 2023 r.. W przeciwieństwie do większości startupów, które wynajmują siłę obliczeniową od dostawców chmur, Deepseek jest właścicielem własnych centrów danych, co daje mu pełną kontrolę nad optymalizacją modelu AI i włączając szybką wdrażanie innowacji. Firma pozostaje finansowana, co pozytywnie wpływa na jego elastyczność i szybkość podejmowania decyzji.

Deepseek Zdjęcie: engame.com

Ponadto niektórzy badacze Deepseek zarabiają ponad 1,3 miliona dolarów rocznie, przyciągając najlepsze talenty wiodących chińskich uniwersytetów (firma nie zatrudniał zagranicznych specjalistów).

Nawet przy tych czynnikach niedawne twierdzenie Deepseeka o szkolenie najnowszego modelu za jedyne 6 milionów dolarów wydaje się nierealne. Liczba ta odnosi się jedynie do kosztu wykorzystania GPU podczas wstępnego treningu i nie uwzględnia kosztów badań, udoskonalania modelu, przetwarzania danych lub ogólnych kosztów infrastruktury.

Od samego początku Deepseek zainwestował ponad 500 milionów dolarów w rozwój AI. Jednak w przeciwieństwie do większych firm obciążonych biurokracją, kompaktowa struktura Deepseek pozwala jej aktywnie i skutecznie wdrażać innowacje AI.

Deepseek Zdjęcie: engame.com

Przykład Deepseek pokazuje, że dobrze finansowana niezależna firma AI może konkurować z liderami branży. Niemniej jednak eksperci podkreślają, że sukces firmy wynika głównie z miliardów inwestycji, przełomów technicznych i silnego zespołu, podczas gdy twierdzenia o „rewolucyjnym budżecie” dla opracowywania modeli AI są nieco przesadzone.

Mimo to koszty konkurencji pozostają znacznie wyższe. Na przykład porównaj koszty treningu modelowego: Deepseek wydał 5 milionów dolarów na R1, podczas gdy Chatgpt4O kosztował 100 milionów dolarów.

Popularne gry Więcej +
Najnowsze gry Więcej +
Puzzle | 161.5 MB
Usuń granice swojej wyobraźni, rozwiąż łamigłówki i odkryj, co jest ukryte! Przeczytaj ... Ustaw ... usuń! Czy zawsze byłeś pierwszym, który zauważyłeś Waldo jako dziecko, najlepszy w I Spy, a nawet po prostu mistrzem zagadek i zagadek? Następnie DOP5: Usuń jedną część to gra puzzli, na którą czekałeś! Umieść swój
Puzzle | 142.90M
Chcesz rzucić wyzwanie mózgu i jednocześnie dobrze się bawić? Nie szukaj dalej niż ** Wordly: link razem litery **! Ta interaktywna gra słów oferuje wyjątkowe i wciągające wrażenia dla graczy na wszystkich poziomach. Niezależnie od tego, czy jesteś Pro wyszukiwania słów, czy dopiero zaczynasz, słowo przedstawia cię
Działanie | 95.2 MB
Zanurz się w świat „Dinorobotcar: Robot Games”, pełnej akcji, w której gracze angażują się w ekscytujące bitwy z samochodami robotów, które mogą przekształcić się w potężne stworzenia i samochody przypominające dinozaura. Ta gra transformacji robota to ekscytująca mieszanka robota dinozaurów
Zwykły | 77.8 MB
Witamy w Pickygames Wawa, ostatecznym miejscu do gry w prawdziwe gry zręcznościowe na smartfonie, zabawę i wygrywanie ekscytujących nagród! Oferujemy bezpłatną wysyłkę do USA i Singapuru, z zastrzeżeniem naszych warunków. Pickygames zapewnia nowe i ekscytujące wrażenia, al
Drobnostki | 103.9 MB
Przygotuj się do gry i zarabiaj pieniądze dzięki ekscytującej nowej aplikacji Quiz na żywo! Przedstawiamy niedługo aplikację Pakistanu nr 1 na żywo, w której można wziąć udział w ekscytujących quizach, aby wygrać prawdziwe pieniądze i duże utrudnione prezenty, wszystko za darmo! Dołącz teraz i weź udział w dwóch rodzajach quizów:
Zwykły | 107.00M
Wejdź w fascynujący wszechświat „Cheat Chat”, gry, która płynnie łączy granice między rzeczywistością a światem cyfrowym. Wyrusz w niezrównaną cyfrową podróż randkową wykonaną przez Laboratorium Fakera. Przygotuj się na radosną kolejkę emocji podczas poruszania się przez złożony gobelin