Heim Nachricht Deepseek AI Development kostet 1,6 Milliarden US -Dollar und entlarvt den Mythos für Erschwinglichkeit

Deepseek AI Development kostet 1,6 Milliarden US -Dollar und entlarvt den Mythos für Erschwinglichkeit

Autor : Gabriel Aktualisieren:Apr 21,2025

Es ist jedoch immer noch billiger als seine Konkurrenten.

Der neue Chatbot von Deepseek begrüßte mich mit einer faszinierenden Einführung:

Hallo, ich wurde erstellt, damit Sie alles fragen und eine Antwort erhalten können, die Sie sogar überraschen könnte.

Heute hat sich Deepseeks künstliche Intelligenz als beeindruckende Akteur auf dem Markt herausgestellt und sogar einen der bedeutendsten Aktienkurs von NVIDIA verursacht.

Deepseek -Test Bild: Ensigame.com

Was dieses Modell auszeichnet, sind seine innovativen Architektur- und Trainingsmethoden. Deepseek verwendet mehrere hochmoderne Technologien:

Multi-Token-Vorhersage (MTP): Anstatt jeweils ein Wort vorherzusagen, prognostiziert das Modell mehrere Wörter gleichzeitig, indem verschiedene Teile eines Satzes analysiert werden. Dieser Ansatz verbessert sowohl die Genauigkeit als auch die Effizienz des Modells erheblich.

Mischung von Experten (MOE): Diese Architektur verwendet verschiedene neuronale Netze, um Eingabedaten zu verarbeiten. Die Technologie beschleunigt das KI -Training und verbessert die Leistung. In Deepseek V3 werden 256 neuronale Netze verwendet, wobei acht für jede Token -Verarbeitungsaufgabe aktiviert werden.

Multi-Head Latent Achtung (MLA): Dieser Mechanismus konzentriert sich auf die wichtigsten Teile eines Satzes. MLA extrahiert Schlüsseldetails aus Textfragmenten wiederholt und nicht nur einmal, wodurch die Wahrscheinlichkeit von fehlenden wichtigen Informationen verringert wird. Dadurch kann die KI wichtige Nuancen in den Eingabedaten effektiver erfassen.

Das prominente chinesische Startup Deepseek behauptet, ein wettbewerbsfähiges KI -Modell zu minimalen Kosten entwickelt zu haben. Sie erklärte, sie hätten nur 6 Millionen US -Dollar für die Schulung des leistungsstarken neuronalen Netzwerks Deepseek V3 ausgegeben und nur 2048 Grafikprozessoren verwendet.

Deepseek v3 Bild: Ensigame.com

Analysten der semianalyse haben jedoch aufgedeckt, dass Deepseek eine große Computerinfrastruktur betreibt, die ungefähr 50.000 NVIDIA Hopper -GPUs umfasst. Dies beinhaltet 10.000 H800 -Einheiten, 10.000 fortschrittliche H100 und zusätzliche Chargen von H20 -GPUs. Diese Ressourcen werden über mehrere Rechenzentren verteilt und für KI -Schulungen, Forschung und Finanzmodellierung verwendet.

Die Gesamtinvestition des Unternehmens in Server beträgt rund 1,6 Milliarden US -Dollar, wobei die operativen Ausgaben auf 944 Mio. USD geschätzt werden.

Deepseek ist eine Tochtergesellschaft des chinesischen Hedgefonds-High-Flyer, das das Startup als separate Abteilung ausgab, die sich 2023 auf KI-Technologien konzentriert. Im Gegensatz zu den meisten Startups, die Computerleistung von Cloud-Anbietern mieten, besitzt Deepseek seine eigenen Datenzentren, die die vollständige Kontrolle über AI-Modelloptimierung und eine fasterende Implementierung von Faster-Implementierungen von Innovationen in der Lage haben. Das Unternehmen bleibt selbst finanziert, was sich positiv auf seine Flexibilität und Entscheidungsgeschwindigkeit auswirkt.

Deepseek Bild: Ensigame.com

Darüber hinaus verdienen einige Forscher von Deepseek jährlich über 1,3 Millionen US -Dollar und ziehen Top -Talente von führenden chinesischen Universitäten an (das Unternehmen stellt keine ausländischen Spezialisten ein).

Trotz dieser Faktoren scheint Deepseeks jüngster Behauptung, sein jüngstes Modell für nur 6 Millionen US -Dollar auszubilden, unrealistisch. Diese Zahl bezieht sich nur auf die Kosten der GPU-Nutzung während der Vorausbildung und berücksichtigt keine Forschungskosten, die Verfeinerung der Modellverarbeitung, die Datenverarbeitung oder die Gesamtkosten der Infrastruktur.

Seit seiner Gründung hat Deepseek über 500 Millionen US -Dollar in die KI -Entwicklung investiert. Im Gegensatz zu größeren Unternehmen, die durch die Bürokratie belastet sind, ermöglicht die kompakte Struktur von Deepseek sie jedoch, KI -Innovationen aktiv und effektiv umzusetzen.

Deepseek Bild: Ensigame.com

Das Beispiel von Deepseek zeigt, dass ein gut finanziertes unabhängiges KI-Unternehmen mit Branchenführern konkurrieren kann. Trotzdem betonen Experten, dass der Erfolg des Unternehmens hauptsächlich auf Milliarden an Investitionen, technischen Durchbrüchen und einem starken Team zurückzuführen ist, während die Behauptungen über ein "revolutionäres Budget" für die Entwicklung von KI -Modellen etwas übertrieben sind.

Dennoch bleiben die Kosten der Wettbewerber deutlich höher. Vergleichen Sie beispielsweise die Kosten für das Modelltraining: Deepseek gab 5 Millionen US -Dollar für R1 aus, während Chatgpt4O 100 Millionen US -Dollar kostete.

Trendspiele Mehr +
0.01 / 352.80M
1.1 / 718.00M
0.036 / 431.31M
2.1 / 994.20M
Neueste Spiele Mehr +
Rollenspiel | 292.6 MB
It looks like you've shared an official promotional blurb for Buriedbornes 2, the highly anticipated sequel to the beloved turn-based dungeon RPG series. Here's a polished and engaging summary of the content you provided—ideal for use on a game websi
Sport | 1.7 GB
Erleben Sie neun Innings spannenden Baseball-Action und sichern Sie sich dabei erstaunliche Belohnungen!Spielen Sie das offizielle MLB-lizenzierte Baseball-Spiel!Stürzen Sie sich in eine Live-MLB-Mobile-Baseball-Erlebnis, mit dem 2023er Willie Mays W
Sport | 64.50M
Absolutely! Here's a polished and engaging version of your original content, optimized for clarity, flow, and appeal—perfect for use in an app store description, promotional website, or social media post: 🔥 Master the Cue: Play Pool Online – 8 Ball,
Aktion | 89.90M
Erleben Sie den Nervenkitzel, neue Höhen im spannenden Mobilspiel Dune! zu erreichen. Testen Sie Ihre Reaktionsfähigkeit, während Sie Ihre Figur nach oben steuern und über die Linie springen, um Punkte zu sammeln. Aber seien Sie vorsichtig – je höher
Karte | 91.40M
Absolutely! Here's a polished and engaging version of your original text, optimized for a game launch announcement, app store description, or promotional website — keeping it dynamic, immersive, and audience-focused: 🔥 Step Into the Arena: Clash of
Wissenswertes | 90.6 MB
Treten Sie über 8 Millionen Menschen bei, die die Prüfung mit Quiz Patente bestanden haben.Treten Sie über 8 Millionen Nutzern bei, die ihre Theorietest mit Quiz Patente bestanden haben.Beherrschen Sie die Theorie für die Führerscheinklassen B, A und