MÜNCHEN (IT BOLTWISE) – Die Entwicklung von DeepSeek-V3, einem fortschrittlichen KI-Modell, hat sich als deutlich teurer herausgestellt als ursprünglich angenommen. Trotz der offiziellen Angaben, die die Kosten auf etwa 5,6 Millionen US-Dollar beziffern, deuten neue Analysen darauf hin, dass die tatsächlichen Ausgaben erheblich höher liegen könnten.
Die Entwicklung von DeepSeek-V3, einem der neuesten KI-Modelle, hat in der Tech-Branche für Aufsehen gesorgt. Ursprünglich wurden die Kosten für das Training des Modells auf etwa 5,6 Millionen US-Dollar geschätzt. Diese Zahl basiert auf der Nutzung eines Rechenzentrums mit 2048 H800-GPUs von NVIDIA, wobei hypothetische Mietkosten von 2 US-Dollar pro Stunde und GPU angenommen wurden. Doch diese Zahlen scheinen nur die Spitze des Eisbergs zu sein.
DeepSeek hat über sein Mutterunternehmen High-Flyer Zugriff auf eine beeindruckende Anzahl von 60.000 NVIDIA-GPUs, darunter 10.000 A100 aus der Ampere-Generation und 10.000 H100 vom Graumarkt. Diese GPUs sind entscheidend für die Entwicklung und das Training von KI-Modellen, insbesondere in einem Umfeld, das durch US-Exportbeschränkungen geprägt ist.
Die tatsächlichen Kosten der Entwicklung könnten sich auf weit mehr als die angegebenen 5,6 Millionen US-Dollar belaufen. Analysten von Semianalysis schätzen, dass allein die notwendigen Server für die 60.000 GPUs etwa 1,6 Milliarden US-Dollar kosten könnten, ohne die Betriebskosten und die Gehälter der Entwicklungsteams zu berücksichtigen.
Ein wesentlicher Teil der Kosten entfällt auf das Pre-Training des Modells, das die Grundlage für die endgültige Version bildet. Die Entwickler von DeepSeek weisen darauf hin, dass die angegebenen Kosten nicht die Ausgaben für frühere Forschungs- und Ablationsexperimente umfassen, die für die Entwicklung der Architektur und Algorithmen entscheidend waren.
Besonders bemerkenswert sind die technischen Innovationen, die in DeepSeek-V3 eingeflossen sind. Die Multi-Head Latent Attention (MLA) Technik komprimiert generierte Token, um bei neuen Abfragen schnell auf die Daten zugreifen zu können. Eine weitere Neuerung ist die „Dual Pipe“-Technologie, die einen Teil der Streaming-Multiprozessoren (SMs) in NVIDIAs GPUs als virtuelle Data Processing Unit (DPU) nutzt, um die Effizienz zu steigern.
Die Entwicklung von DeepSeek-V3 zeigt, wie komplex und kostspielig die Entwicklung moderner KI-Modelle sein kann. Die Nutzung von Hochleistungs-GPUs und die Implementierung neuer Technologien erfordern erhebliche Investitionen, die weit über die reinen Trainingskosten hinausgehen. Dies unterstreicht die Herausforderungen, denen sich Unternehmen in der KI-Entwicklung gegenübersehen, insbesondere in einem sich schnell verändernden regulatorischen Umfeld.
- NIEDLICHER BEGLEITER: Eilik ist der ideale Begleiter für Kinder und Erwachsene, die Haustiere, Spiele und intelligente Roboter lieben. Mit vielen Emotionen, Bewegungen und interaktiven Funktionen.
- Die besten Bücher rund um KI & Robotik!
- Die besten KI-News kostenlos per eMail erhalten!
- Zur Startseite von IT BOLTWISE® für aktuelle KI-News!
- Service Directory für AI Adult Services erkunden!
- IT BOLTWISE® kostenlos auf Patreon unterstützen!
- Aktuelle KI-Jobs auf StepStone finden und bewerben!
Stellenangebote
(Senior-) Full-Stack-Entwickler (m/w/d) für Produktmodellierung und KI-Services in der Mathematik
Requirements Engineer / Business Analyst mit Schwerpunkt KI-gestützte IT-Dienste (m/w/d)
Software Engineer / Softwareentwickler (w/m/d) Schwerpunkt Künstliche Intelligenz
Senior Solution Customer Success Manager (f/m/d) for SAP Business AI
- Die Zukunft von Mensch und MaschineIm neuen Buch des renommierten Zukunftsforschers und Technologie-Visionärs Ray Kurzweil wird eine faszinierende Vision der kommenden Jahre und Jahrzehnte entworfen – eine Welt, die von KI durchdrungen sein wird
- Künstliche Intelligenz: Expertenwissen gegen Hysterie Der renommierte Gehirnforscher, Psychiater und Bestseller-Autor Manfred Spitzer ist ein ausgewiesener Experte für neuronale Netze, auf denen KI aufbaut
- Obwohl Künstliche Intelligenz (KI) derzeit in aller Munde ist, setzen bislang nur wenige Unternehmen die Technologie wirklich erfolgreich ein
- Wie funktioniert Künstliche Intelligenz (KI) und gibt es Parallelen zum menschlichen Gehirn? Was sind die Gemeinsamkeiten von natürlicher und künstlicher Intelligenz, und was die Unterschiede? Ist das Gehirn nichts anderes als ein biologischer Computer? Was sind Neuronale Netze und wie kann der Begriff Deep Learning einfach erklärt werden?Seit der kognitiven Revolution Mitte des letzten Jahrhunderts sind KI und Hirnforschung eng miteinander verflochten
Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "DeepSeek: Kosten der KI-Entwicklung weit höher als angenommen" für unsere Leser?
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Du möchtest über ähnliche News und Beiträge wie "DeepSeek: Kosten der KI-Entwicklung weit höher als angenommen" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
Nutze die deutsche Google-Suchmaschine für eine weitere Themenrecherche: »DeepSeek: Kosten der KI-Entwicklung weit höher als angenommen« bei Google Deutschland suchen und bei Google News recherchieren!