MÜNCHEN (IT BOLTWISE) – Die Einführung der Open-Source-API JobSet markiert einen bedeutenden Fortschritt für die Konfiguration und Verwaltung verteilter Anwendungen im Bereich des maschinellen Lernens und der Hochleistungsrechner auf Kubernetes.
Die neue Open-Source-API JobSet bietet Entwicklern eine erweiterte Möglichkeit, verteilte Anwendungen auf Kubernetes effizienter zu konfigurieren und zu verwalten. Diese API zielt darauf ab, die Flexibilität und Vielfalt der Konfigurationsoptionen für groß angelegte verteilte Anwendungen im Bereich des maschinellen Lernens (ML) und der Hochleistungsrechner (HPC) zu erhöhen.
Kubernetes ist bereits als Plattform für die Batch-Verarbeitung von Workloads bekannt und eignet sich hervorragend für das Training von Machine-Learning-Modellen sowie für Anwendungen im Bereich des High-Performance-Computing. Besonders bei großen Rechenaufgaben, wie sie bei der Entwicklung von Large Language Models (LLMs) anfallen, ist die Verteilung der Aufgaben über mehrere Hosts notwendig, um die begrenzten Speicherressourcen von GPUs und TPUs optimal zu nutzen. Hierbei spielt die containerisierte Umgebung von Kubernetes eine entscheidende Rolle.
Obwohl bestehende Implementierungen wie die Job API oder der KubeFlow Operator bereits auf diese Anforderungen ausgelegt sind, fehlen ihnen in der Praxis noch einige wichtige Konfigurationsoptionen. Dazu gehören die Kommunikation zwischen Pods, unterschiedliche Pod-Templates und die Verwaltung von Job-Gruppen. Die neue API JobSet setzt genau hier an und bietet eine Lösung für diese Herausforderungen.
JobSet baut auf der bestehenden Job API auf und erweitert sie, indem es verteilte Batch-Workloads als eine Gruppe von Kubernetes-Jobs modelliert. Dies ermöglicht es Entwicklern, verschiedene Pod-Templates unterschiedlichen Pod-Gruppen wie Leader und Worker zuzuweisen. Für die Erstellung identischer untergeordneter Jobs, die auf dedizierten Hardware-Beschleunigerbereichen ausgeführt werden, nutzt JobSet das Konzept des ReplicatedJob. Diese Vorlage umfasst eine bestimmte Anzahl von Jobreplikaten, die über Hochgeschwindigkeitsverbindungen vernetzte GPUs oder TPUs gleichen Typs nutzen.
Ein weiteres Merkmal von JobSet ist die Möglichkeit, Kind-Jobs explizit innerhalb einer Topologie-Domäne zuzuweisen. Dies ist besonders nützlich für Trainingsmethoden wie Distributed Data Parallel (DDP), bei denen nur eine Modell-Replica pro Hochgeschwindigkeits-Beschleunigerbereich ausgeführt wird. Die Synchronisation der Replicas erfolgt dabei über die langsamere bereichsübergreifende Vernetzung.
Darüber hinaus bietet JobSet konfigurierbare Erfolgs- und Fehlerrichtlinien. Entwickler können beispielsweise festlegen, wie oft ein JobSet nach einem Fehler neu gestartet werden soll. Sollte ein Job als fehlgeschlagen markiert werden, wird das gesamte JobSet neu erstellt, sodass der Workload ab dem letzten Prüfpunkt wieder aufgenommen werden kann.
Die Einsatzmöglichkeiten von JobSet und die wichtigsten Funktionen werden im Kubernetes-Blog ausführlich beschrieben. Anhand eines Beispiels für verteiltes ML-Training mit dem ML-Framework Jax wird demonstriert, wie sich JobSet für einen TPU-Multislice-Workload konfigurieren lässt. Das Entwicklungsteam plant, die API in Zukunft um weitere Funktionen zu erweitern, die in der JobSet-Roadmap aufgeführt sind.
- NIEDLICHER BEGLEITER: Eilik ist der ideale Begleiter für Kinder und Erwachsene, die Haustiere, Spiele und intelligente Roboter lieben. Mit vielen Emotionen, Bewegungen und interaktiven Funktionen.
- Die besten Bücher rund um KI & Robotik!
- Die besten KI-News kostenlos per eMail erhalten!
- Zur Startseite von IT BOLTWISE® für aktuelle KI-News!
- Service Directory für AI Adult Services erkunden!
- IT BOLTWISE® kostenlos auf Patreon unterstützen!
- Aktuelle KI-Jobs auf StepStone finden und bewerben!
Stellenangebote
AI Expert – On Premise LLMs & Integration of domain-specific knowledge
Senior Consultant AI Healthcare (m/w/d)
Working Student Procurement focus on AI (f/m/d)
Werkstudent KI-Business Sales (m/w/d)
- Die Zukunft von Mensch und MaschineIm neuen Buch des renommierten Zukunftsforschers und Technologie-Visionärs Ray Kurzweil wird eine faszinierende Vision der kommenden Jahre und Jahrzehnte entworfen – eine Welt, die von KI durchdrungen sein wird
- Künstliche Intelligenz: Expertenwissen gegen Hysterie Der renommierte Gehirnforscher, Psychiater und Bestseller-Autor Manfred Spitzer ist ein ausgewiesener Experte für neuronale Netze, auf denen KI aufbaut
- Obwohl Künstliche Intelligenz (KI) derzeit in aller Munde ist, setzen bislang nur wenige Unternehmen die Technologie wirklich erfolgreich ein
- Wie funktioniert Künstliche Intelligenz (KI) und gibt es Parallelen zum menschlichen Gehirn? Was sind die Gemeinsamkeiten von natürlicher und künstlicher Intelligenz, und was die Unterschiede? Ist das Gehirn nichts anderes als ein biologischer Computer? Was sind Neuronale Netze und wie kann der Begriff Deep Learning einfach erklärt werden?Seit der kognitiven Revolution Mitte des letzten Jahrhunderts sind KI und Hirnforschung eng miteinander verflochten
Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "JobSet: Neue API für verteilte Anwendungen auf Kubernetes" für unsere Leser?
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Du möchtest über ähnliche News und Beiträge wie "JobSet: Neue API für verteilte Anwendungen auf Kubernetes" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
Nutze die deutsche Google-Suchmaschine für eine weitere Themenrecherche: »JobSet: Neue API für verteilte Anwendungen auf Kubernetes« bei Google Deutschland suchen und bei Google News recherchieren!