Nvidias neue offene KI NVLM 1.0 stellt sich gegen GPT-4 - IT BOLTWISE® x Artificial Intelligence

MÜNCHEN (IT BOLTWISE) – Nvidia hat mit der Veröffentlichung seines neuen offenen KI-Modells NVLM 1.0 die KI-Branche aufgerüttelt. Dieses Modell stellt eine direkte Konkurrenz zu führenden proprietären Systemen wie GPT-4 dar.



Nvidias neues NVLM 1.0, eine Familie multimodaler großer Sprachmodelle, hebt sich vor allem durch das Modell NVLM-D-72B hervor, das mit seinen 72 Milliarden Parametern beeindruckende Ergebnisse sowohl bei visuellen als auch textuellen Aufgaben liefert. Besonders bemerkenswert ist, dass es nach der multimodalen Schulung seine Textverarbeitungsfähigkeiten verbessert, was bei ähnlichen Modellen oft nicht der Fall ist.

„Wir stellen NVLM 1.0 vor, eine Familie multimodaler Sprachmodelle, die bei Aufgaben in den Bereichen Bild und Sprache State-of-the-Art-Ergebnisse erzielt und mit führenden proprietären Modellen wie GPT-4 konkurriert“, erläutern die Forscher in ihrem Paper.

Ein Wendepunkt in der KI-Forschung ist, dass Nvidia beschlossen hat, die Modellgewichte öffentlich zugänglich zu machen und den Trainingscode freizugeben. Dieser Schritt gibt Forschern und Entwicklern weltweit Zugang zu hochmoderner Technologie, die bislang den großen Tech-Unternehmen vorbehalten war.

Nvidia zeigt in Benchmark-Ergebnissen, dass das NVLM-D-Modell in verschiedenen visuellen und sprachlichen Aufgaben mit AI-Giganten wie GPT-4, Claude 3.5 und Llama 3-V konkurriert. Besonders bemerkenswert ist die Fähigkeit des NVLM-D-72B, komplexe visuelle und textuelle Eingaben zu verarbeiten. Die Forscher stellten dabei dar, wie das Modell Memes interpretieren, Bilder analysieren und mathematische Probleme Schritt für Schritt lösen kann.

Eine Besonderheit des NVLM-D-72B ist die Fähigkeit, nach multimodaler Schulung sogar bei rein textuellen Aufgaben an Genauigkeit zuzulegen. Während ähnliche Modelle häufig eine Verschlechterung der Textverarbeitung aufweisen, verbesserte sich die Textgenauigkeit des NVLM-D-72B um durchschnittlich 4,3 Punkte bei wichtigen Benchmarks.

In der AI-Community ist die Reaktion auf Nvidias offenen Ansatz durchweg positiv. Ein KI-Forscher kommentierte auf Social Media: „Wow! Nvidia hat ein 72B-Modell veröffentlicht, das in Mathematik- und Codierungsbewertungen fast auf dem Niveau von Llama 3.1 mit 405B liegt und zusätzlich visuelle Fähigkeiten besitzt!“

Durch die Offenlegung eines so mächtigen Modells könnte Nvidia die AI-Forschung und -Entwicklung erheblich beschleunigen. Kleinere Unternehmen und unabhängige Forscher haben nun Zugang zu Werkzeugen, die bisher den großen Tech-Konzernen vorbehalten waren.

Das NVLM-Projekt bringt auch innovative architektonische Konzepte mit sich, darunter einen hybriden Ansatz, der verschiedene multimodale Verarbeitungstechniken kombiniert. Diese Entwicklung könnte die Forschung in der KI weiter beeinflussen.

Mit der Veröffentlichung von NVLM 1.0 hat Nvidia einen Meilenstein in der KI-Entwicklung gesetzt. Die Entscheidung, ein Modell zu veröffentlichen, das es mit den proprietären Riesen der Branche aufnehmen kann, stellt nicht nur eine Bereitstellung von Code dar – es ist eine klare Ansage an die gesamte KI-Industrie.

Dieser Schritt könnte andere Tech-Führer unter Druck setzen, ihre Forschung ebenfalls zu öffnen, was zu einem schnelleren Fortschritt in der gesamten Branche führen könnte. Gleichzeitig wird jedoch auch die Diskussion um mögliche Missbrauchsrisiken mächtiger KI-Systeme lauter. Die KI-Gemeinschaft steht nun vor der Herausforderung, Innovationen zu fördern und gleichzeitig ethische Grenzen zu setzen.

Nvidias Entscheidung wirft auch Fragen zur Zukunft der Geschäftsmodelle im KI-Bereich auf. Wenn State-of-the-Art-Modelle frei zugänglich werden, müssen Unternehmen möglicherweise neue Wege finden, um Wert zu schaffen und in der hart umkämpften KI-Landschaft relevant zu bleiben.

Die Auswirkungen der Veröffentlichung von NVLM 1.0 werden sich in den kommenden Monaten und Jahren zeigen. Es könnte eine Ära der beispiellosen Zusammenarbeit und Innovation einläuten – oder eine Diskussion über die unbeabsichtigten Folgen der Zugänglichkeit fortschrittlicher KI-Systeme anstoßen.

Eines steht fest: Nvidia hat die Karten auf den Tisch gelegt, und die Frage ist nicht mehr, ob sich die KI-Landschaft verändern wird, sondern wie drastisch – und wer sich schnell genug anpassen kann, um in dieser neuen Welt der offenen KI zu bestehen.

Nvidias neue offene KI NVLM 1.0 stellt sich gegen GPT-4
Nvidias neue offene KI NVLM 1.0 stellt sich gegen GPT-4 (Foto: DALL-E, IT BOLTWISE)
Hinweis: Teile dieses Textes könnten mithilfe Künstlicher Intelligenz generiert worden sein.



Ergänzungen und Infos bitte an die Redaktion per eMail an de-info[at]it-boltwise.de
Stichwörter
Alle Märkte in Echtzeit verfolgen - 30 Tage kostenlos testen!


#Abo
LinkedIn
Facebook
Twitter
#Podcast
YouTube
Spotify
Apple

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert



Es werden alle Kommentare moderiert!

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.

Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.

Du willst nichts verpassen?

Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.