NEW YORK / MÜNCHEN (IT BOLTWISE) – Getty Images geht aufs Ganze, um sich als vertrauenswürdiger Datenpartner zu etablieren. Das Unternehmen, bekannt für die Bereitstellung und den Verkauf visueller Inhalte von Fotografen und Videografen weltweit, hat heute bekannt gegeben, dass es Bilder aus seiner Bibliothek als ein Open Dataset auf Hugging Face veröffentlicht.
Getty Images hebt sich mit diesem Schritt von der Masse der visuellen Datensätze auf der Hugging Face-Plattform ab. Laut dem Unternehmen bietet das Dataset hohe Zuverlässigkeit und rechtliche Sicherheit. Unternehmen können es bedenkenlos in ihre KI-Trainingspipelines integrieren, ohne Bedenken hinsichtlich der Qualität oder möglicher rechtlicher Herausforderungen zu haben.
„Stellen Sie sich vor, Sie könnten Ihre KI/ML-Fähigkeiten mit Daten aufbauen oder erweitern, die nicht nur vielfältig und hochwertig sind, sondern auch die Gewissheit bieten, dass sie verantwortungsbewusst beschafft wurden. Genau das bringen wir auf den Tisch,“ erklärte Andrea Gagliano, Leiterin der Datenwissenschaft und KI/ML bei Getty Images.
Das Unternehmen hofft, durch diesen Schritt ein Ökosystem zu schaffen, in dem sich KI-Unternehmen bevorzugt für offiziell lizenzierte Inhalte von der Plattform entscheiden, um ihre KI-Modelle zu trainieren.
Was bietet das Getty Images Dataset?
Beim Training von KI/ML-Modellen stehen Entwickler oft vor der Herausforderung von schlecht beschafften, qualitativ minderwertigen Daten. Um diese Mängel zu beheben, müssen die Datenbestände oft mehrfach überarbeitet werden, um Duplikate zu entfernen, beschädigte Dateien zu bereinigen und gefährliche oder unerwünschte Elemente wie Promibilder, Markeninhalte, NSFW-Inhalte oder niedrige Auflösungen auszuschließen.
Dieser Reinigungsprozess kann, insbesondere bei großen Datensätzen, viel Zeit und Ressourcen beanspruchen, was zu verpassten Chancen für das Engineering-Team führt. Trotz aller Mühe können immer noch problematische Inhalte durchschlüpfen und rechtliche Konflikte verursachen.
Getty Images will mit seinem neuen Open Dataset auf Hugging Face all diese Herausforderungen lösen. Es bietet Entwicklern eine direkt nutzbare Sammlung von qualitativ hochwertigen Bildern aus 15 Kategorien.
„Dieses Beispiel-Dataset enthält 3.750 Bilder aus 15 Kategorien, darunter abstrakte Hintergründe, Geschäftswelten, Konzepte, Bildung, Gesundheitswesen, Icons, Industrie, Natur, Illustrationen und Reisen“, erläutert Gagliano.
Das Dataset stammt aus der vollständig eigenen kreativen Bibliothek von Getty Images, was bedeutet, dass die Bilder kommerziell sicher sind und ohne rechtliche Bedenken verwendet werden können. Zudem sind keine aufwendigen Reinigungs- oder Anreicherungsprozesse erforderlich, da das gesamte Set speziell für das maschinelle Lernen kuratiert wurde. Alle Bilder sind hochauflösend, mit strukturierten Metadaten versehen und enthalten keine unerwünschten Elemente wie NSFW-Inhalte.
Verwendungsbedingungen beachten
Obwohl das Sample-Dataset offen zur Nutzung bereitsteht, gelten bestimmte Bedingungen, um sicherzustellen, dass die lizenzierten Inhalte verantwortungsbewusst verwendet werden. Zu den Einschränkungen zählen unter anderem das Verbot der Weiterverteilung des Datensatzes, die Entwicklung von Software zur Nachbildung oder Reproduktion der Inhalte und die Schaffung von Produkten, die in direkter Konkurrenz zu Getty Images stehen. Ebenso ist die Erstellung oder Nutzung biometrischer Identifikatoren aus dem Datensatz untersagt.
Getty Images erhofft sich, dass dieser Schritt die Entwicklergemeinschaft stärker einbindet und sie die Tiefe und Breite der angebotenen Inhalte besser versteht. Das Unternehmen möchte zeigen, dass es als vertrauenswürdiger Partner für lizenzierte, hochwertige Daten im Bereich des verantwortungsvollen KI-Trainings auftreten kann.
„Unser Ziel ist es zu zeigen, dass es möglich ist, Lizenzen für alle benötigten Inhalte zum Trainieren funktionsfähiger KI-Modelle zu bieten. Damit entwickeln wir Geschäftsmodelle, die die Erstellung hochwertiger KI-Modelle ermöglichen und gleichzeitig das geistige Eigentum der Ersteller respektieren“, fügte Gagliano hinzu.
Entwickler, die mehr Daten benötigen, können sich mit Getty Images in Verbindung setzen, um eine größere, lizenzierte Datenquelle für ihre jeweiligen Anwendungsfälle zu erhalten. Dieses Modell sorgt auch dafür, dass die ursprünglichen Ersteller der Inhalte eine jährliche, wiederkehrende Vergütung erhalten. Bemerkenswert ist, dass Getty Images diesen Ansatz bereits bei der Entwicklung seines KI-Bildgenerierungstools in Partnerschaft mit NVIDIA angewendet hat.
- NIEDLICHER BEGLEITER: Eilik ist der ideale Begleiter für Kinder und Erwachsene, die Haustiere, Spiele und intelligente Roboter lieben. Mit vielen Emotionen, Bewegungen und interaktiven Funktionen.
- Die besten Bücher rund um KI & Robotik!
- Die besten KI-News kostenlos per eMail erhalten!
- Zur Startseite von IT BOLTWISE® für aktuelle KI-News!
- Service Directory für AI Adult Services erkunden!
- IT BOLTWISE® kostenlos auf Patreon unterstützen!
- Aktuelle KI-Jobs auf StepStone finden und bewerben!
Stellenangebote
Product Architect (m/w/d) Submarine Systems/ACINT mit Schwerpunkt KI/AR
(Senior) IT Consultant IoT & KI (all genders)
Business Development System-On-Chip und Künstliche Intelligenz
Leiter*in Digital & AI Solutions
- Die Zukunft von Mensch und MaschineIm neuen Buch des renommierten Zukunftsforschers und Technologie-Visionärs Ray Kurzweil wird eine faszinierende Vision der kommenden Jahre und Jahrzehnte entworfen – eine Welt, die von KI durchdrungen sein wird
- Künstliche Intelligenz: Expertenwissen gegen Hysterie Der renommierte Gehirnforscher, Psychiater und Bestseller-Autor Manfred Spitzer ist ein ausgewiesener Experte für neuronale Netze, auf denen KI aufbaut
- Obwohl Künstliche Intelligenz (KI) derzeit in aller Munde ist, setzen bislang nur wenige Unternehmen die Technologie wirklich erfolgreich ein
- Wie funktioniert Künstliche Intelligenz (KI) und gibt es Parallelen zum menschlichen Gehirn? Was sind die Gemeinsamkeiten von natürlicher und künstlicher Intelligenz, und was die Unterschiede? Ist das Gehirn nichts anderes als ein biologischer Computer? Was sind Neuronale Netze und wie kann der Begriff Deep Learning einfach erklärt werden?Seit der kognitiven Revolution Mitte des letzten Jahrhunderts sind KI und Hirnforschung eng miteinander verflochten
Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "Getty Images stellt kommerziell sicheres Dataset für KI-Modelle bereit" für unsere Leser?
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Du möchtest über ähnliche News und Beiträge wie "Getty Images stellt kommerziell sicheres Dataset für KI-Modelle bereit" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
Nutze die deutsche Google-Suchmaschine für eine weitere Themenrecherche: »Getty Images stellt kommerziell sicheres Dataset für KI-Modelle bereit« bei Google Deutschland suchen und bei Google News recherchieren!