MÜNCHEN (IT BOLTWISE) – Google Cloud stellt Imagen 2 vor, eine fortschrittliche Lösung im Bereich der Text-zu-Bild-Generierung, die neue Maßstäbe in puncto Bildqualität und Funktionalität setzt.
Google hat Imagen 2 vorgestellt, die neueste Version seines Text-zu-Bild-KI-Modells. Dieses neue Modell verspricht durch neue Techniken Neuronale Netze zu verwenden noch realistischere und detailliertere Bildgenerierungskapazitäten.
Im Gegensatz zu OpenAIs DALL-E3 oder Werkzeugen von Adobe und Midjourney konzentriert sich Google darauf, Imagen 2 als API für Entwickler bereitzustellen, anstatt als eigenständige Verbraucher-App.
Basierend auf der bestehenden Imagen API, die letztes Jahr eingeführt wurde, bietet Imagen 2 deutlich verbesserte Bildqualität und ein besseres Verständnis für Textaufforderungen. Durch Änderungen an seinen Trainingsdaten und Methoden erzeugt Imagen 2 Bilder in höherer Auflösung und ästhetisch ansprechender, die eng mit den gegebenen Beschreibungen übereinstimmen.
Google hat speziell die Bildunterschriften verbessert, die zur Schulung von Imagen 2 verwendet wurden, um dem Modell zu helfen, Elemente wie Kontext und Nuancen besser zu erfassen. Zusätzliche Schulungen konzentrierten sich auf die Verbesserung der Darstellung von herausfordernden Bereichen wie Händen und Gesichtern und die Minimierung visueller Artefakte. Das Unternehmen hat außerdem ein Bildqualitätsbewertungssystem eingesetzt, um die Ergebnisse weiter zu verfeinern.
Imagen 2 führt andere neue Funktionen ein, um mehr Kontrolle über Bildeigenschaften zu ermöglichen. Nutzer können jetzt Referenzbilder im Stil bereitstellen, und Imagen 2 übernimmt die gewünschten Stile wie Beleuchtung, Texturen und Farbpaletten.
Die API gewinnt auch erweiterte Inpainting- und Outpainting-Fähigkeiten, um generierte Inhalte in bestehende Bilder einzufügen oder Bilder über ihre Grenzen hinaus zu erweitern.
Die mehrsprachige Unterstützung ermöglicht Aufforderungen und Ergebnisse in bisher sieben Sprachen, mit mehr, die noch folgen werden. Imagen 2 kann sogar Text innerhalb von Bildern in der entsprechenden Sprache rendern.
Dies eröffnet reichhaltige Möglichkeiten für Branding und Lokalisierung. Die Logoerstellung ermöglicht es Nutzern, benutzerdefinierte Logos zu erstellen, die dann nahtlos in andere Medien integriert werden können.
Google betont, dass Verantwortung zentral in der Entwicklung von Imagen 2 steht. Vor dem Start führte das Unternehmen Sicherheitstests in sensiblen Kategorien durch, um Probleme zu vermeiden. Imagen 2 verbindet sich auch mit Googles SynthID-Tool, um KI-generierte Bilder auf Pixelebene unsichtbar zu kennzeichnen, was Authentifizierung und Rückverfolgung ermöglicht.
Für zahlende Kunden, die auf der Allowlist stehen, ist Imagen 2 jetzt über Googles Vertex AI-Plattform verfügbar. Zu den frühen Anwendern zählen bereits große kreative Marken wie Snap, Shutterstock und Canva.
Unternehmen wie Snap, Shutterstock und Canva haben Imagen bereits für kreative Zwecke genutzt. Chris Loy, Direktor für KI-Dienste bei Shutterstock, kommentierte: „Wir existieren, um der Welt zu ermöglichen, ihre Geschichten zu erzählen, indem wir die Lücke zwischen Idee und Ausführung überbrücken. Vielfalt ist entscheidend für den kreativen Prozess, weshalb wir die neueste und beste Technologie in unseren Bildgenerator und Bearbeitungsfunktionen integrieren – solange sie auf verantwortungsvoll beschafften Daten basiert.“
Danny Wu, Leiter der KI bei Canva, fügte hinzu: „Wir setzen weiterhin generative KI ein, um den Designprozess zu innovieren und die Vorstellungskraft zu erweitern. Mit Imagen können unsere über 170 Millionen monatlichen Nutzer von den Bildqualitätsverbesserungen profitieren, um ihre Inhalte auf einer größeren Skala aufzuwerten.“
Ergänzungen und Infos bitte an die Redaktion per eMail an de-info[at]it-boltwise.de
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.