MÜNCHEN (IT BOLTWISE) – OpenAI hat kürzlich die Bildgenerierungsfähigkeiten seines multimodalen Modells GPT-4o für die breite Öffentlichkeit freigeschaltet. Diese Entwicklung markiert einen bedeutenden Fortschritt in der KI-gestützten Bildgenerierung und wird von Nutzern als ‘insane’ beschrieben.
OpenAI hat mit der Einführung der nativen Bildgenerierungsfähigkeiten seines Modells GPT-4o einen weiteren Meilenstein erreicht. Diese Funktion ist nun für Nutzer von ChatGPT in den Plus-, Pro-, Team- und Free-Tarifen verfügbar und wird bald auch für Enterprise- und Edu-Kunden sowie über die API zugänglich sein. Im Gegensatz zu früheren Modellen wie DALL-E 3, das auf der Diffusionstransformation basiert, integriert GPT-4o Text, Code und Bild in einem einzigen Modell, was zu einer höheren Bildqualität und präziseren Textdarstellungen führt.
Die Freischaltung dieser Funktion kommt zu einem Zeitpunkt, an dem Google AI Studio mit seinem Gemini 2 Flash Experimental Model ähnliche Fähigkeiten vorgestellt hat. Dies hat den Druck auf OpenAI erhöht, seine eigenen Innovationen zu präsentieren. Die neue Bildgenerierungsfunktion von GPT-4o beeindruckt durch ihre Fähigkeit, lebensechte Bilder zu erzeugen und komplexe Textanweisungen präzise umzusetzen.
Ein bemerkenswerter Aspekt von GPT-4o ist seine Fähigkeit, Text innerhalb von Bildern genau darzustellen, was die Erstellung von Schildern, Menüs und Infografiken erleichtert. Nutzer können Bilder in ChatGPT beschreiben und Details wie Seitenverhältnis, Farbschemata oder Transparenz angeben, die dann innerhalb einer Minute generiert werden. Diese Funktionalität wird auch in Sora, der Videogenerationsplattform von OpenAI, integriert, was die multimodalen Fähigkeiten weiter ausbaut.
Die Einführung dieser Funktion wirft jedoch auch Fragen zur Datengrundlage auf, auf der GPT-4o trainiert wurde. Angesichts der Geschichte von OpenAI und anderen Anbietern ist es wahrscheinlich, dass viele der verwendeten Kunstwerke aus dem Internet stammen, was möglicherweise urheberrechtliche Bedenken aufwirft. OpenAI hat jedoch Maßnahmen ergriffen, um die Sicherheit und den verantwortungsvollen Einsatz der Technologie zu gewährleisten, einschließlich der Einbindung von C2PA-Metadaten in alle generierten Bilder.
Die neuen Fähigkeiten von GPT-4o bieten zahlreiche Anwendungsmöglichkeiten, von der Erstellung von Logos und Postern bis hin zur Entwicklung von Spielcharakteren und der Produktion von Marketingmaterialien. Trotz der beeindruckenden Fortschritte gibt es noch Herausforderungen, wie das präzise Zuschneiden großer Bilder oder die Darstellung nicht-lateinischer Schriftzeichen. OpenAI arbeitet aktiv an der Verbesserung dieser Aspekte.
Mit der Freischaltung der Bildgenerierungsfähigkeiten von GPT-4o setzt OpenAI neue Maßstäbe für kreative Freiheit und zeigt, wie KI-gestützte Technologien die Art und Weise, wie wir visuelle Inhalte erstellen und nutzen, revolutionieren können. Diese Entwicklung könnte die Tür zu neuen Möglichkeiten in der Kommunikation, Kreativität und Produktivität öffnen.
- NIEDLICHER BEGLEITER: Eilik ist der ideale Begleiter für Kinder und Erwachsene, die Haustiere, Spiele und intelligente Roboter lieben. Mit vielen Emotionen, Bewegungen und interaktiven Funktionen.
- Die besten Bücher rund um KI & Robotik!
- Die besten KI-News kostenlos per eMail erhalten!
- Zur Startseite von IT BOLTWISE® für aktuelle KI-News!
- Service Directory für AI Adult Services erkunden!
- IT BOLTWISE® kostenlos auf Patreon unterstützen!
- Aktuelle KI-Jobs auf StepStone finden und bewerben!
Stellenangebote
Business Development Manager für AI Assessment (m/w/d)
Werkstudent Kommunikation & Content Creation mit KI (m/w/d)
Werkstudent technische Teamassistenz - Data & AI (m/w/d)
Use Case Manager (m/w/d) Data & KI
- Die Zukunft von Mensch und MaschineIm neuen Buch des renommierten Zukunftsforschers und Technologie-Visionärs Ray Kurzweil wird eine faszinierende Vision der kommenden Jahre und Jahrzehnte entworfen – eine Welt, die von KI durchdrungen sein wird
- Künstliche Intelligenz: Expertenwissen gegen Hysterie Der renommierte Gehirnforscher, Psychiater und Bestseller-Autor Manfred Spitzer ist ein ausgewiesener Experte für neuronale Netze, auf denen KI aufbaut
- Obwohl Künstliche Intelligenz (KI) derzeit in aller Munde ist, setzen bislang nur wenige Unternehmen die Technologie wirklich erfolgreich ein
- Wie funktioniert Künstliche Intelligenz (KI) und gibt es Parallelen zum menschlichen Gehirn? Was sind die Gemeinsamkeiten von natürlicher und künstlicher Intelligenz, und was die Unterschiede? Ist das Gehirn nichts anderes als ein biologischer Computer? Was sind Neuronale Netze und wie kann der Begriff Deep Learning einfach erklärt werden?Seit der kognitiven Revolution Mitte des letzten Jahrhunderts sind KI und Hirnforschung eng miteinander verflochten
Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "OpenAI bringt KI-Bildgenerierung auf ein neues Niveau" für unsere Leser?
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Du möchtest über ähnliche News und Beiträge wie "OpenAI bringt KI-Bildgenerierung auf ein neues Niveau" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
Nutze die deutsche Google-Suchmaschine für eine weitere Themenrecherche: »OpenAI bringt KI-Bildgenerierung auf ein neues Niveau« bei Google Deutschland suchen und bei Google News recherchieren!