SAN FRANCISCO / MÜNCHEN (IT BOLTWISE) – OpenAI hat kürzlich eine bedeutende Erweiterung für seinen Chatbot ChatGPT vorgestellt, die eine visuelle Komponente in den Advanced Voice Mode integriert. Diese Neuerung ermöglicht es Nutzern, Objekte in Echtzeit zu erfassen und zu analysieren, was das Potenzial der Künstlichen Intelligenz in der Interaktion mit der physischen Welt erheblich erweitert.
- Die besten Bücher rund um KI & Robotik
präsentiert von Amazon!
- Unsere täglichen KI-News von IT Boltwise® bei LinkedIn abonnieren!
- KI-Meldungen bequem via Telegram oder per Newsletter erhalten!
- IT Boltwise® bei Facy oder Insta als Fan markieren und abonnieren!
- AI Morning Podcast bei Spotify / Amazon / Apple verfolgen!
- RSS-Feed 2.0 von IT Boltwise® für KI-News speichern!
OpenAI hat mit der Einführung einer visuellen Komponente im Advanced Voice Mode von ChatGPT einen weiteren Schritt in der Entwicklung von KI-gestützten Interaktionen gemacht. Diese Funktion erlaubt es Nutzern, Objekte mit ihrer Handykamera zu erfassen und in Echtzeit analysieren zu lassen. Dies könnte insbesondere für Anwendungen in der Industrie und im Bildungsbereich von großem Nutzen sein, da es eine nahtlose Integration von visuellen und auditiven Informationen ermöglicht.
Die Einführung dieser Funktion ist jedoch nicht ohne Herausforderungen. Während die globale Einführung bereits begonnen hat, gibt es Verzögerungen in Europa, insbesondere für Enterprise- und Edu-Kunden, die bis Januar warten müssen. Diese Verzögerungen könnten auf regulatorische Hürden oder technische Anpassungen zurückzuführen sein, die für den europäischen Markt erforderlich sind.
In einer kürzlichen Demonstration auf CNN zeigte OpenAI-Präsident Greg Brockman die Fähigkeiten der neuen Funktion, indem er ChatGPT Zeichnungen von Körperteilen auf einem Whiteboard analysieren ließ. Obwohl die KI beeindruckende Ergebnisse bei der Erkennung der Zeichnungen lieferte, zeigte sich bei komplexeren Aufgaben wie Geometrieaufgaben noch Verbesserungspotenzial.
Die Einführung der visuellen Komponente wurde mehrfach verschoben, da OpenAI die Funktion bereits ankündigte, bevor die Entwicklung vollständig abgeschlossen war. Dies führte zu einer erhöhten Erwartungshaltung bei den Nutzern, die nun auf die tatsächliche Verfügbarkeit warten müssen.
Während OpenAI an der Erweiterung der visuellen Funktion arbeitete, konzentrierte sich das Unternehmen auch darauf, den rein stimmlichen Advanced Voice Mode auf weitere Plattformen und für Nutzer in der EU zugänglich zu machen. Interessanterweise arbeiten auch Konkurrenten wie Google an ähnlichen Technologien. Google hat kürzlich sein Projekt Astra, das KI-gestützte videoanalysierende Gespräche ermöglicht, für eine ausgewählte Gruppe von Android-Testern freigegeben.
Die Integration visueller Komponenten in KI-Systeme könnte die Art und Weise, wie wir mit Technologie interagieren, grundlegend verändern. Durch die Kombination von visuellen und auditiven Daten kann eine umfassendere und intuitivere Benutzererfahrung geschaffen werden, die sowohl im privaten als auch im beruflichen Umfeld neue Möglichkeiten eröffnet.
Amazon-Trendangebote der letzten 24 Stunden mit bis zu 78% Rabatt (Sponsored)
- NIEDLICHER BEGLEITER: Eilik ist der ideale Begleiter für Kinder und Erwachsene, die Haustiere, Spiele und intelligente Roboter lieben. Mit vielen Emotionen, Bewegungen und interaktiven Funktionen.
- Die Zukunft von Mensch und MaschineIm neuen Buch des renommierten Zukunftsforschers und Technologie-Visionärs Ray Kurzweil wird eine faszinierende Vision der kommenden Jahre und Jahrzehnte entworfen – eine Welt, die von KI durchdrungen sein wird
- Künstliche Intelligenz: Expertenwissen gegen Hysterie Der renommierte Gehirnforscher, Psychiater und Bestseller-Autor Manfred Spitzer ist ein ausgewiesener Experte für neuronale Netze, auf denen KI aufbaut
- Obwohl Künstliche Intelligenz (KI) derzeit in aller Munde ist, setzen bislang nur wenige Unternehmen die Technologie wirklich erfolgreich ein
- Wie funktioniert Künstliche Intelligenz (KI) und gibt es Parallelen zum menschlichen Gehirn? Was sind die Gemeinsamkeiten von natürlicher und künstlicher Intelligenz, und was die Unterschiede? Ist das Gehirn nichts anderes als ein biologischer Computer? Was sind Neuronale Netze und wie kann der Begriff Deep Learning einfach erklärt werden?Seit der kognitiven Revolution Mitte des letzten Jahrhunderts sind KI und Hirnforschung eng miteinander verflochten
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Du möchtest über ähnliche News und Beiträge wie "OpenAI erweitert ChatGPT um visuelle Funktionen mit Herausforderungen in Europa" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.