Google präsentiert Gemini 2.0 mit beeindruckenden Fähigkeiten: KI kann klicken, tippen und scrollen wie ein Mensch
       
TopBlogs.de das Original - Blogverzeichnis | Blog Top Liste

MÜNCHEN (IT BOLTWISE) – Google hat mit Gemini 2.0 eine neue Generation von Künstlicher Intelligenz vorgestellt, die eigenständig Aufgaben erledigen und multimodale Daten verarbeiten kann.



Google bringt mit Gemini 2.0 einen KI-Agenten auf den Markt, der in der Lage ist, komplexe Aufgaben zu automatisieren. Das System basiert auf dem Vorgänger Gemini 1.5, erweitert dessen Funktionen jedoch erheblich. Es verarbeitet nicht nur Texte, Bilder und Audiodaten, sondern kann diese auch selbst generieren. Dabei greift es eigenständig auf Google-Produkte wie die Suchfunktion zu und ist sogar in der Lage, Programmcode auszuführen.

Ein besonderes Highlight ist die Integration von „Project Mariner“, das es der KI erlaubt, Webseiten zu navigieren, wie ein Mensch es tun würde. Der Agent kann klicken, tippen und scrollen, wobei sensible Aktionen wie Käufe nur nach Bestätigung durch den Nutzer ausgeführt werden. Laut Google-Managerin Tulsee Doshi legt das System großen Wert auf Kontrollmechanismen, um Vertrauen zu schaffen.

Google-CEO Sundar Pichai spricht von einer „neuen Ära der Agenten“. Während die erste Version, Gemini 1.0, primär auf das Verständnis und die Organisation von Informationen ausgelegt war, bietet die neue Version deutlich erweiterte Anwendungsbereiche. Nutzer können die KI beauftragen, mehrstufige Aufgaben zu erledigen – etwa Produkte in Onlineshops zu suchen und zu reservieren. Die finale Entscheidung liegt dabei stets beim Anwender.

Auch abseits des Browser-Assistenten zeigt Gemini 2.0 Potenzial. Im Rahmen des „Project Astra“ entwickelt Google beispielsweise eine smarte Brille, die zusätzliche Informationen zu Objekten wie Gebäuden oder Kunstwerken einblenden kann. Für Entwickler stellt die Systemvariante Gemini Flash 2.0 eine weitere Innovation dar: Sie kann lokal auf Computern und kompatiblen Smartphones betrieben werden, was die Integration erleichtert.

Die Einführung von Gemini 2.0 erfolgt zunächst in einer geschlossenen Testphase. Ab Januar wird die multimodale Ausgabe allen Entwicklern zugänglich gemacht. Gleichzeitig plant Google, den KI-Agenten in weitere Produkte seines Portfolios zu integrieren, um seine Vision einer allgegenwärtigen, unterstützenden KI Realität werden zu lassen.

Google präsentiert Gemini 2.0 mit beeindruckenden Fähigkeiten: KI kann klicken, tippen und scrollen wie ein Mensch
Google präsentiert Gemini 2.0 mit beeindruckenden Fähigkeiten: KI kann klicken, tippen und scrollen wie ein Mensch (Foto: DALL-E, IT BOLTWISE)
Hinweis: Teile dieses Textes könnten mithilfe Künstlicher Intelligenz generiert worden sein.



Ergänzungen und Infos bitte an die Redaktion per eMail an de-info[at]it-boltwise.de
Stichwörter
Alle Märkte in Echtzeit verfolgen - 30 Tage kostenlos testen!


#Abo
LinkedIn
Facebook
Twitter
#Podcast
YouTube
Spotify
Apple
#Werbung
Bitcoin
Startups
AI Devs

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert



Es werden alle Kommentare moderiert!

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.

Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.

Du willst nichts verpassen?

Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.

106 Leser gerade online auf IT BOLTWISE®