Neuer AGI-Test stellt KI-Modelle vor Herausforderungen

MÜNCHEN (IT BOLTWISE) – Die ARC Prize Foundation hat kürzlich einen neuen Test veröffentlicht, der die Grenzen aktueller KI-Modelle aufzeigt. Während Menschen diese Aufgaben mit relativer Leichtigkeit lösen, stoßen selbst fortschrittliche KI-Systeme an ihre Grenzen.

Die besten Bücher rund um KI & Robotik präsentiert von Amazon!
Unsere täglichen KI-News von IT Boltwise® bei LinkedIn abonnieren!
KI-Meldungen bequem via Telegram oder per Newsletter erhalten!
IT Boltwise® bei Facy oder Insta als Fan markieren und abonnieren!
AI Morning Podcast bei Spotify / Amazon / Apple verfolgen!
RSS-Feed 2.0 von IT Boltwise® für KI-News speichern!

Die ARC Prize Foundation hat mit dem ARC-AGI-2-Test einen neuen Maßstab für die Bewertung der allgemeinen künstlichen Intelligenz (AGI) gesetzt. Dieser Test fordert KI-Modelle heraus, indem er Aufgaben stellt, die an klassische Intelligenztests erinnern. So müssen beispielsweise geometrische Figuren nach bestimmten Kriterien farblich zugeordnet oder zusammengesetzt werden. Diese Aufgaben sind für Menschen mit etwas Nachdenken gut lösbar, wie eine Kontrollgruppe von über 400 Probanden zeigte, von denen rund 60 Prozent erfolgreich waren.

Im Gegensatz dazu scheiterten die getesteten KI-Modelle kläglich. Modelle wie o1 von OpenAI und R1 von DeepSeek erreichten lediglich Erfolgsquoten von 1 Prozent beziehungsweise 1,3 Prozent. Auch andere Modelle wie GPT-4.5, Claude 3.7 Sonnet oder Gemini 2.0 Flash konnten den Test nur zu 1 Prozent bestehen. Diese Ergebnisse verdeutlichen die Herausforderungen, vor denen die KI-Entwicklung steht, insbesondere wenn es darum geht, die Flexibilität und Anpassungsfähigkeit menschlicher Intelligenz zu erreichen.

Der ARC-AGI-2-Test ist der Nachfolger des ARC-AGI-1, der im Jahr 2019 eingeführt wurde. Damals wurde ein Preisgeld von einer Million US-Dollar für die Lösung des Tests ausgelobt, wobei eine Erfolgsquote von 85 Prozent gefordert war. Trotz eines Leistungssprungs von 33 auf 55,5 Prozent bis Ende 2024 konnte das Ziel nicht erreicht werden. Die Schwächen des alten Datensatzes führten zur Entwicklung des neuen Tests, der nun auch die Effizienz der Problemlösung als Kriterium einbezieht.

Effizienz ist ein entscheidender Faktor bei der Bewertung von KI-Systemen. Greg Kamradt, einer der Gründer der ARC Prize Foundation, betont, dass Intelligenz nicht nur durch die Fähigkeit, Probleme zu lösen, definiert wird, sondern auch durch die Effizienz, mit der diese Fähigkeiten erworben und eingesetzt werden. Der neue Test fordert daher nicht nur eine hohe Lösungsquote, sondern auch eine kosteneffiziente Durchführung der Aufgaben, wobei 42 US-Cent pro Aufgabe angestrebt werden.

Die Ergebnisse des ARC-AGI-2-Tests werfen ein Licht auf die aktuellen Grenzen der KI-Entwicklung. Während Fortschritte in der KI-Technologie unbestreitbar sind, zeigt dieser Test, dass es noch ein weiter Weg ist, bis Maschinen die Flexibilität und Anpassungsfähigkeit des menschlichen Geistes erreichen. Die Herausforderungen, die sich aus diesen Tests ergeben, bieten jedoch auch Chancen für Innovationen und Weiterentwicklungen im Bereich der künstlichen Intelligenz.

Zu den Top-Stories!

Neuer AGI-Test stellt KI-Modelle vor Herausforderungen (Foto: DALL-E, IT BOLTWISE)

Folgen Sie uns

Tweet #itboltwise

Tweet an @critchmitch

Stellenangebote

Fachinformatiker KI-Testingenieur & High Performance-Computing (m/w/d)

BEC Robotics

Magdeburg

Praktikant (m/w/d) in der Entwicklung - Automatisierung mit Hilfe von KI und Python Scripts

Marquardt GmbH

Rietheim-Weilheim, Deutschland

Bachelorand (m/w/d) im Bereich Innovations - Optimierung kapazitiver Sensorsysteme durch KI

Marquardt GmbH

Rietheim-Weilheim, Deutschland

Folgen Sie aktuellen Beiträge über KI & Robotik auf Twitter, Telegram, Facebook oder LinkedIn!

Hinweis: Teile dieses Textes könnten mithilfe Künstlicher Intelligenz generiert worden sein. Die auf dieser Website bereitgestellten Informationen stellen keine Finanzberatung dar und sind nicht als solche gedacht. Die Informationen sind allgemeiner Natur und dienen nur zu Informationszwecken. Wenn Sie Finanzberatung für Ihre individuelle Situation benötigen, sollten Sie den Rat von einem qualifizierten Finanzberater einholen. IT BOLTWISE® schließt jegliche Regressansprüche aus.

Diesen Artikel kommentieren

60 Bewertungen

Die nächste Stufe der Evolution: Wenn Mensch und Maschine eins werden | Wie Futurist, Tech-Visionär und Google-Chef-Ingenieur Ray Kurzweil die Zukunft der Künstlichen Intelligenz sieht

Die Zukunft von Mensch und MaschineIm neuen Buch des renommierten Zukunftsforschers und Technologie-Visionärs Ray Kurzweil wird eine faszinierende Vision der kommenden Jahre und Jahrzehnte entworfen – eine Welt, die von KI durchdrungen sein wird

128 Bewertungen

Künstliche Intelligenz: Dem Menschen überlegen – wie KI uns rettet und bedroht | Der Neurowissenschaftler, Psychiater und SPIEGEL-Bestsellerautor von »Digitale Demenz«

Künstliche Intelligenz: Expertenwissen gegen Hysterie Der renommierte Gehirnforscher, Psychiater und Bestseller-Autor Manfred Spitzer ist ein ausgewiesener Experte für neuronale Netze, auf denen KI aufbaut

71 Bewertungen

KI Exzellenz: Erfolgsfaktoren im Management jenseits des Hypes. Zukunftstechnologien verstehen und künstliche Intelligenz erfolgreich in der Arbeitswelt nutzen. (Haufe Fachbuch)

Obwohl Künstliche Intelligenz (KI) derzeit in aller Munde ist, setzen bislang nur wenige Unternehmen die Technologie wirklich erfolgreich ein

43 Bewertungen

Künstliche Intelligenz und Hirnforschung: Neuronale Netze, Deep Learning und die Zukunft der Kognition

Wie funktioniert Künstliche Intelligenz (KI) und gibt es Parallelen zum menschlichen Gehirn? Was sind die Gemeinsamkeiten von natürlicher und künstlicher Intelligenz, und was die Unterschiede? Ist das Gehirn nichts anderes als ein biologischer Computer? Was sind Neuronale Netze und wie kann der Begriff Deep Learning einfach erklärt werden?Seit der kognitiven Revolution Mitte des letzten Jahrhunderts sind KI und Hirnforschung eng miteinander verflochten

Ergänzungen und Infos bitte an die Redaktion per eMail an de-info[at]it-boltwise.de. Da wir bei KI-erzeugten News und Inhalten selten auftretende KI-Halluzinationen nicht ausschließen können, bitten wir Sie bei Falschangaben und Fehlinformationen uns via eMail zu kontaktieren und zu informieren. Bitte vergessen Sie nicht in der eMail die Artikel-Headline zu nennen: "Neuer AGI-Test stellt KI-Modelle vor Herausforderungen".

Stichwörter AGI AI Arc Prize Foundation Artificial Intelligence Effizienz Intelligenztest KI Künstliche Intelligenz

Alle Märkte in Echtzeit verfolgen - 30 Tage kostenlos testen!

Nächster Artikel

Digitaler Führerschein: EU plant umfassende Einführung bis 2030

25. März 2025

Vorheriger Artikel

Digitalministerium in Deutschland: Ein Rückschritt oder strategische Neuausrichtung?

25. März 2025

Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "Neuer AGI-Test stellt KI-Modelle vor Herausforderungen" für unsere Leser?

Schreibe einen Kommentar Antworten abbrechen

Die aktuellen intelligenten Ringe, intelligenten Brillen, intelligenten Uhren oder KI-Smartphones auf Amazon entdecken! (Sponsored)

Es werden alle Kommentare moderiert!

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.

Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.

Du willst nichts verpassen?

Du möchtest über ähnliche News und Beiträge wie "Neuer AGI-Test stellt KI-Modelle vor Herausforderungen" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.

Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »Neuer AGI-Test stellt KI-Modelle vor Herausforderungen« bei Google Deutschland suchen, bei Bing oder Google News!

410 Leser gerade online auf IT BOLTWISE®

KI-Schutz gegen Hacker #Sophos

Chiphersteller : Intel-Chef laut Unterlagen an Hunderten chinesischen Firmen beteiligt

Der neue Intel-Chef hat in hunderte chinesische Firmen investiert. Manche sehen das als Vorteil, andere wiederum zweifeln, ob er das Krisenunternehmen so reformieren kann.
Suchmaschine: Google droht in Großbritannien Milliarden-Schadenersatz

Eine Sammelklage will erreichen, dass die Suchmaschine Verbraucher für unlautere Wettbewerbsmethoden entschädigt. Konkret geht es um Voreinstellungen auf Smartphones.
Start-up CGC Genomics: Die Genanalyse eines Tumors dank KI schneller verstehen

Molekulare Tumoranalysen aus klinischen Laboren sind komplex. Hier soll das Tool eines Schweizer Healthtech-Start-ups unterstützen. Das Gründertrio hat sich nun eine Finanzierung gesichert.
Facebook-Konzern: US-Wettbewerbshüter: Meta wollte mit Instagram- und WhatsApp-Käufen das Monopol behaupten

Die US-Wettbewerbsbehörde FTC hält Meta vor, die Konkurrenten Instagram und WhatsApp zu einem überhöhten Preis übernommen zu haben, um das eigene Monopol zu verteidigen. Jetzt droht eine Zerschlagung.
Zollkrieg: Nvidia-Chef Jensen Huang offenbar für Gespräche in China

Die US-Regierung hat die Lieferung von KI-Chips von Nvidia nach China unterbunden. Dennoch reist deren Chef Medienberichten zufolge in das Land und trifft hochrangige Gesprächspartner.
Handelskonflikt: Produktion vor Ort wird zum Problem: Trump lässt US-Chiphersteller verzweifeln

Halbleiter sind ein Musterbeispiel dafür, wie das US-Zollregime den Markt verzerrt. Momentan sind ausgerechnet jene Produzenten benachteiligt, die in den USA fertigen.
iPhone-Hersteller : Apple ist nicht mehr der wertvollste Konzern der Welt an der Börse

Minus 500 Milliarden Dollar Börsenwert innerhalb von ein paar Tagen – die hohen Chinazölle bringen Apple-Chef Tim Cook in ein Dilemma. Steigen nun die iPhone-Preise auch in Europa?
Pflege: Telematik-Anschluss auf den letzten Drücker

Bis zum 1. Juli sollen deutsche Pflegeeinrichtungen an das bundesweite digitale Gesundheitsnetz angeschlossen sein. Doch viele haben sich nicht vorbereitet. Die Einrichtungen müssen handeln.
Künstliche Intelligenz: OpenAI prüft offenbar den Kauf von Windsurf für drei Milliarden Dollar

Laut US-Medien könnte das Start-up für Programmierdienste seine Bewertung dabei mehr als verdoppeln. Für den Microsoft-Partner OpenAI wäre es der größte Zukauf der Firmengeschichte.
Aliens: Forscher finden Hinweise auf Leben jenseits unseres Sonnensystems

Der Exoplanet K2-18b hat schon öfter für Aufsehen gesorgt. Nun wollen Forschende dort Hinweise auf Leben gefunden haben. Ganz sicher sind sie sich aber nicht.

#1 Fachmagazin in Deutschland mit Fokus auf Künstliche Intelligenz und Robotik

Neuer AGI-Test stellt KI-Modelle vor Herausforderungen

Intern AI Strategy & Data Innovation (m/w/d)

Business Developer AI w/m/d in Vollzeit am Standort Münster

SAP BTP AI Solution Adoption and Consumption Advisor (f/m/d)

Stellenangebote

Stellenangebote

Fachinformatiker KI-Testingenieur & High Performance-Computing (m/w/d)

Praktikant (m/w/d) in der Entwicklung - Automatisierung mit Hilfe von KI und Python Scripts

Bachelorand (m/w/d) im Bereich Innovations - Optimierung kapazitiver Sensorsysteme durch KI

Innovations-Manager (d/w/m) mit Schwerpunkt generativer KI

Software Developer KI & Medizinrobotik (m/w/d)

Data Analyst | AI-Verhandlungen (w/m/d)

Aktuelle News über «Künstliche Intelligenz» automatisch per eMail erhalten

Digitaler Führerschein: EU plant umfassende Einführung bis 2030

Digitalministerium in Deutschland: Ein Rückschritt oder strategische Neuausrichtung?

Schreibe einen Kommentar Antworten abbrechen

Die besten Bücher rund um KI & Robotik

Alibaba überholt ByteDance: Quark wird Chinas führende KI-App

Snapchat führt KI-gestützte Werbelinsen für Marken ein

Teenager entwickeln erfolgreiche KI-App zur Kalorienzählung

Intelligentes Zuhause in wenigen Klicks

Die besten KI-Gadgets auf Amazon

Sophos X-Ops: Wie Kriminelle KI nutzen – und was Unternehmen tun können

Höflichkeit gegenüber KI: Ein kostspieliges Phänomen für OpenAI

Wie KI und IoT die DDoS-Bedrohung verstärken

UAE setzt auf KI zur Gesetzgebung: Ein globaler Vorstoß

KI-gestützte Gesundheitsversorgung im Fokus der chinesischen Medizin-Konferenz

KI-gestützte Kameras schützen Schneeleoparden in Pakistan

US-Beschränkungen für NVIDIA und DeepSeek: Auswirkungen auf die KI-Entwicklung

KI-gestützte Innovationen in der Gravitationswellenforschung

Stellenangebote

Stellenangebote

Fachinformatiker KI-Testingenieur & High Performance-Computing (m/w/d)

Praktikant (m/w/d) in der Entwicklung - Automatisierung mit Hilfe von KI und Python Scripts

Bachelorand (m/w/d) im Bereich Innovations - Optimierung kapazitiver Sensorsysteme durch KI

Innovations-Manager (d/w/m) mit Schwerpunkt generativer KI

Software Developer KI & Medizinrobotik (m/w/d)

Data Analyst | AI-Verhandlungen (w/m/d)

Ähnliche Beiträge aus unserem „Boltwise®“-Archiv:

Aktuelle News über «Künstliche Intelligenz» automatisch per eMail erhalten

Schreibe einen Kommentar Antworten abbrechen