OpenAI enthüllt CriticGPT: Eine KI, um KI-Fehler zu erkennen - IT BOLTWISE® x Artificial Intelligence

MÜNCHEN (IT BOLTWISE) – OpenAI stellt CriticGPT vor, eine neue KI, die Fehler in von ChatGPT und anderen Modellen geschriebenem Code erkennt und übertrifft dabei menschliche Reviewer. Ein bedeutender Schritt in der Weiterentwicklung der KI-Fehlererkennung.



OpenAI hat eine neue KI namens CriticGPT entwickelt, die Fehler in von ChatGPT und anderen Modellen geschriebenem Code erkennt. Diese KI wurde mittels Reinforcement Learning aus menschlichem Feedback (RLHF) trainiert und zeigt, dass sie menschliche Reviewer beim Erkennen von Code-Problemen übertreffen kann. Das gesamte Forschungspapier dazu ist lesenswert.

CriticGPT, basierend auf der GPT-4-Architektur, schreibt Feedback zu Code-Problemen in einfacher Sprache. Sie übertrifft menschliche Reviewer bei der Fehlererkennung und wird von den Nutzern 63% der Zeit gegenüber ChatGPT bevorzugt, wenn es um echte Codierungsfehler geht.

CriticGPT adressiert ein wachsendes Problem: Je intelligenter Modelle wie ChatGPT werden, desto schwieriger werden ihre Fehler für Menschen zu erkennen. Das erschwert es, das Verhalten der KI durch RLHF weiter zu verbessern.

Es geht um die großen Herausforderungen der KI-gestützten Code-Generierung: die subtilen und komplexen Fehler, die von fortgeschrittenen großen Sprachmodellen wie ChatGPT produziert werden. Mit zunehmender Komplexität dieser Modelle wird es selbst für Experten schwieriger, Ungenauigkeiten zu finden.

Wie funktioniert es? CriticGPT wurde darauf trainiert, Kritiken zu schreiben, die Ungenauigkeiten in den Codeausgaben von ChatGPT hervorheben. Menschliche Trainer fügten manuell Fehler in von ChatGPT geschriebenen Code ein und schrieben Beispiel-Feedback, als hätten sie diese Fehler entdeckt. CriticGPT lernte, diese Fehler zu erkennen, was menschlichen Trainern bei ihren Überprüfungsaufgaben erheblich hilft.

Kritiker akzeptieren ein (Frage, Antwort)-Paar als Eingabe und geben eine Kritik aus, die spezifische Fehler aufzeigt.

Wenn Menschen mit CriticGPT zusammenarbeiten, schreiben sie bessere Reviews als entweder Menschen oder KI allein. Diese Teams vermeiden es auch häufiger, falsche Probleme zu erfinden, als KI, die alleine arbeitet. In Tests wurden Kritiken von Mensch-KI-Teams über 60% der Zeit gegenüber denen von solo arbeitenden Menschen bevorzugt.

Um CriticGPT zu trainieren, ließ OpenAI Menschen absichtlich Fehler in ChatGPTs Code einfügen und dann Feedback schreiben, als hätten sie diese Fehler natürlich gefunden. Dadurch entstand ein Datensatz bekannter Fehler, um die KI zu lehren.

OpenAI hat auch einen Weg entwickelt, das Verhältnis zwischen Gründlichkeit und Genauigkeit von CriticGPTs Feedback auszubalancieren. Dies ermöglicht längere, detailliertere Kritiken, während das Gleichgewicht zwischen dem Auffinden realer Probleme und dem Erfinden falscher gehalten wird.

CriticGPT ist nicht perfekt. Sie hat hauptsächlich aus kurzen Codeabschnitten gelernt, daher sind längere, komplexe Aufgaben noch eine Herausforderung. Manchmal erfindet sie Probleme, die nicht existieren, was menschliche Reviewer in die Irre führen kann.

OpenAI plant, CriticGPT-ähnliche Tools einzusetzen, um ihren menschlichen Trainern bei der Bewertung von KI-Ausgaben zu helfen. Dies ist ein wichtiger Schritt auf dem Weg, bessere Methoden zur Beurteilung fortgeschrittener KI-Systeme zu entwickeln, die möglicherweise zu komplex sind, um von Menschen allein beurteilt zu werden.

Da KI immer mächtiger wird, benötigen wir intelligentere Wege, sie zu bewerten und mit menschlichen Zielen in Einklang zu bringen. CriticGPT zeigt, wie KI selbst dazu beitragen kann, dieses Problem zu lösen, und könnte zukünftige KI-Systeme sicherer und zuverlässiger machen.

OpenAI enthüllt CriticGPT: Eine KI, um KI-Fehler zu erkennen
OpenAI enthüllt CriticGPT: Eine KI, um KI-Fehler zu erkennen (Foto: DALL-E, IT BOLTWISE)
Hinweis: Teile dieses Textes könnten mithilfe Künstlicher Intelligenz generiert worden sein.



Ergänzungen und Infos bitte an die Redaktion per eMail an de-info[at]it-boltwise.de
Stichwörter
Alle Märkte in Echtzeit verfolgen - 30 Tage kostenlos testen!


#Abo
LinkedIn
Facebook
Twitter
#Podcast
YouTube
Spotify
Apple

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert



Es werden alle Kommentare moderiert!

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.

Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.

Du willst nichts verpassen?

Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.