MÜNCHEN (IT BOLTWISE) – Die Integration von Regeln in das Training von KI-Modellen, ähnlich physikalischer Gesetze, könnte die Modelle effizienter machen und ihre Fähigkeit verbessern, reale wissenschaftliche Probleme zu navigieren.
- News von IT Boltwise® bei LinkedIn abonnieren!
- AI Morning Podcast bei Spotify / Amazon / Apple verfolgen!
- Neue Meldungen bequem per eMail via Newsletter erhalten!
- IT Boltwise® bei Facebook als Fan markieren!
- RSS-Feed 2.0 von IT Boltwise® abonnieren!
Forscher berichteten in der Zeitschrift Nexus, dass sie ein Framework entwickelt haben, um den relativen Wert von Regeln und Daten in „informierten Maschinellen Lernmodellen“ zu bewerten, die beides integrieren. Sie zeigten, dass sie damit der KI helfen konnten, grundlegende Gesetze der realen Welt zu integrieren und wissenschaftliche Probleme wie das Lösen komplexer mathematischer Probleme und das Optimieren von experimentellen Bedingungen in Chemieexperimenten besser zu navigieren.
„Die Einbettung menschlichen Wissens in KI-Modelle hat das Potenzial, deren Effizienz und Fähigkeit zur Schlussfolgerung zu verbessern, aber die Frage ist, wie man den Einfluss von Daten und Wissen ausbalanciert“, sagt Hauptautor Hao Xu von der Peking-Universität. „Unser Framework kann eingesetzt werden, um unterschiedliches Wissen und Regeln zu bewerten und die Vorhersagefähigkeit von Deep-Learning-Modellen zu erhöhen.“
Generative KI-Modelle wie ChatGPT und Sora sind rein datengesteuert – die Modelle erhalten Trainingsdaten und lernen durch Versuch und Irrtum. Ohne physische Gesetze wie Gravitation oder Fluidmechanik zu kennen, kämpfen diese Systeme jedoch in Situationen, die von ihren Trainingsdaten abweichen. Ein alternativer Ansatz ist das informierte Maschinelle Lernen, bei dem Forscher dem Modell einige zugrundeliegende Regeln zur Leitung seines Trainingsprozesses bereitstellen, aber über die relative Wichtigkeit von Regeln im Vergleich zu Daten, die die Modellgenauigkeit antreiben, ist wenig bekannt.
„Wir versuchen, KI-Modellen die Gesetze der Physik beizubringen, damit sie realitätsnäher sind, was sie in Wissenschaft und Technik nützlicher machen würde“, sagt der leitende Autor Yuntian Chen vom Eastern Institute of Technology, Ningbo.
Um die Leistung des informierten Maschinellen Lernens zu verbessern, entwickelte das Team ein Framework, um den Beitrag einer einzelnen Regel zur Vorhersagegenauigkeit eines bestimmten Modells zu berechnen. Die Forscher untersuchten auch die Wechselwirkungen zwischen verschiedenen Regeln, da die meisten informierten Maschinellen Lernmodelle mehrere Regeln integrieren, und zu viele Regeln können Modelle zum Zusammenbruch bringen.
Dies ermöglichte es ihnen, Modelle zu optimieren, indem sie den relativen Einfluss verschiedener Regeln anpassten und redundante oder störende Regeln vollständig herausfilterten. Sie identifizierten auch einige Regeln, die synergistisch wirkten, und andere Regeln, die vollständig von der Anwesenheit anderer Regeln abhängig waren.
„Wir haben festgestellt, dass die Regeln unterschiedliche Arten von Beziehungen haben, und wir nutzen diese Beziehungen, um das Training der Modelle schneller zu machen und eine höhere Genauigkeit zu erzielen“, sagt Chen.
Die Forscher sagen, dass ihr Framework breite praktische Anwendungen in Ingenieurwesen, Physik und Chemie hat. Im Papier demonstrierten sie das Potenzial der Methode, indem sie sie nutzten, um Maschinelle Lernmodelle zur Lösung multivariater Gleichungen zu optimieren und die Ergebnisse von Dünnschichtchromatographie-Experimenten vorherzusagen und damit zukünftige experimentelle Chemiebedingungen zu optimieren.
Als nächstes planen die Forscher, ihr Framework in ein Plugin-Tool zu entwickeln, das von KI-Entwicklern verwendet werden kann. Letztendlich wollen sie auch ihre Modelle so trainieren, dass die Modelle Wissen und Regeln direkt aus Daten extrahieren können, anstatt dass Regeln von menschlichen Forschern ausgewählt werden.
„Wir möchten es zu einem geschlossenen Kreislauf machen, indem wir das Modell zu einem echten KI-Wissenschaftler machen“, sagt Chen. „Wir arbeiten daran, ein Modell zu entwickeln, das direkt Wissen aus den Daten extrahieren kann und dann dieses Wissen nutzt, um Regeln zu erstellen und sich selbst zu verbessern.“
Diese Forschung wurde unterstützt vom National Center for Applied Mathematics Shenzhen, dem Shenzhen Key Laboratory of Natural Gas Hydrates, dem SUSTech — Qingdao New Energy Technology Research Institute und der National Natural Science Foundation of China.
Ergänzungen und Infos bitte an die Redaktion per eMail an de-info[at]it-boltwise.de
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.