MÜNCHEN (IT BOLTWISE) – Forscher der University of Virginia haben einen Durchbruch in der KI-gestützten Action Detection erzielt, der die Zukunft der Videoanalyse prägt.
- News von IT Boltwise® bei LinkedIn abonnieren!
- AI Morning Podcast bei Spotify / Amazon / Apple verfolgen!
- Neue Meldungen bequem per eMail via Newsletter erhalten!
- IT Boltwise® bei Facebook als Fan markieren!
- RSS-Feed 2.0 von IT Boltwise® abonnieren!
Was wäre, wenn eine Überwachungskamera nicht nur Videos aufzeichnen, sondern auch verstehen könnte, was passiert? Sie könnte Routineaktivitäten von potenziell gefährlichem Verhalten in Echtzeit unterscheiden. Diese Vision verwirklichen Forscher der University of Virginia’s School of Engineering and Applied Science mit ihrem neuesten Durchbruch: einem KI-gesteuerten, intelligenten Videoanalysesystem, das menschliche Aktionen in Videoaufnahmen mit beispielloser Präzision erkennt.
Das System, genannt Semantic and Motion-Aware Spatiotemporal Transformer Network (SMAST), verspricht weitreichende gesellschaftliche Vorteile, von der Verbesserung der Überwachungssysteme und öffentlichen Sicherheit bis hin zur Weiterentwicklung der Bewegungsverfolgung im Gesundheitswesen und der Optimierung der Navigation von autonomen Fahrzeugen.
„Diese KI-Technologie eröffnet Möglichkeiten zur Echtzeiterkennung von Handlungen in den anspruchsvollsten Umgebungen“, sagte Professor Scott T. Acton, Leiter der Forschungsgruppe und Vorsitzender des Departments für Elektrotechnik und Computertechnik. „Es ist eine Weiterentwicklung, die Unfälle verhindern, Diagnosen verbessern und sogar Leben retten kann.“
KI-getriebene Innovation für komplexe Videoanalysen
Wie funktioniert SMAST? Im Kern basiert das System auf Künstlicher Intelligenz und nutzt zwei Schlüsselfunktionen zur Erkennung und Analyse komplexer menschlicher Verhaltensweisen. Erstens verfügt es über ein selektives Aufmerksamkeitsmodell, das der KI hilft, sich auf die wichtigsten Teile einer Szene zu konzentrieren – wie eine Person oder ein Objekt – und unwichtige Details zu ignorieren. Dadurch wird das System genauer darin, zu erkennen, was vor sich geht, wie etwa das Werfen eines Balls statt nur eine Armbewegung.
Zweitens verwendet es ein bewegungsbewusstes 2D-Positionskodierungssystem, das der KI hilft, Bewegungen im Zeitverlauf zu verfolgen. In einem Video, in dem Menschen ständig ihre Position wechseln, ermöglicht dieses Tool der KI, sich an diese Bewegungen zu erinnern und zu verstehen, wie sie miteinander verbunden sind. Durch die Integration dieser Funktionen kann SMAST komplexe Aktionen in Echtzeit genau erkennen und so in wichtigen Bereichen wie Überwachung, Gesundheitsdiagnostik oder autonomem Fahren effektiv eingesetzt werden.
SMAST definiert die Art und Weise neu, wie Maschinen menschliche Aktionen erkennen und interpretieren. Bestehende Systeme kämpfen oft mit ungeschnittenen Videoaufnahmen und verlieren den Kontext. SMAST hingegen erfasst die dynamischen Beziehungen zwischen Menschen und Objekten mit bemerkenswerter Genauigkeit und nutzt die KI-Komponenten, um aus Daten zu lernen und sich anzupassen.
Neue Maßstäbe in der Aktionserkennungstechnologie
Dieser technologische Fortschritt ermöglicht es dem KI-System, Aktionen wie das Überqueren einer Straße durch einen Läufer, eine präzise medizinische Prozedur oder sogar Sicherheitsbedrohungen in einer Menschenmenge zu erkennen. SMAST hat bereits führende Lösungen in akademischen Benchmarks wie AVA, UCF101-24 und EPIC-Kitchens übertroffen und setzt neue Standards für Genauigkeit und Effizienz.
„Die gesellschaftlichen Auswirkungen könnten enorm sein“, sagte Matthew Korban, Postdoktorand in Actons Forschungsgruppe. „Wir sind gespannt, wie diese KI-Technologie verschiedene Branchen verändern wird, indem sie Videosysteme intelligenter und in der Lage macht, die Welt in Echtzeit zu verstehen.“
Diese Forschung basiert auf der Arbeit, die in dem Artikel „A Semantic and Motion-Aware Spatiotemporal Transformer Network for Action Detection“ in den IEEE Transactions on Pattern Analysis and Machine Intelligence veröffentlicht wurde. Die Autoren des Papiers sind Matthew Korban, Peter Youngs und Scott T. Acton von der University of Virginia.
Unterstützt wurde das Projekt von der National Science Foundation (NSF) im Rahmen der Förderungen 2000487 und 2322993.
Ergänzungen und Infos bitte an die Redaktion per eMail an de-info[at]it-boltwise.de
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.