MÜNCHEN (IT BOLTWISE) – MIT-Forscher haben einen innovativen Bilddatensatz entwickelt, der es ermöglicht, periphere Sicht in Maschinenlernmodellen zu simulieren, was die Fähigkeit der Modelle verbessert, Objekte in der visuellen Peripherie zu erkennen. Dies könnte erhebliche Auswirkungen auf die Fahrzeugsicherheit und die Entwicklung benutzerfreundlicherer Displays haben.
- News von IT Boltwise® bei LinkedIn abonnieren!
- AI Morning Podcast bei Spotify / Amazon / Apple verfolgen!
- Neue Meldungen bequem per eMail via Newsletter erhalten!
- IT Boltwise® bei Facebook als Fan markieren!
- RSS-Feed 2.0 von IT Boltwise® abonnieren!
Die menschliche periphere Sicht ermöglicht es uns, Formen außerhalb unserer direkten Blicklinie zu erkennen, wenn auch mit weniger Details. Diese Fähigkeit erweitert unser Sichtfeld und kann in vielen Situationen nützlich sein, wie etwa beim Erkennen eines sich nähernden Fahrzeugs von der Seite.
Anders als Menschen verfügen KI-Systeme nicht über periphere Sicht. Die Ausstattung von Computervisionsmodellen mit dieser Fähigkeit könnte ihnen helfen, sich nähernde Gefahren effektiver zu erkennen oder vorherzusagen, ob ein menschlicher Fahrer ein ankommendes Objekt bemerken würde.
In diese Richtung gehend entwickelten MIT-Forscher einen Bilddatensatz, der es ihnen ermöglicht, periphere Sicht in Maschinenlernmodellen zu simulieren. Sie stellten fest, dass das Training der Modelle mit diesem Datensatz die Fähigkeit der Modelle verbesserte, Objekte in der visuellen Peripherie zu erkennen, obwohl die Modelle immer noch schlechter abschnitten als Menschen.
Ihre Ergebnisse enthüllten auch, dass im Gegensatz zu Menschen weder die Größe der Objekte noch die Menge an visuellem Durcheinander in einer Szene einen starken Einfluss auf die Leistung der KI hatte.
„Hier passiert etwas Grundlegendes. Wir haben so viele verschiedene Modelle getestet und selbst wenn wir sie trainieren, werden sie ein wenig besser, aber sie sind nicht ganz wie Menschen. Also, die Frage ist: Was fehlt diesen Modellen?“ sagt Vasha DuTell, ein Postdoktorand und Co-Autor einer Studie, die diese Forschung beschreibt.
Die Beantwortung dieser Frage könnte Forschern helfen, Maschinenlernmodelle zu entwickeln, die die Welt mehr wie Menschen sehen. Neben der Verbesserung der Fahrsicherheit könnten solche Modelle auch dazu verwendet werden, Displays zu entwickeln, die für Menschen einfacher zu betrachten sind.
Zudem könnte ein tieferes Verständnis der peripheren Sicht in KI-Modellen Forschern helfen, menschliches Verhalten besser vorherzusagen, fügt die leitende Autorin Anne Harrington MEng ’23 hinzu.
„Die Modellierung peripherer Sicht, wenn wir wirklich das Wesen dessen erfassen können, was in der Peripherie dargestellt wird, kann uns helfen zu verstehen, welche Merkmale in einer visuellen Szene unsere Augen dazu bringen, mehr Informationen zu sammeln“, erklärt sie.
Zu ihren Co-Autoren gehören Mark Hamilton, ein Doktorand der Elektrotechnik und Informatik; Ayush Tewari, ein Postdoktorand; Simon Stent, Forschungsmanager beim Toyota Research Institute; und die leitenden Autoren William T. Freeman, der Thomas und Gerd Perkins Professor für Elektrotechnik und Informatik und Mitglied des Computer Science and Artificial Intelligence Laboratory (CSAIL); und Ruth Rosenholtz, leitende Forschungswissenschaftlerin im Department of Brain and Cognitive Sciences und Mitglied des CSAIL. Die Forschung wird auf der International Conference on Learning Representations präsentiert.
„Jedes Mal, wenn ein Mensch mit einer Maschine interagiert – einem Auto, einem Roboter, einer Benutzeroberfläche – ist es enorm wichtig zu verstehen, was die Person sehen kann. Die periphere Sicht spielt bei diesem Verständnis eine entscheidende Rolle“, sagt Rosenholtz.
Ergänzungen und Infos bitte an die Redaktion per eMail an de-info[at]it-boltwise.de
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.