CAMBRIDGE / MÜNCHEN (IT BOLTWISE) – Eine neue Entwicklung im Bereich der Künstlichen Intelligenz ermöglicht es Maschinen, menschliche Lautäußerungen nachzuahmen und zu verstehen. Diese Technologie könnte die Art und Weise, wie wir mit Computern interagieren, grundlegend verändern.
- Unsere KI-News von IT Boltwise® bei LinkedIn abonnieren!
- AI Morning Podcast bei Spotify / Amazon / Apple verfolgen!
- KI-Meldungen bequem via Telegram oder per Newsletter erhalten!
- IT Boltwise® bei Facebook als Fan markieren und abonnieren!
- RSS-Feed 2.0 von IT Boltwise® für KI-News speichern!
Die Forscher des MIT Computer Science and Artificial Intelligence Laboratory (CSAIL) haben ein KI-Modell entwickelt, das in der Lage ist, menschliche Lautäußerungen zu imitieren und zu verstehen. Inspiriert von der menschlichen Sprachproduktion, nutzt das System ein Modell des menschlichen Vokaltrakts, um Geräusche zu erzeugen und zu interpretieren. Diese Technologie könnte neue Möglichkeiten für die Entwicklung von Klangschnittstellen in den Bereichen Unterhaltung und Bildung eröffnen.
Das Konzept der vokalen Imitation ist vergleichbar mit dem Zeichnen eines schnellen Bildes, um etwas zu kommunizieren, das man gesehen hat. Anstatt jedoch einen Stift zu verwenden, um ein Bild zu illustrieren, wird der Vokaltrakt genutzt, um einen Klang auszudrücken. Diese Fähigkeit, Geräusche mit der Stimme nachzuahmen, ist etwas, das wir alle intuitiv tun. Die Forscher haben es geschafft, diese menschliche Fähigkeit in ein KI-Modell zu übertragen, das ohne vorheriges Training menschliche Lautimitationen erzeugen kann.
Um dies zu erreichen, haben die Forscher ein Modell des menschlichen Vokaltrakts entwickelt, das simuliert, wie Vibrationen aus dem Kehlkopf durch Rachen, Zunge und Lippen geformt werden. Ein kognitiv inspiriertes KI-Algorithmus steuert dieses Modell, um Imitationen zu erzeugen, wobei die kontextspezifischen Kommunikationsweisen der Menschen berücksichtigt werden. Das Modell kann viele Geräusche aus der Welt aufnehmen und eine menschenähnliche Imitation erzeugen, darunter Geräusche wie raschelnde Blätter, das Zischen einer Schlange und das Herannahen einer Sirene.
Die Forscher entwickelten drei zunehmend nuanciertere Versionen des Modells, um es mit menschlichen Imitationen zu vergleichen. Zunächst wurde ein Basismodell erstellt, das Imitationen erzeugen sollte, die den realen Geräuschen so ähnlich wie möglich sind. Dieses Modell entsprach jedoch nicht gut dem menschlichen Verhalten. Ein zweites, kommunikativeres Modell wurde entwickelt, das berücksichtigt, was für einen Zuhörer an einem Geräusch besonders auffällig ist. Schließlich wurde eine letzte Schicht des Denkens hinzugefügt, die die Anstrengung berücksichtigt, die Menschen in die Erzeugung von Lautäußerungen investieren.
In einem Experiment bevorzugten die Teilnehmer das KI-Modell in 25 Prozent der Fälle, insbesondere bei der Imitation eines Motorbootes und eines Schusses. Diese Ergebnisse zeigen das Potenzial der Technologie, die in Zukunft zu intuitiveren Schnittstellen für Klangdesigner und realistischeren KI-Charakteren in virtuellen Welten führen könnte. Die Forscher untersuchen auch die Auswirkungen ihres Modells auf andere Bereiche, einschließlich der Sprachentwicklung und der Imitationsverhalten bei Vögeln.
Die Technologie steht jedoch noch vor Herausforderungen, wie der Nachahmung bestimmter Konsonanten und der Replikation von Sprach- und Musikimitationen. Dennoch stellt das Modell einen bedeutenden Schritt in Richtung eines besseren Verständnisses der Prozesse dar, die der menschlichen Lautäußerung zugrunde liegen, und könnte in Zukunft neue Wege für die Interaktion mit KI eröffnen.
Hinweis: Teile dieses Textes könnten mithilfe Künstlicher Intelligenz generiert worden sein. Die auf dieser Website bereitgestellten Informationen stellen keine Finanzberatung dar und sind nicht als solche gedacht. Die Informationen sind allgemeiner Natur und dienen nur zu Informationszwecken. Wenn Sie Finanzberatung für Ihre individuelle Situation benötigen, sollten Sie den Rat von einem qualifizierten Finanzberater einholen.
Ergänzungen und Infos bitte an die Redaktion per eMail an de-info[at]it-boltwise.de. Bitte vergiss nicht in deiner eMail die Artikel-Headline zu nennen: "KI-Modell ahmt menschliche Lautäußerungen nach".
Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "KI-Modell ahmt menschliche Lautäußerungen nach" für unsere Leser?
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Du möchtest über ähnliche News und Beiträge wie "KI-Modell ahmt menschliche Lautäußerungen nach" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.