SEATTLE / MÜNCHEN (IT BOLTWISE) – Amazon hat mit Nova Sonic ein neues KI-Sprachmodell vorgestellt, das die Art und Weise, wie wir mit digitalen Assistenten interagieren, revolutionieren könnte.
Amazon hat kürzlich Nova Sonic enthüllt, ein fortschrittliches KI-Sprachmodell, das in der Lage ist, Sprache nativ zu verarbeiten und natürlich klingende Sprache zu generieren. Laut Amazon ist die Leistung von Sonic mit den führenden Sprachmodellen von OpenAI und Google vergleichbar, insbesondere in Bezug auf Geschwindigkeit, Spracherkennung und Gesprächsqualität. Diese Entwicklung markiert einen bedeutenden Schritt in der Evolution digitaler Assistenten, die in der Vergangenheit oft als starr und unnatürlich empfunden wurden.
Nova Sonic ist Amazons Antwort auf die neuesten KI-Sprachmodelle, wie das Modell, das den Sprachmodus von ChatGPT antreibt. Diese neuen Modelle bieten eine natürlichere Interaktion im Vergleich zu den früheren, eher starren Modellen von Amazon Alexa. Durch technologische Durchbrüche erscheinen ältere Modelle und die digitalen Assistenten, die sie unterstützen, im Vergleich dazu veraltet.
Das Modell ist über Bedrock, Amazons Entwicklerplattform für Unternehmens-KI-Anwendungen, verfügbar und nutzt eine neue bidirektionale Streaming-API. Amazon beschreibt Nova Sonic als das kosteneffizienteste KI-Sprachmodell auf dem Markt, das etwa 80 % günstiger ist als OpenAIs GPT-4o.
Teile von Nova Sonic werden bereits in Alexa+, Amazons verbesserter digitaler Sprachassistentin, eingesetzt. Rohit Prasad, Senior Vice President und Head Scientist von AGI bei Amazon, erklärte in einem Interview, dass Nova Sonic auf Amazons Expertise in großen Orchestrierungssystemen aufbaut, die das technische Gerüst von Alexa bilden.
Im Vergleich zu konkurrierenden KI-Sprachmodellen zeichnet sich Nova Sonic durch die Fähigkeit aus, Benutzeranfragen an verschiedene APIs weiterzuleiten. Diese Fähigkeit ermöglicht es Nova Sonic, in Echtzeit Informationen aus dem Internet abzurufen, proprietäre Datenquellen zu analysieren oder in externen Anwendungen zu agieren und dabei das passende Werkzeug zu nutzen.
Während eines Dialogs wartet Nova Sonic darauf, „zum richtigen Zeitpunkt“ zu sprechen, indem es Pausen und Unterbrechungen des Sprechers berücksichtigt. Es generiert auch ein Texttranskript der Benutzersprache, das Entwickler für verschiedene Anwendungen nutzen können.
Nova Sonic ist weniger anfällig für Fehler bei der Spracherkennung als andere KI-Sprachmodelle, was bedeutet, dass das Modell die Absicht eines Benutzers relativ gut versteht, selbst wenn dieser nuschelt, sich verspricht oder sich in einer lauten Umgebung befindet. Auf einem Benchmark, der die Spracherkennung über Sprachen und Dialekte hinweg misst, erzielte Nova Sonic eine Wortfehlerrate (WER) von nur 4,2 % im Durchschnitt über Englisch, Französisch, Italienisch, Deutsch und Spanisch.
Auf einem weiteren Benchmark, der laute Interaktionen mit mehreren Teilnehmern misst, war Nova Sonic 46,7 % genauer in Bezug auf die WER als das GPT-4o-Transkriptionsmodell von OpenAI. Nova Sonic bietet auch eine branchenführende Geschwindigkeit mit einer durchschnittlichen wahrgenommenen Latenz von 1,09 Sekunden, was es schneller macht als das GPT-4o-Modell, das die Realtime-API von OpenAI antreibt.
Prasad erklärt, dass Nova Sonic Teil von Amazons umfassenderer Strategie ist, AGI (Artificial General Intelligence) zu entwickeln, die das Unternehmen als „KI-Systeme, die alles tun können, was ein Mensch am Computer tun kann“ definiert. In Zukunft plant Amazon, weitere KI-Modelle zu veröffentlichen, die verschiedene Modalitäten verstehen können, einschließlich Bild, Video und Sprache sowie „andere sensorische Daten, die relevant sind, wenn man Dinge in die physische Welt bringt“.
Die AGI-Abteilung von Amazon, die Prasad leitet, scheint eine größere Rolle in der Produktstrategie des Unternehmens zu spielen. Erst letzte Woche hat Amazon eine Vorschau auf Nova Act veröffentlicht, ein Browser-unterstütztes KI-Modell, das Elemente von Alexa+ und Amazons Buy for Me-Funktion zu betreiben scheint. Mit Nova Sonic will das Unternehmen mehr seiner internen KI-Modelle für Entwickler bereitstellen.
☕︎ Unterstütze IT BOLTWISE® und trete unserem exklusiven KI-Club bei - für nur 1,99 Euro im Monat:
- NIEDLICHER BEGLEITER: Eilik ist der ideale Begleiter für Kinder und Erwachsene, die Haustiere, Spiele und intelligente Roboter lieben. Mit vielen Emotionen, Bewegungen und interaktiven Funktionen.
- Die besten Bücher rund um KI & Robotik!
- Die besten KI-News kostenlos per eMail erhalten!
- Zur Startseite von IT BOLTWISE® für aktuelle KI-News!
- Service Directory für AI Adult Services erkunden!
- IT BOLTWISE® kostenlos auf Patreon unterstützen!
- Aktuelle KI-Jobs auf StepStone finden und bewerben!
Stellenangebote
Werkstudent KI Entwicklung
Senior Manager*in AI Global (w/m/d)
Software-Entwickler/in Ferndiagnose KI künstliche Intellegenz (m/w/d)
IT-Security Analyst (m/w/d) Cloud Security und KI
- Die Zukunft von Mensch und MaschineIm neuen Buch des renommierten Zukunftsforschers und Technologie-Visionärs Ray Kurzweil wird eine faszinierende Vision der kommenden Jahre und Jahrzehnte entworfen – eine Welt, die von KI durchdrungen sein wird
- Künstliche Intelligenz: Expertenwissen gegen Hysterie Der renommierte Gehirnforscher, Psychiater und Bestseller-Autor Manfred Spitzer ist ein ausgewiesener Experte für neuronale Netze, auf denen KI aufbaut
- Obwohl Künstliche Intelligenz (KI) derzeit in aller Munde ist, setzen bislang nur wenige Unternehmen die Technologie wirklich erfolgreich ein
- Wie funktioniert Künstliche Intelligenz (KI) und gibt es Parallelen zum menschlichen Gehirn? Was sind die Gemeinsamkeiten von natürlicher und künstlicher Intelligenz, und was die Unterschiede? Ist das Gehirn nichts anderes als ein biologischer Computer? Was sind Neuronale Netze und wie kann der Begriff Deep Learning einfach erklärt werden?Seit der kognitiven Revolution Mitte des letzten Jahrhunderts sind KI und Hirnforschung eng miteinander verflochten
Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "Amazon stellt Nova Sonic vor: Fortschrittliche KI-Sprachmodellierung" für unsere Leser?
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Du möchtest über ähnliche News und Beiträge wie "Amazon stellt Nova Sonic vor: Fortschrittliche KI-Sprachmodellierung" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »Amazon stellt Nova Sonic vor: Fortschrittliche KI-Sprachmodellierung« bei Google Deutschland suchen, bei Bing oder Google News!