BOSTON / MÜNCHEN (IT BOLTWISE) – Die Entwicklung von Künstlicher Intelligenz im Bereich der Sprachsynthese hat in den letzten Jahren erhebliche Fortschritte gemacht. Dennoch gibt es immer noch Bedenken hinsichtlich der Zuverlässigkeit und Effizienz dieser Technologien, insbesondere wenn es um den Einsatz in großem Maßstab geht.
Die Qualität von KI-generierten Stimmen hat sich in den letzten Jahren stark verbessert und ist mittlerweile gut genug für Anwendungen wie Hörbücher, Podcasts und grundlegenden Kundensupport. Dennoch zögern viele Unternehmen, diese Technologie flächendeckend einzusetzen, da sie die Zuverlässigkeit noch nicht als ausreichend betrachten.
Um diese Herausforderungen zu adressieren, haben die beiden MIT-Absolventen Moin Nadeem und Nikhil Murthy Phonic gegründet. Ihr Unternehmen bietet einen umfassenden Sprach-Stack, der darauf abzielt, die Zuverlässigkeit synthetischer Stimmen zu erhöhen und gleichzeitig die Latenz zu verringern.
Nadeem und Murthy, die sich während ihres Studiums am MIT kennengelernt haben, sahen eine Marktlücke für vollständige Sprachtechnologielösungen. Laut Murthy ist die Sprach-KI derzeit an einem Punkt, an dem verschiedene Komponenten wie automatische Spracherkennung und Text-zu-Sprache zusammengeführt werden müssen, um Intelligenz zu integrieren. Doch viele Kunden berichten von einem Mangel an Lösungen, die in großem Maßstab zuverlässig sind.
Nadeem, der zuvor bei MosaicML arbeitete, einem Unternehmen, das 2023 von Databricks für 1,3 Milliarden US-Dollar übernommen wurde, erklärt, dass viele Unternehmen im Bereich der Sprach-KI Workflows entwickeln, um separate KI-Modelle zusammenzufügen. Phonic verfolgt einen anderen Ansatz, indem es seine Modelle intern von Anfang bis Ende trainiert.
Murthy betont, dass das Eigentum an den Modellen es Phonic ermöglicht, tiefgreifende Zuverlässigkeitskomponenten direkt in die Modelle zu integrieren. Ohne diese Kontrolle fügt man nur disparate Teile zusammen, die nicht nahtlos passen. Zudem ermöglicht dieser Ansatz eine kosteneffiziente Bereitstellung und Ausführung der Modelle.
Phonic trainiert seine Modelle auf einer Vielzahl von Aufnahmen, einschließlich solcher mit Akzenten und gedämpfter Sprache, um eine hohe Robustheit zu gewährleisten. Derzeit arbeitet das Unternehmen mit einer begrenzten Anzahl von Partnern, darunter Unternehmen aus den Bereichen Versicherung und Gesundheitswesen, plant jedoch, sein Produkt in wenigen Monaten breiter auf den Markt zu bringen.
Das Unternehmen hat in einer Seed-Runde 4 Millionen US-Dollar gesammelt, angeführt von Lux Capital mit Beteiligung von Replit-Mitbegründer Amjad Masad, Hugging Face-Mitbegründer Clem Delangue, Applied Intuition-Mitbegründer Qasar Younis und Modal Labs-Gründer Erik Bernhardsson. Grace Isford, Partnerin bei Lux Capital, erklärte, dass der hauseigene Ansatz von Phonic zur Modellschulung für die Investmentfirma besonders attraktiv war.
Isford fügte hinzu, dass sowohl Moin als auch Nikhil als herausragende Technologen gelten, die bereits während ihrer Zeit am MIT einen Maschinenlernclub gegründet haben. Ihre Kombination aus Diffusions- und proprietären Modellen im Bereich der Sprach-KI sei neuartig und vielversprechend.
☕︎ Unterstütze IT BOLTWISE® und trete unserem exklusiven KI-Club bei - für nur 1,99 Euro im Monat:
- NIEDLICHER BEGLEITER: Eilik ist der ideale Begleiter für Kinder und Erwachsene, die Haustiere, Spiele und intelligente Roboter lieben. Mit vielen Emotionen, Bewegungen und interaktiven Funktionen.
- Die besten Bücher rund um KI & Robotik!
- Die besten KI-News kostenlos per eMail erhalten!
- Zur Startseite von IT BOLTWISE® für aktuelle KI-News!
- Service Directory für AI Adult Services erkunden!
- IT BOLTWISE® kostenlos auf Patreon unterstützen!
- Aktuelle KI-Jobs auf StepStone finden und bewerben!
Stellenangebote
Microsoft Azure Cloud Solution Architect * Data & AI
Student für künstliche Intelligenz – dualer Bachelorstudiengang (m/w/d)
Duales Studium BWL - Spezialisierung Artificial Intelligence (B.A.) am Campus oder virtuell
Junior Projektmanager Frontend & KI-Lösungen (m/w/d)
- Die Zukunft von Mensch und MaschineIm neuen Buch des renommierten Zukunftsforschers und Technologie-Visionärs Ray Kurzweil wird eine faszinierende Vision der kommenden Jahre und Jahrzehnte entworfen – eine Welt, die von KI durchdrungen sein wird
- Künstliche Intelligenz: Expertenwissen gegen Hysterie Der renommierte Gehirnforscher, Psychiater und Bestseller-Autor Manfred Spitzer ist ein ausgewiesener Experte für neuronale Netze, auf denen KI aufbaut
- Obwohl Künstliche Intelligenz (KI) derzeit in aller Munde ist, setzen bislang nur wenige Unternehmen die Technologie wirklich erfolgreich ein
- Wie funktioniert Künstliche Intelligenz (KI) und gibt es Parallelen zum menschlichen Gehirn? Was sind die Gemeinsamkeiten von natürlicher und künstlicher Intelligenz, und was die Unterschiede? Ist das Gehirn nichts anderes als ein biologischer Computer? Was sind Neuronale Netze und wie kann der Begriff Deep Learning einfach erklärt werden?Seit der kognitiven Revolution Mitte des letzten Jahrhunderts sind KI und Hirnforschung eng miteinander verflochten
Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "Phonic: Neue KI-Stimme verbessert Zuverlässigkeit und Effizienz" für unsere Leser?
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Du möchtest über ähnliche News und Beiträge wie "Phonic: Neue KI-Stimme verbessert Zuverlässigkeit und Effizienz" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »Phonic: Neue KI-Stimme verbessert Zuverlässigkeit und Effizienz« bei Google Deutschland suchen, bei Bing oder Google News!