REDMOND / MÜNCHEN (IT BOLTWISE) – Microsoft hat zwei neue Modelle seiner Phi-Familie vorgestellt: Phi-4-multimodal und Phi-4-mini. Diese Modelle sind darauf ausgelegt, Entwicklern fortschrittliche KI-Fähigkeiten zu bieten.
- Die besten Bücher rund um KI & Robotik
präsentiert von Amazon!
- Unsere täglichen KI-News von IT Boltwise® bei LinkedIn abonnieren!
- KI-Meldungen bequem via Telegram oder per Newsletter erhalten!
- IT Boltwise® bei Facy oder Insta als Fan markieren und abonnieren!
- AI Morning Podcast bei Spotify / Amazon / Apple verfolgen!
- RSS-Feed 2.0 von IT Boltwise® für KI-News speichern!
Microsoft hat mit Phi-4-multimodal und Phi-4-mini zwei neue Modelle seiner Phi-Familie von kleinen Sprachmodellen (SLMs) vorgestellt. Diese Modelle sind speziell darauf ausgelegt, Entwicklern fortschrittliche KI-Fähigkeiten zu bieten. Phi-4-multimodal kann Sprache, Vision und Text gleichzeitig verarbeiten und eröffnet damit neue Möglichkeiten für die Entwicklung innovativer und kontextbewusster Anwendungen. Phi-4-mini hingegen ist auf textbasierte Aufgaben spezialisiert und bietet hohe Genauigkeit und Skalierbarkeit in kompakter Form. Beide Modelle sind jetzt in der Azure AI Foundry, auf HuggingFace und im NVIDIA API-Katalog verfügbar, wo Entwickler das volle Potenzial von Phi-4-multimodal erkunden können.
Phi-4-multimodal markiert einen neuen Meilenstein in der KI-Entwicklung von Microsoft als erstes multimodales Sprachmodell. Es integriert nahtlos Sprach-, Bild- und Textverarbeitung in einer einzigen, einheitlichen Architektur. Durch den Einsatz fortschrittlicher Cross-Modal-Lerntechniken ermöglicht dieses Modell natürlichere und kontextbewusstere Interaktionen, indem es Geräte befähigt, mehrere Eingabemodalitäten gleichzeitig zu verstehen und zu verarbeiten. Ob bei der Interpretation gesprochener Sprache, der Analyse von Bildern oder der Verarbeitung von Textinformationen, es liefert hocheffiziente, latenzarme Inferenz und optimiert gleichzeitig die Ausführung auf Geräten und reduziert den Rechenaufwand.
Phi-4-multimodal ist ein einziges Modell mit einer Mischung aus LoRAs, das Sprache, Vision und Text gleichzeitig im selben Repräsentationsraum verarbeitet. Das Ergebnis ist ein einheitliches Modell, das Text-, Audio- und visuelle Eingaben verarbeiten kann, ohne dass komplexe Pipelines oder separate Modelle für verschiedene Modalitäten erforderlich sind. Es basiert auf einer neuen Architektur, die Effizienz und Skalierbarkeit verbessert, und unterstützt mehrsprachige Fähigkeiten sowie die Integration von Sprachlogik mit multimodalen Eingaben.
Phi-4-mini ist ein 3,8 Milliarden Parameter Modell und ein dichtes, nur Decoder-Transformer-Modell mit gruppierter Abfrageaufmerksamkeit, 200.000 Vokabular und gemeinsamen Eingabe-Ausgabe-Einbettungen, das für Geschwindigkeit und Effizienz ausgelegt ist. Trotz seiner kompakten Größe übertrifft es größere Modelle bei textbasierten Aufgaben, einschließlich Logik, Mathematik, Codierung, Befolgen von Anweisungen und Funktionsaufrufen. Es unterstützt Sequenzen von bis zu 128.000 Token und bietet hohe Genauigkeit und Skalierbarkeit, was es zu einer leistungsstarken Lösung für fortschrittliche KI-Anwendungen macht.
Dank ihrer kleineren Größe können Phi-4-mini und Phi-4-multimodal in rechenbeschränkten Inferenzumgebungen eingesetzt werden. Diese Modelle können auf Geräten verwendet werden, insbesondere wenn sie mit ONNX Runtime für plattformübergreifende Verfügbarkeit weiter optimiert werden. Ihre geringeren Rechenanforderungen machen sie zu einer kostengünstigeren Option mit deutlich besserer Latenz. Das längere Kontextfenster ermöglicht die Aufnahme und Verarbeitung großer Textinhalte wie Dokumente, Webseiten und Code.
Die Integration kleiner Sprachmodelle wie Phi in Windows ermöglicht es, effiziente Rechenkapazitäten aufrechtzuerhalten und eröffnet die Tür zu einer Zukunft der kontinuierlichen Intelligenz, die in alle Ihre Apps und Erfahrungen integriert ist. Copilot+ PCs werden auf den Fähigkeiten von Phi-4-multimodal aufbauen und die Leistung von Microsofts fortschrittlichen SLMs ohne Energieverbrauch bieten. Diese Integration wird produktivitäts-, kreativitäts- und bildungsorientierte Erfahrungen verbessern und zu einem Standardteil unserer Entwicklerplattform werden.
- NIEDLICHER BEGLEITER: Eilik ist der ideale Begleiter für Kinder und Erwachsene, die Haustiere, Spiele und intelligente Roboter lieben. Mit vielen Emotionen, Bewegungen und interaktiven Funktionen.
- Die Zukunft von Mensch und MaschineIm neuen Buch des renommierten Zukunftsforschers und Technologie-Visionärs Ray Kurzweil wird eine faszinierende Vision der kommenden Jahre und Jahrzehnte entworfen – eine Welt, die von KI durchdrungen sein wird
- Künstliche Intelligenz: Expertenwissen gegen Hysterie Der renommierte Gehirnforscher, Psychiater und Bestseller-Autor Manfred Spitzer ist ein ausgewiesener Experte für neuronale Netze, auf denen KI aufbaut
- Obwohl Künstliche Intelligenz (KI) derzeit in aller Munde ist, setzen bislang nur wenige Unternehmen die Technologie wirklich erfolgreich ein
- Wie funktioniert Künstliche Intelligenz (KI) und gibt es Parallelen zum menschlichen Gehirn? Was sind die Gemeinsamkeiten von natürlicher und künstlicher Intelligenz, und was die Unterschiede? Ist das Gehirn nichts anderes als ein biologischer Computer? Was sind Neuronale Netze und wie kann der Begriff Deep Learning einfach erklärt werden?Seit der kognitiven Revolution Mitte des letzten Jahrhunderts sind KI und Hirnforschung eng miteinander verflochten
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Du möchtest über ähnliche News und Beiträge wie "Microsofts neue KI-Modelle: Phi-4-multimodal und Phi-4-mini" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.