MÜNCHEN (IT BOLTWISE) – Forscher der LMU München haben innovative Quanten-Diffusionsmodelle für die Bildgenerierung entwickelt, die klassische Methoden in den Schatten stellen könnten.
Klassische Diffusionsmodelle in der Bildgenerierung stehen trotz beeindruckender technologischer Fortschritte vor Herausforderungen, insbesondere aufgrund ihrer langsamen Sampling-Geschwindigkeit und des Bedarfs an umfangreicher Parameterabstimmung. Diese in der Computergrafik und Bildverarbeitung eingesetzten Modelle sind für Aufgaben wie die Erstellung synthetischer Daten und die Unterstützung multimodaler Modelle von Bedeutung. Ihre hohe Rechenanforderung bleibt jedoch eine Herausforderung. Die Quantenmaschinenlern (QML) könnte eine Lösung bieten, indem sie die Quantenmechanik für effizienteres maschinelles Lernen nutzt.
Die Forschung in Quanten-Diffusionsmodellen für die Bildgenerierung ist begrenzt. Das Quantum Denoising Diffusion Probabilistic Models (QDDPM) von Dohun Kim et al. ist das einzige nennenswerte Verfahren. Dieses Modell verwendet ein Einzelkreis-Design mit timestepp-weisen und geteilten Schichten, erreicht Raumeffizienz durch den Bedarf an nur log2(pixels) Qubits und behandelt das Problem verschwindender Gradienten durch begrenzte Schaltungstiefe. Es verwendet spezielle unitäre (SU) Tore für die Verschränkung. Trotzdem ist seine Parameter-Effizienz gering und die generierten Bilder, obwohl erkennbar, mangelt es im Vergleich zu den Originalbildern an Details.
Forscher der LMU München haben zwei Quanten-Diffusionsmodelle eingeführt: das Q-Dense und das Quantum U-Net (QU-Net). Diese Modelle sollen die Wirksamkeit von diffusionsbasierten Bildgenerierungsmodellen steigern. Das Q-Dense-Modell nutzt einen dichten Quantenkreis (DQC) mit umfangreicher Verschränkung zwischen den Qubits. Das QU-Net ist von klassischen U-Nets inspiriert und integriert Quantenprinzipien in seine Architektur.
DQC verwendet Amplituden-Einbettung für den Input und Winkel-Einbettung für die Klassenführung, was in #layers×3×#qubits trainierbare Parameter resultiert. QU-Net verwendet Maskenkodierung für Labels und passt sich dem Quantenkontext an. Der einzigartige „Unitary Single Sampling“-Ansatz ermöglicht die Erstellung synthetischer Bilder in einem Schritt, indem er den iterativen Diffusionsprozess in eine unitäre Matrix U kombiniert. Experimente mit den Datensätzen MNIST, Fashion MNIST und CIFAR10 wurden durchgeführt, um die Effektivität der Quantenmodelle zu bewerten.
In den MNIST Digits-Experimenten übertraf das Q-Dense-Modell mit 47 Schichten und 7 Qubits klassische Netzwerke mit 1000 Parametern deutlich, insbesondere bei τ-Werten von 3 bis 5. Es erreichte FID-Werte um 100, etwa 20 Punkte besser als klassische Modelle. Bei Inpainting-Aufgaben produzierte das DQC konsistente Proben mit geringen Artefakten. Die MSE-Werte der Quantenmodelle waren jedoch nur geringfügig niedriger als die klassischer Netzwerke mit doppelt so vielen Parametern. Insgesamt zeigten Quantenmodelle effektiven Wissenstransfer und zufriedenstellende Inpainting-Ergebnisse ohne spezielles Training für diese Aufgaben.
Die Forschung hat erfolgreich Quanten-Denoising-Diffusionsmodelle eingeführt, die einen neuen Ansatz für die Bildgenerierung bieten, der Quantencomputing nutzt. Die Q-Dense- und QU-Net-Modelle sowie der Unitary Single Sampling-Ansatz übertrafen bestehende Quanten- und klassische Modelle bei der Bildgenerierung. Diese Methode überbrückt die Lücke zwischen Quanten-Diffusion und klassischen Konsistenzmodellen und könnte die Bildgenerierung beschleunigen.
Ergänzungen und Infos bitte an die Redaktion per eMail an de-info[at]it-boltwise.de
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.