Ein aktueller Durchbruch in der KI, den Sie vielleicht verpasst haben: Das mit Spannung erwartete Midjourney V5 ist jetzt erhältlich. Das unabhängige Forschungslabor hat gerade seine neueste Version des berühmten KI-Kunstgenerators veröffentlicht. Manche nennen es bereits „eine Welt fotorealistischer Wunder“, wenn es darum geht, atemberaubende Bilder aus Textaufforderungen zu erstellen. Wunder oder nicht, das neu trainierte Modell verspricht erhebliche Verbesserungen beim Sprachverständnis, der Genauigkeit und der stilistischen Flexibilität. Lassen Sie es uns gemeinsam ausprobieren und sehen, was dieses Update kann.
V5 ist das zweite Deep-Learning-Modell von Midjourney und wurde in den letzten fünf Monaten entwickelt. Es soll im Vergleich zu seinem Vorgänger eine völlig andere neuronale Architektur und neue ästhetische Techniken verwenden. Wie die Entwickler es ausdrücken: „Man hört vielleicht, dass es neu trainiert ist, ein größeres Gehirn hat, mehr weiß, mehr versteht oder besser zuhört. All diese Dinge treffen auf V5 zu.“ Natürlich mussten wir es selbst ausprobieren. Und siehe da, diese Version vollbringt Wunder, auch wenn es sich noch immer nur um einen Alphatest handelt.
Midjourney V5 ist jetzt erhältlich – aber wie verwendet man es?
In unserem vorherigen Artikel haben wir Midjourney angesprochen und wie es beim Erstellen künstlerischer Moodboards mit KI hilfreich sein kann. Sie finden dort auch ausführliche Anweisungen zum Einstieg und zur Verwendung dieses generativen neuronalen Netzwerks zum Erstellen von Kunst. Falls Sie Midjourney noch nicht ausprobiert haben, empfehle ich Ihnen, zuerst diesen Artikel zu lesen, bevor Sie weiterlesen.
Vorausgesetzt, du hast es gelesen, stellt sich vielleicht die Frage: Wie kannst du das neue V5-Modell in deinen Workflow integrieren? Dafür gibt es zwei Möglichkeiten: Du kannst entweder „/settings“ in einen beliebigen #newbies-Discord-Kanal eingeben und dann „MJ Version 5“ auswählen. Oder – wenn du es erst einmal ausprobieren möchtest – füge einfach den Parameter „– v 5“ am Ende deiner Eingabeaufforderung hinzu.
Verbesserte Kohärenz, insbesondere im Hinblick auf Gesichter und Gliedmaßen
Eine der größten Änderungen, auf die die Midjourney-Community sehnsüchtig gewartet hat, war, dass es keine Menschen mehr mit sechs Fingern geben wird. Im neuen Modell werden Sie weniger Chaos-Blobs bemerken, da es über deutlich mehr Wissen im Umgang mit Gliedmaßen verfügt. Außerdem sollte V5 besser darin sein, Gesichter und Augen bis ins kleinste Detail zu generieren. Wir haben unten ein paar Porträttests durchgeführt und tatsächlich sehen sie wirklich fantastisch aus.
Das sind keine echten Menschen! Verrückt, oder? Aber auch nicht fehlerfrei. Im Bild mit dem Model, das ein Selfie vor einem Spiegel macht, gibt es beispielsweise einige ernsthafte Probleme mit Reflexionen. Auch die Hände der spielenden Jungen sind nicht perfekt, aber im Vergleich zu Midjourneys vorherigem Deep-Learning-Modell sind sie ein Unterschied wie Tag und Nacht. Und der neue Kunstgenerator kann beim Erstellen von Fingern tatsächlich bis fünf zählen.
Fotorealismus als große Verbesserung
Wie Sie oben sehen, kann das V5-Modell im Allgemeinen viel realistischere Bilder bieten. Wenn Sie keinen Kunststil, den Namen Ihres Referenzkünstlers oder eine Medienquelle angeben, erhalten Sie die Standardsystemeinstellung und das Ergebnis sieht vollständig fotorealistisch aus. Die Eingabeaufforderungen in der neuen Version sind so gestaltet, dass sie wie Fotos aussehen. Wenn Sie also etwas Abstrakteres oder Künstlerischeres benötigen, empfehlen wir Ihnen, Ihre Formulierung anzupassen.
Eine weitere Möglichkeit, die Art und Weise, wie Midjourney Ihre Textbeschreibung liest, zu optimieren, besteht darin, den Parameter „stylize N“ am Ende der Eingabeaufforderung hinzuzufügen (wobei N zwischen 0 (min.) und 1000 (max.) variiert). Je niedriger der Wert, desto weniger beeinflusst der Hausstil der KI das endgültige Bild. Wenn Sie also ein Bild im Stil von Vincent van Gogh erstellen möchten, versuchen Sie es mit „– stylize 1000“, wie ich es im folgenden Test getan habe.
Wenn ich mir unsere Experimente und auch die von anderen Mitgliedern im Midjourney-Community-Post auf dem Showcase-Kanal generierten Bilder anschaue, muss ich feststellen: Sie sind unglaublich. Und sehr beängstigend. Wird es einen Moment geben, in dem niemand mehr den Unterschied zwischen einem echten Foto und einem von künstlicher Intelligenz erstellten erkennen kann? Ich denke, nur die Zeit wird es zeigen.
Midjourney V5 ist jetzt verfügbar: höhere Detailliertheit und verbesserte Leistung mit Eingabeaufforderung
Abgesehen von diesen beunruhigenden Gedanken ist ein weiteres angebliches Merkmal des neuen Midjourney-Modells seine verbesserte Integrität. Die Details der generierten Grafik werden mit größerer Wahrscheinlichkeit korrekt dargestellt und außerdem reagiert V5 sehr gut auf Ihre Eingaben. Die Entwickler bezeichnen diese Version als „viel unvoreingenommener“ als V3 und V4. Für einen fairen Vergleich habe ich einen alten Prompt von mir genommen, den ich für den letzten Midjourney-bezogenen Artikel verwendet habe, und ihn in die neueste Version eingespeist. Sehen Sie selbst:
Es scheint, dass Midjourney jetzt besser kontrollierbare und vorhersehbare Ergebnisse liefern kann. Gleichzeitig bedeutet diese Verbesserung, dass es möglicherweise schwieriger zu verwenden ist. Kurze Eingabeaufforderungen funktionieren möglicherweise nicht mehr so gut wie zuvor. In V5 schlagen die Entwickler vor, Sätze statt Listen zu schreiben und einen expliziteren Text zu verwenden, der beschreibt, was Sie möchten. Stellen Sie es sich wie die sehr kurze Aufsatzaufgabe vor, die wir alle von Zeit zu Zeit in der Schule schreiben mussten.
Höhere Auflösung und andere Seitenverhältnisse
Wie versprochen bietet die 5. Version von Midjourney eine Verdoppelung der Auflösung und kann nun Bilder bis zu 1024×1024 erzeugen. Was Sie beachten sollten, ist, dass die Schaltfläche „Hochskalieren“ bei diesem Modell anders funktioniert. Alle Bilder, die Sie mit V5 erhalten, sind in maximaler Qualität, daher trennt diese Schaltfläche nur Ihr vorhochskaliertes Bild vom Raster. Schließlich sollte es die Möglichkeit geben, Bilder mit 2048×2048 zu erzeugen.
Ein weiteres interessantes Update umfasst breitere Optionen für das Seitenverhältnis. Bisher wurden die benutzerdefinierten überhaupt nicht unterstützt. Im neuen Modell können Sie viel breitere oder viel schmalere Leinwandgrößen erstellen und jedes beliebige Seitenverhältnis ausprobieren. Oh, das ist genau das, was ich mir für die Mood Boards erhofft hatte – jetzt auch in Cinemascope verfügbar!
Bildgewichte sind zurück
Und zu guter Letzt möchte ich über die Bildgewichtungsfunktion sprechen, die in der neuesten Version von Midjourney wieder enthalten ist. Wenn Sie ein Foto oder ein Bild als Referenz verwenden, können Sie dessen Hebelwirkung jetzt mit dem Parameter „iw N“ erhöhen, wobei N zwischen 0,5 und 2,0 liegt. Lassen Sie mich Ihnen anhand des Fotobeispiels von Jamie Lee Curtis zeigen, wie es funktioniert, als sie letzte Woche ihren Oscar für die beste Nebenrolle erhielt . Ich lud ihr Bild auf den Midjourney-Bot hoch und bat ihn, sie sich als schöne Außerirdische von einem anderen Planeten vorzustellen. Ich fügte am Ende auch ein „– iw 1.0“ hinzu, damit wir die Schauspielerin immer noch erkennen können. Dies ist eines der Ergebnisse, die die KI hervorbrachte:
Wichtiger Hinweis: Sollten Sie das erstellte Bild für andere Zwecke als Moodboards oder Ideenentwicklung (insbesondere für kommerzielle Zwecke) verwenden, stellen Sie bitte sicher, dass Sie die Rechte an Ihrem Referenzbild besitzen und vergessen Sie nicht die korrekte Quellenangabe.
Midjourney V5 ist jetzt erschienen: Was sind die Hauptprobleme?
- Benutzer früherer Versionen von Midjourney müssen das Auffordern erneut lernen. Ich habe es bereits erwähnt, aber ich denke, es ist wichtig, dies im Hinterkopf zu behalten. Derzeit wird in Discord viel experimentiert, da Community-Mitglieder versuchen, herauszufinden, wie sie ihre Anfragen an das V5-Modell möglichst korrekt formulieren können.
- Einige Benutzer weisen darauf hin, dass V5 etwas langsamer als V4 ist. Dies sollte jedoch keine Überraschung sein, da auch die Qualität und Detailliertheit verbessert wurde.
- Und ja, es ist noch frisch und der Hype riesig. Also Vorsicht, die Server können überlastet sein. Eventuell hilft ein kostenpflichtiges Abo, mit dem man direkt mit dem Midjourney-Bot chatten kann. Oder einfach Geduld haben – es lohnt sich.
Abschluss
Midjourney V5 ist jetzt draußen und wir sind schon jetzt überwältigt von dem, was wir gesehen haben, obwohl dies, wie die Entwickler anmerken, nur ein Alphatest ist und sich in der endgültigen Version noch einiges ändern wird. Sie sagen, dass dieses genaue Modell in Zukunft möglicherweise nicht mehr verfügbar sein wird, aber wenn man sieht, was es bereits kann, könnte die Zukunft etwas früher gekommen sein als erwartet.
Was denken Sie? Konnten Sie V5 schon ausprobieren? Wie gefällt Ihnen der Fotorealismus? Haben Sie auch manchmal das beunruhigende Gefühl, dass die KI-Tools zu gut werden? Wir sind offen für Diskussionen im Kommentarbereich unten.
Titelbild: Wie würde Midjourney aussehen, wenn es eine weibliche Cyberpunk-Kreatur wäre? Erstellt mit Midjourney V5 von CineD.