Künstliche Intelligenz (KI) ist oft ebenso erstaunlich wie erschreckend . Es hat ein nahezu grenzenloses Potenzial – ein Potenzial, das bei manchen Menschen auch ein Unbehagen hervorruft. Ganz gleich, ob Sie KI lieben oder ob Sie sie gruselig finden, DALL-E mini ist ein Tool, das Ihre Meinung höchstwahrscheinlich nur bestärken wird. Mithilfe künstlicher Intelligenz, Data Scraping und Milliarden von Bildern aus dem gesamten Internet ist DALL-E mini in der Lage, Text in Bilder umzuwandeln, und das schließt selbst die seltsamsten Anfragen ein, die Ihnen jemals einfallen könnten. Es ist kein Wunder, dass das Internet im Moment davon begeistert ist – aber wie genau funktioniert es? Und was kann es?
Im oben gezeigten Beispiel haben wir „Hund fährt Auto“ in die Eingabeaufforderungsmaschine des DALL-E mini eingegeben. Der Dienst erfreut sich derzeit so großer Beliebtheit, dass er häufig ausgelastet ist, kann aber kostenlos genutzt werden, sodass wir nach wenigen Minuten unsere Bilder erhalten konnten. Neun Quadrate, jedes mit dem, was nach Ansicht der KI am besten geeignet ist, um sich einen Hund beim Autofahren vorzustellen. Wenn Sie sich diese Bilder genau ansehen, sehen sie völlig falsch aus – und es wird noch schlimmer, wenn Sie den Namen einer echten Person anstelle eines Tieres eingeben. Aus der Ferne betrachtet sind sie jedoch ziemlich genau das, was man erwarten würde: verschiedene Arten von Hunden in verschiedenen Fahrzeugtypen.
Im Internet herrscht Hype um DALL-E mini
Obwohl DALL-E mini sicherlich einige hübsche Bilder erstellen kann, basiert es auf Mathematik und Algorithmen, ohne dass künstlerisches Geschick erforderlich ist. Die KI schaut sich einfach unzählige Bilder an, die Ihrer Anfrage am besten entsprechen, und identifiziert dann Muster, die in den meisten davon zu finden sind. Dazu gehören Formen, Farben und Beschriftungen. Dadurch lernt es, ein Bild zu erstellen, das zu Ihrer Beschreibung passt, und voilà, da ist Ihr Hund, der ein Auto fährt. Aber natürlich hat das Internet noch bessere (oft verstörende) Vorstellungen davon, was man mit dem DALL-E mini machen kann, als wenn ein durchschnittlicher Hund im Auto Auto fährt.
In den letzten Tagen wurde Twitter mit Screenshots von DALL-E überschwemmt, die zeigen, wie sehr die Software derzeit an Popularität gewinnt. Einige Anfragen sind harmlos, und man muss DALL-E loben, dass sie sehr gut beantwortet werden. Wie im Beispiel oben gezeigt, lieferte „NASA erforscht UFOs“ großartige Ergebnisse, die wie eine Mischung aus dem tatsächlichen Kunstwerk und „Akte X“ aussehen. Wenn es jedoch darum geht, echte Gesichter zu zeigen, schneidet DALL-E etwas ab, und die Ergebnisse können sowohl verstörend als auch urkomisch sein.
Der obige Tweet ist ein gutes Beispiel dafür, wie beunruhigend die Ergebnisse dieser Technologie sein können. Der Benutzer suchte nach „Weezer in den Hinterzimmern“. Wenn Sie sehr weit von Ihrem Bildschirm entfernt stehen und die Augen zusammenkneifen, sieht es vielleicht gut aus, aber bei näherer Betrachtung ist es der Treibstoff eines Albtraums. Auch in solchen Fällen ist es auf jeden Fall beeindruckend, wozu DALL-E fähig ist. Es ist jedoch anzumerken, dass die Technologie zwar sicherlich fortgeschritten, aber nicht so innovativ ist, wie es scheint.
DALL-E mini ist einer von vielen
Die oben gezeigte Version von DALL-E, gehostet von Hugging Face und „DALL-E mini“ genannt, basiert auf einem Open-Source-Projekt von OpenAI . Google verfügt über eine eigene funktionierende Version seiner benutzerorientierten Software namens Imagen, die ebenfalls OpenAI verwendet, um Bilder der nächsten Ebene basierend auf Textaufforderungen auszugeben. Leider verfügt Google nicht über eine so umfassende Demo wie das, was wir von DALL-E mini bekommen können, aber Sie können hier einige der von Google vorgeschlagenen KI-generierten Ergebnisse sehen . Die Kreation von Google ist äußerst fotorealistisch, allerdings können wir nicht sicher sein, wie viel Verarbeitung hinter den Kulissen durchgeführt wurde, bevor jede Kreation für die öffentliche Betrachtung bereit war.
Das vielleicht interessanteste Beispiel für diesen Text-zu-Bild-KI-Demonstrationstrend ist GauGAN2 von NVIDIA , eine Software, die künstliche Intelligenz und maschinelles Lernen nutzt, um Fotos basierend auf Textaufforderungen zu erstellen. Die resultierenden Bilder, die von NVIDIA präsentiert werden, sind so lebensecht, dass man kaum glauben kann, dass eine Maschine sie anhand einiger Textzeilen erstellt hat. GauGAN2 hat gegenüber DALL-E noch einen weiteren Vorsprung: Es bietet außerdem Draw plus Text-to-Image, mit dem Sie etwas ganz Einfaches zeichnen und sehen können, wie es zu etwas wird, das einem Foto ähnelt. Ähnlich wie DALL-E kann GauGAN2 von NVIDIA derzeit kostenlos getestet werden.
Wenn Sie sich mehr für die abstrakte Seite der Dinge interessieren, könnte Ihnen StarryAI gefallen . Es funktioniert auf sehr ähnliche Weise wie DALL-E, aber anstatt zu versuchen, etwas Plausibles zu schaffen, erzeugt es völlig unnatürliche Bilder, die keinen Anschein erwecken, mit Fotos verwechselt zu werden. NightCafe erstellt auf der Grundlage Ihrer Eingabeaufforderungen traumhafte Bilder und Sie können aus über einem Dutzend verschiedener Stile wie „Cyberpunk“ und „Fantasy“ wählen. Es gibt auch AI Art Maker , der in eine andere Seite der Kunst einzutauchen scheint, indem er leicht bizarre Bilder erstellt, wiederum basierend auf Texteingaben. Wie Sie sehen, gibt es auch viele andere Optionen, obwohl sich der DALL-E mini schnell zu einem Twitter-Favoriten entwickelt.