Ein Blick auf die neue Al Generative Art

Al generative Kunst ist eine Art von Kunst, meist visuell, die auf der Zusammenarbeit zwischen einem Menschen und einem autonomen System basiert. Ein „autonomes System“ ist definiert als ein Artificial Intelligence Software, Algorithmus oder Modell, das in der Lage ist, komplexe Operationen auszuführen, ohne dass ein Programmierer eingreifen muss.

Aus den bizarren Gegenüberstellungen von Bildern, die von geschaffen wurden Dall-E Mini zu den NFT Auf dem Markt dringen Bilder, die von KI-Algorithmen generiert werden, zunehmend in die Vorstellungswelt des Mainstreams ein. Tatsächlich verdienen zwei wichtige Projekte zu diesem Thema eine Analyse: Zwischendurch und DALL-E2.

Natürlich hat die Nachricht auch den Weg auf Twitter gefunden. Unter anderem kommentiert es Charles Hoskinson, der schrieb:

Al Generative Art: frühe Experimente und Features

Nachdem Sie verstanden haben, was generative Kunst ist, ist es wichtig, eines ihrer Gründungsprinzipien hervorzuheben: Zufälligkeit. Was eine grundlegende Eigenschaft der generativen Kunst ist.

Tatsächlich ist das autonome System je nach Art der Software in der Lage, Ergebnisse zu verarbeiten, die bei jeder Ausführung des Generate-Befehls immer unterschiedlich und eindeutig sind, oder es kann als Reaktion auf Benutzereingaben eine variable Anzahl von Ergebnissen zurückgeben.

Die ersten Experimente in der generativen Kunst gehen auf die 1960er Jahre mit den Experimenten von zurück Harald Cohen und seinem AARON Programm. Cohen verwendete zunächst eine eigenständige Software, um abstrakte Kunstwerke zu erstellen, die von Pop-Art-Siebdrucken inspiriert waren. Cohens Werke sind jetzt in der Tate Gallery in London zu sehen.

Ein weiteres Merkmal der generativen Kunst, das jedoch immer weniger ein Vorrecht ist, ist die Wiederholung von Mustern oder abstrakten Elementen, die vom Programmierer bereitgestellt und in den Softwarecode implementiert werden.

Darüber hinaus hat die Entwicklung immer komplexerer neuronaler Netze, die mit Text-Bild-Assoziationen arbeiten, die Entwicklung generativer Modelle ermöglicht, die in der Lage sind, immer realistischere und genauere Bilder zu erzeugen. Das bekannteste Beispiel dieser Kategorie der generativen Kunst ist Platte.

Dall-E ist ein multimodales neuronales Netzwerk basierend auf dem GPT-3 Deep-Learning-Modell von OpenAI, das gleiche Unternehmen, das sich auch kürzlich entwickelt hat ChatGPT, der Chatbot, der im November 2022 gestartet und mit optimiert wurde „beaufsichtigt“ und Reinforcement-Learning-Techniken.

Zurück zu Dall-E sehen wir, dass dieses System in der Lage ist, Bilder aus einer Textbeschreibung, genannt a, zu generieren "prompt," basierend auf einem Datensatz von Text-Bild-Paaren.

Die erste Version von Dall-E, die im Januar 2021 der Öffentlichkeit vorgestellt wurde und das Vorrecht einer kleinen Anzahl von Fachleuten auf diesem Gebiet blieb, stellte eine echte Revolution in Bezug auf diese Art von generativem Modell dar und übertraf die Innovationen von GPT- 3 selbst.

Von Bedeutung ist auch die Tatsache, dass sich die Genauigkeit der von Dall-E verarbeiteten Ergebnisse als perfekter Spielraum für eine weitere OpenAI-Lösung erwiesen hat: CLIP (Kontrastives Sprachbild-Vortraining).

Ein neuronales Netzwerk zur Bildklassifizierung und -einstufung, das auf der Grundlage von Text-Bild-Assoziationen trainiert wurde, wie z. B. im Internet gefundene Bildunterschriften. Dank der Intervention von CLIP, die die Anzahl der dem Benutzer pro Eingabeaufforderung vorgeschlagenen Ergebnisse auf 32 reduziert, lieferte Dall-E in den meisten Fällen zufriedenstellende Bilder.

Zwischendurch: Design, menschliche Infrastruktur und künstliche Intelligenz

Wie vorausgesehen, Zwischendurch ist ein wichtiges Projekt, das Teil des aufkommenden Al Generative Art-Konzepts ist. Insbesondere ist Midjourney ein unabhängiges Forschungslabor, das neue Denkweisen erforscht und die Vorstellungskraft der menschlichen Spezies erweitert.

Die Nutzung ist einfach: Zunächst muss ein Konto erstellt werden Discord, eine Plattform, auf der verschiedene Communities gehostet werden, darunter Midjourney. Innerhalb der Anwendung befinden sich die verschiedenen Chatrooms, in denen man aktiv an Diskussionen teilnehmen kann oder nicht.

Es ist wichtig darauf hinzuweisen, dass man zum ersten Mal versuchen muss, künstliche Intelligenz zu verwenden "Neulinge" Kanäle, wo 25 kostenlose Renderings stehen zur Verfügung.

Ein Rendering entspricht der Generierung von vier verschiedenen Varianten, die aus derselben Texteingabe generiert wurden.

Somit beziehen sich die 25 Renderings auf 25 Verarbeitungsaufträge, die vom Midjourney-Bot ausgeführt werden. Folglich erfordert das Generieren des Bildes die Interaktion mit dem Midjourney-Bot über eine Textnachricht namens „Prompt“, in der Schlüsselwörter das Bild beschreiben, das der Benutzer im Sinn hat.

Sie können beliebig viele Details hinzufügen, wichtig ist, dass Sie die Schlüsselwörter mit einem Komma trennen. Sobald das Rendern abgeschlossen ist, gibt der Computer vier verschiedene Bilder zurück, basierend auf den Beschreibungen zur Auswahl.

Außerdem können Sie nach dem Rendering des Programms anhand der Bilder Ihre Vorlieben mitteilen und sich auf Wunsch noch einmal vier weitere Versionen generieren lassen.

DALL-E 2: das neue KI-System für Kunstwerke

Neben Midjourney ist DALL-E 2 auch das neue KI-System, das aus einer Beschreibung in natürlicher Sprache realistische Bilder und Kunstwerke erstellen kann. Darüber hinaus kann DALL-E 2 Konzepte, Attribute und Stile kombinieren.

Die Stärke des neuen KI-Systems liegt auch darin, Bilder über das, was auf der ursprünglichen Leinwand vorhanden ist, zu erweitern und zu erstellen neue umfangreiche Kompositionen. Darüber hinaus kann es realistische Änderungen an bestehenden Bildern aus einer Beschriftung in natürlicher Sprache vornehmen und Elemente unter Berücksichtigung von Schatten, Reflexionen und Texturen hinzufügen und entfernen.

Zu den Fähigkeiten von DALL-E 2 gehört auch, ein Bild aufzunehmen und mehrere Variationen davon zu erstellen, die vom Original inspiriert sind. DALL-E 2 hat die Beziehung zwischen Bildern und dem zu ihrer Beschreibung verwendeten Text gelernt.

Es verwendet einen Prozess namens "Diffusion," die mit einem Muster aus zufälligen Punkten beginnt und dieses Muster allmählich in Richtung eines Bildes verändert, wenn es bestimmte Aspekte dieses Bildes erkennt.

Nachdem OpenAI DALL-E im Januar 2021 eingeführt hat, erzeugt nun das neueste System, DALL-E 2, realistischere und genauere Bilder mit der vierfachen Auflösung.

DALL-E 2 begann als Forschungsprojekt und ist jetzt als verfügbar Betaversion. Sicherheitsminderungen, die das System entwickelt hat und weiter verbessert, umfassen: Einschränkung der Fähigkeit des Systems, Bilder von Gewalt, Hass oder Erwachsenen zu erzeugen, und lernbasierter, stufenweiser Einsatz.

Quelle: https://en.cryptonomist.ch/2023/02/02/ai-generative-art/