Cleverclip Logo
Roboter paint Mona Lisa of Leonardo da Vinci

DALL-E einfach erklärt

Verica Rosic, 10. Februar 2023· Kreativer Prozess

Ein Astronaut auf einem Pferd oder ein Seeotter im Stil von „Das Mädchen mit dem Perlenohrring“ – um solche Grafiken zu erstellen, benötigen Designer normalerweise mehrere Stunden. „DALL-E“, eine künstliche Intelligenz (KI) von OpenAI, generiert diese Bilder in Sekunden. Was DALL-E ist, wie das Tool funktioniert und nutzen lässt, erfährst du in diesem DALL-E Guide.

Inhalt

  • Was ist DALL-E?

  • Wie funktioniert DALL-E?

  • Hat DALL-E Sicherheitslücken?

  • Ist DALL-E kostenlos?

  • Wie kann ich DALL-E nutzen?

  • Kann ich DALL-E auch kommerziell nutzen?

  • In welchen Bereichen könnte DALL-E zum Einsatz kommen?

  • Beispiele von mit DALL-E generierten Bildern

  • Welche Zukunftsaussichten hat DALL-E?

Was ist DALL-E?

„DALL-E“ ist der Name eines Online-Programms des Unternehmens OpenAI, das Textaufforderungen in Bilder übersetzt. Der Begriff „DALL-E“ ist zusammengesetzt aus dem Namen des surrealistischen Künstlers Dalí und dem Pixar-Filmtitel „WALL-E“. Das Programm basiert auf einem neuronalen Netzwerk, das Aufforderungen („Textprompts“) mithilfe künstlicher Intelligenz in neue Bilder übersetzt. Das Unternehmen OpenAI hat DALL-E erstmals im Januar 2021 vorgestellt. DALL-E 2 ist die verbesserte Version, die eine noch höhere Anzahl an Bildern mit besserer Auflösung generiert und Bilder auch nachträglich bearbeiten kann.

Wie funktioniert DALL-E?

Die künstliche Intelligenz DALL-E 2 kann aus Textpromts neue Bilder erstellen oder bestehende editieren. OpenAI hat DALL-E 2 mit einer grossen Datenbank trainiert. So kann die KI Beziehungen zwischen Text-Beschreibungen und Bildern verstehen. Da DALL-E die Bilder zufällig ausmalt, gleicht kein Ergebnis dem anderen.

DALL-E 2 basiert auf zwei AI-Technologien: Die erste lautet CLIP (Contrastive Language-Image Pre-training), ein künstliches neuronales Netzwerk, das Bilder anhand von Textprompts skizzieren kann. Die zweite Technologie heisst GLIDE (Guided Language to Image Diffusion for Generation and Editing). Sie kann diese Skizzen ausmalen, sodass das menschliche Auge ein stimmiges Bild erkennen kann.

Hat DALL-E Sicherheitslücken?

Beide Technologien basieren auf einem “Generative Pre-trained Transformer” (GPT)-Modell, das anhand einer Vielzahl an Bildern mit zugehörigen Beschreibungen geschult wurde. Um jedoch nicht bisherige Stereotypen und Diskriminierung zu reproduzieren, hat OpenAI Sicherheitsmassnahmen unternommen. So wurde DALL-E 2 trainiert, Ergebnisse zu generieren, die die Vielfalt der Weltbevölkerung repräsentieren, sodass beispielsweise bei der Eingabe von „Doktor“ nicht mehr überwiegend Abbildungen weisser männlicher Personen entstehen. Auch können keine Bilder hochgeladen werden, die realistische Gesichter bekannter Personen oder Gewalt abbilden.

Ist DALL-E kostenlos?

DALL-E 2 ist bis zu einer bestimmten Anzahl an Textpromts kostenlos. Zum Start gibt es 50 Credits umsonst und jeden Monat 15 weitere geschenkt. Ein Credit wird jedes Mal verwendet, wenn ein Benutzer auf „generate“ oder „variations“ klickt. Pro Stunde können Nutzer maximal 12 Bilder erstellen. Da OpenAI jeden Account an eine Handynummer koppelt, wird eine Umgehung dieses Credit-Systems erschwert.

Im Juni 2022 ist DALL-E in die Beta-Phase gestartet. Seitdem können Nutzer neben den frei verfügbaren Credits zusätzliche 115 Credits für 15 Dollar kaufen. Zudem gab OpenAI bekannt, dass sich Künstler hier für finanzielle Unterstützung bewerben können. Damit möchte das Unternehmen die Verbreitung des Tools im kreativen Bereich unterstützen.

Wie kann ich DALL-E nutzen?

Jeder mit einer Mobilnummer kann einen DALL-E Zugang erstellen. Du kannst hier auf „sign up“ klicken und dich registrieren. In das Textfeld kannst du den gewünschten Textprompt eingeben und aus meist vier Ergebnissen auswählen. Die Bilder lassen sich downloaden, haben jedoch eine Watermark.

DALL-E Tipp: Nutze in den Textprompts detaillierte Beschreibungen wie beispielsweise ein Motiv in einer bestimmten Darstellungsform, bestimmte Farben, Orte oder Bildausschnitte. Generell lohnt es sich, verschiedene Textprompts auszuprobieren, um DALL-E gut nutzen zu lernen. Mit der die Funktion „Surprise me“ kannst du dich zudem inspirieren lassen.

Kann ich DALL-E auch kommerziell nutzen?

Seit sich DALL-E in der Beta-Phase befindet, erhalten User die vollen Nutzungsrechte an ihren erstellten Bildern. Dies beinhaltet auch die Nutzung von DALL-E für kommerzielle Zwecke. Als Copyright verwenden die meisten Nutzer © OpenAI. Das Urheberrecht der durch eine KI erstellten Bilder ist jedoch noch nicht juristisch definiert.

In welchen Bereichen könnte DALL-E zum Einsatz kommen?

Bereits jetzt gewinnen Bilder, die mithilfe einer künstlichen Intelligenz geschaffen wurden, Kunstwettbewerbe – wie beispielsweise „Théâtre D’opéra Spatial“, das Jason Allen mithilfe von Midjourney erstellte und damit den ersten Preis beim Wettbewerb der Colorado Fair gewann.

Zugleich bietet DALL-E vielfältige Möglichkeiten, um Künstler oder Designer zu inspirieren und Ideen zu veranschaulichen. DALL-E 2 kann neben der Kunst auch in anderen Branchen zum Einsatz kommen, um Zeit und Ressourcen zu sparen oder bei der Ideenfindung zu unterstützen.

Einige Beispiele für die Verwendung von DALL-E könnten sein:

  • Erstellung von generativen Kunstbildern

  • Erstellung von Illustrationen für Kinderbücher oder Comics

  • Erstellung von visuellen Elementen für Spiele oder Filme

  • Erstellung von Prototypen für Produktdesign

Beispiele von mit DALL-E generierten Bildern

1) Astronaut riding a horse

Eines der bekanntesten Beispiele von mit DALL-E generierten Bilder ist der Astronaut, der auf einem Pferd durch den Weltraum reitet. Das Beispiel zeigt, wie realistisch DALL-E bestehende Konzepte kombinieren kann.Astronaut riding a horse - dall-eAstronaut riding a horse © OpenAIDALLE

2) White fur monster in purple room

Das weisse Plüschmonster im lila Raum könnte als Charakter in Videospielen oder in anderen digitalen Medien eingesetzt werden und zeigt, dass die KI in der Lage ist, neue und einzigartige Figuren zu erschaffen.White fur monster in purple room - dall-eWhite fur monster in purple room © OpenAIDALLE

3) Teddy bears mixing sparkling chemicals as mad scientists

DALL-E kann auch Fantasiemotive realistisch darstellen. Das Bild der Teddybären, die als verrückte Wissenschaftler in einem Labor funkelnde Chemikalien mischen, könnte als Buchcover für Kindergruselgeschichten zum Einsatz kommen.Teddy bears mixing sparkling chemicals as mad scientists - dall-eTeddy bears mixing sparkling chemicals as mad scientists © OpenAIDALLE

4) A sea otter in the style of ‘Girl with a Pearl Earring’ by Johannes Vermeer

Kunstklassiker neu interpretiert: Das Bild eines Seeotters im Stil des ‚Mädchens mit dem Perlenohrring‘ von Johannes Vermeer zeigt, dass DALL-E berühmte Künstler imitieren kann – wie hier den niederländischen Maler Vermeer.A sea otter in the style of ‘Girl with a Pearl Earring - dall-e “A sea otter in the style of ‘Girl with a Pearl Earring’ by Johannes Vermeer” © OpenAIDALLE

5) A photo of a quaint flower shop storefront with a pastel green and clean white facade and open door and big window

Realistische Hochglanzfotos: Dieses Bild eines malerischen Blumenladens mit einer pastellgrünen und cleanen, weissen Fassade, einer offenen Tür und einem grossen Fenster ist ein Beispiel dafür, wie wirklichkeitsgetreu DALL-E neue Orte schaffen kann.A photo of a quaint flower shop storefront with a pastel green and clean white facade and open door and big window - dall-e“A photo of a quaint flower shop storefront with a pastel green and clean white facade and open door and big window” © OpenAIDALLE

6) An avocado armchair

Dall-E ist auch in der Lage, ungewöhnliche Designs zu kreieren wie dieses futuristische Möbelstück – ein grün-brauner Sessel in der Form einer Avocado.An avocado armchair - dall-e“An avocado armchair” ©OpenAIDALLE

7) A teddy bear on sideboard on timesquare

DALL-E kann auch Plüschtiere zum Leben erwecken. Das Bild eines Teddybären, der in New York auf einem Skateboard über den Times Square fährt, zeigt, wie DALL-E auch Fantasiemotive fotorealistisch abbilden kann.A teddy bear on sideboard on timesquare - dall-eA teddy bear on sideboard on timesquare” ©OpenAIDALLE

8) An oil painting of a humanoid robot playing chess in the style of Matisse

Science-Fiction trifft Matisse: Das Ölgemälde im Stil von Matisse zeigt einen humanoiden Roboter, der Schach spielt und ist ein weiteres Beispiel dafür, wie DALL-E verschiedene Kunststile nachahmen kann.An oil painting of a humanoid robot playing chess in the style of Matisse “An oil painting of a humanoid robot playing chess in the style of Matisse” ©OpenAIDALLE

9) A raccoon astronaut with the cosmos reflecting on the glass of his helmet dreaming ft he stars, digital art

Süsser Waschbär im Weltall: Das digitale Kunstwerk zeigt einen Waschbären-Astronauten, bei dem sich der Kosmos auf dem Glas seines Helms spiegelt.A raccoon astronaut with the cosmos reflecting on the glass of his helmet dreaming of the stars, digital art “A raccoon astronaut with the cosmos reflecting on the glass of his helmet dreaming of the stars, digital art ” ©OpenAIDALLE

10) Portrait of shiba inu, photo, 8k

Auch fotorealistische Porträts von Lieblingstieren kann DALL-E erstellen – wie hier das Bild eines Shiba Inu in 8K-Auflösung.Portrait of shiba inu, photo, 8k “Portrait of shiba inu, photo, 8k” ©OpenAIDALLE

Welche Zukunftsaussichten hat DALL-E?

Es ist davon auszugehen, dass sich DALL-E in Zukunft immer weiter verbessern wird. OpenAI arbeitet bereits an einer erweiterten Version von DALL-E, die in der Lage sein wird, auch Videos zu erstellen. Es ist auch davon auszugehen, dass DALL-E künftig auch Ton und Sprache generieren kann. Dies würde die Möglichkeiten von DALL-E noch einmal erweitern und in noch mehr Branchen einsetzbar machen.

Fazit

DALL-E ist ein leistungsstarkes Tool von OpenAI, das es ermöglicht, anhand von Textprompts schnell und einfach Grafiken zu generieren. DALL-E 2 ist die neue Version, die eine noch höhere Anzahl an Bildern mit besserer Auflösung generiert, weniger diskriminierende und diversere Ergebnisse liefert und auch bestehende Bilder nachträglich bearbeiten kann. DALL-E ist in vielen Branchen einsetzbar, um Zeit und Ressourcen zu sparen. Wichtig ist jedoch, dass der Umgang mit KI verantwortungsvoll erfolgt und die Anwendung weiterhin vor Missbrauch geschützt wird.