alle Beiträge

Kreativität und KI: Bildgenerierung mit ChatGPT & Co

Ein Roboter malt mit einem Pinsel an einer Staffelei ein Bild von einem Sonnenaufgang.



Die Künstliche Intelligenz hat in den letzten Jahren enorme Fortschritte in der Bildgenerierung erzielt und ermöglicht mittlerweile die Erstellung und Bearbeitung von Bildern auf eine Weise, die noch vor Kurzem undenkbar schien.

Tools wie DALL·E, ChatGPT, Midjourney, Imagen, Lexica und viele mehr, bieten die Möglichkeit, durch bildbasierte Prompts beeindruckende visuelle Inhalte zu kreieren – sei es eine detaillierte Darstellung von Szenen, Objekten oder sogar Stimmungen. Die Flexibilität dieser KI-Modelle erlaubt es, mit nur wenigen Worten ein Bild zu erzeugen, das ziemlich genau den eigenen Vorstellungen entspricht.

Mit gezielten und durchdachten Prompts, der Auswahl passender Stile und Formate sowie der kreativen Nutzung der neuesten Funktionen wie konsistenter Bildserien, selektiver Bearbeitung und Bild-zu-Bild-Generierung lässt sich das volle Potenzial der Bildgenerierung ausschöpfen. Diese Funktionen bieten nicht nur mehr Kontrolle über das Endprodukt, sondern eröffnen auch spannende Möglichkeiten zur individuellen Gestaltung.

Abhängig davon, wie häufig und in welchem Umfang Sie den Bildgenerator nutzen möchten, gibt es unterschiedliche Bezahlmodelle. Ein Abo-Modell ist ideal für regelmäßige Nutzer, die regelmäßig hochwertige Bilder benötigen, während Pay-per-Use für Gelegenheitsnutzer und kleinere Projekte besser geeignet ist. Zudem bieten viele Plattformen Freemium-Modelle, die einen guten Einstieg ermöglichen, wenn die Anforderungen an die Bildqualität nicht allzu hoch sind.

In diesem Beitrag erfahren Sie, wie Sie die neuesten Funktionen der Bildgenerierung effizient nutzen können. Sie erhalten wertvolle Tipps zur Optimierung Ihrer Ergebnisse und entdecken praktische Anwendungsbeispiele, die Ihnen bei der Realisierung Ihrer kreativen Projekte behilflich sein werden.



Bildgenerierung mit KI: Was ist möglich?

ChatGPT und andere Modelle können realistische und künstlerische Bilder auf Basis von Textbeschreibungen erstellen. Dazu gehören:

  • Fotorealistische Darstellungen: Ideal für Produktbilde, Mockups oder Konzeptvisualisierungen.

  • Illustrationen & digitale Kunst: Perfekt für Branding, Marketing und kreative Projekte.

  • Vektorgrafiken & Icons: Hilfreich für Webdesign und UI/UX-Elemente.

  • Bildbearbeitung & Stiltransfer: Anpassung vorhandener Bilder oder Umwandlung in verschiedene Stile.

  • Konsistente Bildserien: Erstellung mehrerer Bilder mit demselben Charakter, Stil oder Setting.

  • Bildmodifikationen anhand von Vorlagen: Anpassung bestehender Bilder durch gezielte KI-gesteuerte Änderungen.

  • Selektive Bearbeitung von Bildbereichen: Markieren und Verändern einzelner Elemente innerhalb eines Bildes.



 

Vier einfache Tipps für bessere Ergebnisse

✔️ Klare und detaillierte Prompts verwenden

Je präziser die Beschreibung, desto besser das Ergebnis. Prompt Engineering ist eine Schlüsseltechnik, um das volle Potenzial der Bildgenerierung mit KI zu nutzen. Durch präzise und durchdachte Prompts können Sie sicherstellen, dass die generierten Bilder Ihren kreativen Anforderungen entsprechen. Experimentieren Sie mit verschiedenen Techniken, Stilen und Attributen, um herauszufinden, welche Kombinationen die besten Ergebnisse liefern!

Das Erstellen eines perfekten Bildes ist oft ein iterativer Prozess. Beginnen Sie mit einer klaren Idee und verfeinern Sie ihren Prompt, basierend auf den Ergebnissen, die Sie erhalten. Mit jeder Iteration kann man mehr Details hinzufügen, Elemente anpassen oder neue Aspekte ausprobieren.

Schlechtes Prompt-Beispiel:  "Ein Hund"

Bessere Ergebnisse:  "Ein Golden Retriever Welpe mit einer roten Fliege, der auf einer Wiese sitzt und in die Kamera schaut."

 
Ein Golden Retriever Welpe mit einer roten Fliege, der auf einer Wiese sitzt und in die Kamera schaut.
 

So formulieren Sie präzisere Prompts:

  1. Beschreiben Sie Farben, Materialien und Texturen: Statt "ein Haus" -> "Ein kleines Fachwerkhaus mit rotem Ziegeldach und begrüntem Vorgarten."

  2. Fügen Sie Emotionen oder Stimmungen hinzu: Statt "eine Stadt bei Nacht" -> "Eine neonbeleuchtete Cyberpunk-Stadt bei Nacht mit Regenpfützen, die das Licht reflektieren."

  3. Bestimmen Sie den Fokus und die Perspektive: Statt "ein Wald" -> "Ein dichter Wald aus hohen Pinien, aus der Vogelperspektive gesehen."

💡 Tipp: Testen Sie verschiedene Variationen des gleichen Prompts, indem Sie einzelne Elemente ändern (z. B. Licht, Farbe oder Perspektive), um die besten Ergebnisse zu erzielen.




✔️
Kunststile angeben

Um die Bildgestaltung gezielt zu beeinflussen, kann man Stile wie "Cyberpunk", "Aquarell", oder "Minimalistisch" angeben.

Weitere Stilideen:

  • Analoge Effekte: "Ölgemälde im Stil von Rembrandt", "Bleistiftzeichnung mit Schraffurtechnik"

  • Digitale Looks: "3D-Render im Pixar-Stil", "Futuristische Vektorgrafik"

  • Spezielle Atmosphären: "Mystische Fantasy-Landschaft mit Nebelschwaden und warmem Licht"

Mystische Fantasy-Landschaft mit Nebelschwaden und warmem Licht

 



✔️
Format und Bildverhältnis beachten

Nicht alle generativen Tools unterstützen jede Bildgröße. Während einige KI-Tools exakte Pixelwerte generieren können, lassen sich in vielen Fällen auch Seitenverhältnisse (Aspect Ratios) angeben, um die Bildkomposition zu beeinflussen.

Hier nenne ich einige gängige Formate & Beispiel-Prompts für verschiedene Social-Media Plattformen:

  • Instagram-Posts (Quadratisch, 1080x1080 px, 1:1 Ratio)
    Prompt: „Eine stilvolle Flatlay-Aufnahme von Kaffee, Notizbuch und Laptop, aus der Vogelperspektive, im quadratischen 1:1-Format.“
  • Instagram-Stories / Reels (Hochformat, 1080x1920 px, 9:16 Ratio)
    Prompt: „Moderne Produktpräsentation einer Smartwatch mit minimalistischem weißem Hintergrund, im Hochformat 9:16.“
  • YouTube-Thumbnails (Querformat, 1280x720 px, 16:9 Ratio)
    Prompt: „Epische Sci-Fi-Landschaft mit einer futuristischen Stadt und Raumschiffen, Sonnenuntergangsstimmung, im 16:9-Format, für ein YouTube-Thumbnail.“
  • Web-Banner (Panorama, 1920x600 px, 21:9 Ratio)
    Prompt: „Weite Berglandschaft mit Nebel und dramatischem Himmel, im Panorama-Format 21:9, für einen Website-Header.“
  • Pinterest-Posts (Hochformat, 1000x1500 px, 2:3 Ratio)
    Prompt: „Ästhetisches Flatlay-Foto von Handarbeitsmaterialien auf einem Holztisch, mit warmem Licht, im Hochformat 2:3, ifür Pinterest.“
  • LinkedIn-Header (Querformat, 1584x396 px, 4:1 Ratio)
    Prompt: „Professionelles LinkedIn-Header-Bild mit modernem Büro-Hintergrund in Blau- und Grautönen, im 4:1-Breitformat.“

 

Eine stilvolle Flatlay-Aufnahme von Kaffee, Notizbuch und Laptop, aus der Vogelperspektive.
 



✔️
Kamera-Winkel, Brennweite und Beleuchtung gezielt steuern

Der Bildaufbau wird stark durch Perspektive, Licht und Objektivwahl beeinflusst. Um realistische oder künstlerische Effekte zu erzeugen, sollte man diese Elemente gezielt in den Prompts angeben.

📌 Empfohlene Kamera-Winkel:

  • Vogelperspektive (Top-Down): "Eine belebte Marktstraße aus der Vogelperspektive, mit bunten Ständen und Menschen."

  • Froschperspektive (Low Angle): "Eine mächtige Burgruine aus der Froschperspektive, mit dunklen Wolken darüber."

  • Makroaufnahme (Close-Up): "Eine Nahaufnahme eines Wassertropfens auf einem Rosenblatt, mit hoher Detailgenauigkeit."

  • Weitwinkel (Wide Shot): "Eine weite, neblige Landschaft mit einem einsamen Baum im Mittelpunkt."


📌 Brennweite und Objektivwahl für verschiedene Effekte:

  • Weitwinkel (10-35mm): Für Landschaften, Architektur oder dynamische Nahaufnahmen mit starker Tiefenwirkung.

  • Standard (35-85mm): Natürliche Perspektiven, ideal für Porträts und Street Photography.

  • Teleobjektiv (85-300mm): Kompressionseffekt, gut für Sport, Wildlife und Close-Ups aus großer Distanz.

  • Makro-Objektiv (50-100mm mit Makrofunktion): Extrem detaillierte Nahaufnahmen von kleinen Objekten.


📌 Beleuchtungsarten für verschiedene Stimmungen:

  • Weiches, diffuses Licht: Ideal für verträumte, harmonische Szenen – "Ein gemütliches Café bei Sonnenuntergang mit warmem Licht."

  • Dramatische Schatten (Chiaroscuro): Perfekt für Spannung und Dynamik – "Ein dunkler Wald, in dem Lichtstrahlen durch die Äste fallen."

  • Neon- oder künstliches Licht: Gut für futuristische oder Cyberpunk-Settings – "Eine Cyberpunk-Stadt bei Nacht mit intensiven Neonschildern."

  • Golden Hour-Effekt: Erzeugt ein warmes, weiches Licht – "Ein Surfer am Strand während der goldenen Stunde mit orangenen Lichtreflexen."



Ein Surfer am Strand während der goldenen Stunde mit orangenen Lichtreflexen.



Sieben Tricks für Profi-Nutzer

✔️ Konsistente Serien

Die Möglichkeit, konsistente Serien von Bildern zu erzeugen, ist besonders nützlich für Projekte, bei denen eine durchgängige visuelle Linie erforderlich ist (z. B. für Illustrationen, Charakterdesigns oder Branding).

  • Ziel: Erstellen Sie eine Serie von Bildern mit demselben Charakter und Hintergrund, aber in unterschiedlichen Posen oder Szenarien.
  • Prompt: „Ein roboterähnlicher Charakter in einem futuristischen Outfit, in verschiedenen Posen und in der gleichen Umgebung, die jeweils eine andere Emotion ausdrücken.“

  • 💡 Tipp: Verwenden Sie bei jeder Bildbeschreibung denselben Charakter und beschreiben Sie die Umgebung sowie die Stimmung in ähnlicher Weise. Dies sorgt für visuelle Konsistenz.
    Falls Sie für Social Media oder eine Website regelmäßig neue Illustrationen brauchen, speicheren Sie Standardprompts und nutzen sie als Ausgangspunkt für Variationen!

Ergebnis: Sie erhalten mehrere Bilder, die denselben Charakter und Stil beibehalten, aber unterschiedliche Situationen darstellen.



✔️
Bild-zu-Bild-Generierung

Mit der Bild-zu-Bild-Funktion können Sie ein bestehendes Bild als Ausgangspunkt verwenden und es dann in einem neuen Stil oder mit veränderten Details umwandeln. Falls eine bestehende Skizze oder ein Foto als Grundlage dient, kann die KI darauf aufbauen und sie in einen neuen Stil übertragen.

  • Ziel: Verwenden Sie eine grobe Skizze oder ein erstes Design und lassen Sie die KI daraus ein detailliertes und künstlerisches Bild erstellen.
  • Prompt: „Verwandle diese grobe Skizze eines Flugzeugs in ein hochdetailliertes 3D-Modell im futuristischen Stil, mit metallischen Texturen und einer fliegenden Darstellung in einem wolkigen Himmel.“

  • 💡Tipp: Laden Sie das Bild hoch und geben Sie die gewünschten Änderungen an. Seien Sie spezifisch in Bezug auf Stil, Beleuchtung und Texturen, um genau das gewünschte Ergebnis zu erhalten.

Ergebnis: Das Bild wird auf Basis der hochgeladenen Skizze neu interpretiert, dabei jedoch stilistisch und detailtechnisch verbessert.



✔️
Bildbereiche gezielt anpassen

Eine der neuesten Funktionen in der Bildgenerierung ist die Möglichkeit, nur bestimmte Bereiche eines Bildes zu bearbeiten oder zu verändern. Diese Funktion ist besonders nützlich, wenn Sie nur Details anpassen möchten, ohne das ganze Bild neu generieren zu müssen. Anstatt ein komplettes Bild neu zu generieren, kann man bestimmte Elemente ersetzen oder verändern (z. B. eine andere Frisur oder Hintergrund).

  • Ziel: Ändern Sie nur den Hintergrund eines bereits generierten Bildes, während der Vordergrund unverändert bleibt.

  • Prompt: „Ersetze den Hintergrund des Bildes mit einem Nebelwald bei Sonnenuntergang, während der Vordergrund mit einem einsamen Wanderer gleich bleibt.“

  • 💡Tipp: Geben Sie explizit an, welche Elemente des Bildes unverändert bleiben sollen, und welche verändert werden sollen. So vermeidet die KI unnötige Anpassungen.

Ergebnis: Das Bild zeigt denselben Vordergrund, aber mit einem neuen Hintergrund.



✔️
Optimierung der Bildauflösung und Formatierung

Für bestimmte Verwendungszwecke (z. B. Druck, Webseiten oder Social Media) kann die Wahl der richtigen Bildauflösung und des Formats entscheidend sein. Viele Bildgeneratoren bieten unterschiedliche Optionen zur Anpassung dieser Parameter.

  • Ziel: Erstellen Sie ein hochauflösendes Bild für den Druck.

  • Prompt: „Erstelle ein realistisches Porträt eines Löwen in hoher Auflösung (300 DPI), das für den Druck geeignet ist.“

  • 💡Tipp: Achten Sie darauf, die Auflösung (z. B. „300 DPI für Druck“) und die gewünschten Maße (z. B. „A4-Größe“) im Prompt anzugeben, um sicherzustellen, dass das Bild die erforderliche Qualität für den Druck erreicht.

Ergebnis: Ein Bild in hoher Auflösung, das scharf und detailreich ist und für den Druck verwendet werden kann.




✔️ Multi-Prompt-Technik für komplexe Bilder

Die Multi-Prompt-Technik ermöglicht es, mehrere spezifische Elemente in einem Bild zu kombinieren, indem verschiedene Prompts miteinander kombiniert werden. Dies ist besonders hilfreich, wenn Sie komplexe Szenen mit mehreren Aspekten oder Perspektiven erstellen möchten.

  • Ziel: Erstellen Sie ein episches Fantasy-Bild, das eine mittelalterliche Stadt bei Sonnenuntergang darstellt, mit einem lebhaften Marktplatz im Vordergrund und einer imposanten Burg im Hintergrund.

  • Prompt:

    1. „Eine mittelalterliche Stadt bei Sonnenuntergang, mit goldenem Licht, das die Türme der Burg im Hintergrund erleuchtet.“

    2. „Im Vordergrund ein belebter Marktplatz mit vielen Händlern, die verschiedene Waren verkaufen, und bunten Zelten.“

    3. „Die Straßen sind voller Menschen in mittelalterlichen Gewändern, einige reiten auf Pferden, andere unterhalten sich.“

  • 💡Tipp: Kombinieren Sie mehrere Prompts zu verschiedenen Aspekten der Szene (Hintergrund, Mittelgrund, Vordergrund) und geben Sie klare Details für jedes Element an, um eine komplexe, aber kohärente Darstellung zu erhalten.

Ergebnis: Ein detailliertes, mehrdimensionales Bild, das verschiedene Ebenen einer mittelalterlichen Stadt darstellt – vom lebhaften Marktplatz bis zur majestätischen Burg im Hintergrund.



 

✔️ Erstellung von animierten GIFs

ChatGPT bietet mittlerweile die Möglichkeit, animierte GIFs direkt zu generieren, indem eine Reihe von Bildern als Frames für die Animation erstellt wird. Diese Frames können dann in einer Reihenfolge zusammengesetzt werden, um eine flüssige Bewegung zu erzeugen.

  • Ziel: Erstellen Sie ein animiertes GIF, das eine Figur zeigt, die sich von links nach rechts bewegt.

  1. Geben Sie ChatGPT eine präzise Anweisung zur Erstellung einer Serie von Bildern, die als Frames für das GIF dienen. Beispiel-Prompt: „Erstelle eine Animation von einer Katze, die von links nach rechts über den Bildschirm läuft. Verwende fünf verschiedene Posen, die eine fließende Bewegung zeigen.

  2. ChatGPT wird eine Serie von Bildern erzeugen, die als Frames für das GIF dienen können.

  3. Nachdem die Bilder generiert wurden, können Sie diese in eine Animation umwandeln. ChatGPT bietet an, diese Frames direkt als animierte GIFs zu exportieren.

  4. Stellen Sie sicher, dass die Übergänge zwischen den Bildern fließend sind, um eine realistische Bewegung zu erzielen. Achten Sie auch auf die Dauer jedes Frames – zu schnelle Übergänge können unnatürlich wirken.

  • 💡Tipp: Wenn Sie möchten, dass die Animation noch flüssiger aussieht, können Sie die Anzahl der Frames erhöhen oder eine kontinuierliche Bewegung detaillierter beschreiben (z. B. „Katzenschritte, die sanft und gleichmäßig sind“).
Ergebnis: Ein animiertes GIF, das die Katze in einer fließenden Bewegung von links nach rechts zeigt.
 

 
 

✔️ Stilanpassung für individuelle Bedürfnisse

Die Anpassung von Stilen ist eine der kreativsten Möglichkeiten, um einzigartig aussehende Bilder zu erstellen. Sie können das Bild im Stil eines bestimmten Künstlers oder in einem einzigartigen visuellen Ansatz generieren.

  • Ziel: Erstellen Sie eine futuristische Stadt im Stil von „Blade Runner“.

  • Prompt:Erstelle eine futuristische Stadt bei Nacht im Stil von 'Blade Runner', mit Neonlichtern, hoch aufragenden Wolkenkratzern und regennassen Straßen.

  • 💡Tipp: Nennen Sie bekannte Kunststile, Filmreferenzen oder Designrichtungen (z. B. „im Stil von Van Gogh“, „Surrealismus“, „Minimalismus“), um die Bildgestaltung gezielt zu beeinflussen.

Ergebnis: Ein Bild, das genau den gewünschten Kunststil und die Atmosphäre wiedergibt.


Vier Varianten eines Bildes: Futuristische Stadt bei Nacht im Stil von 'Blade Runner', mit Neonlichtern, hoch aufragenden Wolkenkratzern und regennassen Straßen.


 
 

Anwendungsbeispiele im Designprozess

  • Hero Images für Websites
    Mit generierten Bildern können beeindruckende Header-Grafiken erstellt werden, die sich perfekt an das Corporate Design anpassen.
  • Individuelle Icons & UI-Elemente
    Anstelle von Standard-Icons können einzigartig gestaltete UI-Elemente entstehen, die eine Marke unverwechselbar machen.
  • Social Media & Blog-Illustrationen
    Visuell ansprechende Bilder fördern die Engagement-Rate und verleihen Beiträgen eine persönliche Note.
  • Visuelle Kontinuität sicherstellen
    Besonders für Webdesign-Projekte ist es wichtig, dass Bilder nicht zufällig variieren. Durch konsistente Prompts und Stilvorgaben bleibt eine visuelle Linie erhalten.
  • Packaging und Mockup-Designs
    Generierte Bilder können auch für Verpackungsdesigns oder Mockups genutzt werden. Erstellen Sie visuelle Darstellungen von Produktverpackungen, Tassen, Shirts oder anderen Markenmaterialien, um zu sehen, wie Ihre Designs in der realen Welt aussehen würden, bevor sie tatsächlich produziert werden.


Eine braune Tüte mit Hundefutter neben zwei Futterdosen auf einem Holztresen.

Beachten Sie jedoch, dass KI-generierte Bilder oft keine korrekt lesbaren oder sinnvollen Texte enthalten. Falls ein Design Schriftzüge oder Logos enthält, sollten diese nachträglich in einer Grafiksoftware manuell eingefügt oder korrigiert werden, um ein professionelles Ergebnis zu gewährleisten.

 



Rechtliche Hinweise: Disclaimer für KI-generierte Bilder


In vielen Fällen ist es ratsam, im deutschsprachigen Wirtschaftsraum darauf hinzuweisen, dass ein Bild von Künstlicher Intelligenz (KI) erstellt wurde, insbesondere in Bereichen wie Werbung oder kommerziellen Inhalten. Zwar gibt es aktuell keine zwingende gesetzliche Verpflichtung, einen expliziten Disclaimer einzufügen, aber es wird empfohlen, Transparenz gegenüber den Nutzern herzustellen, um Missverständnisse zu vermeiden.

Ein solcher Hinweis könnte folgendermaßen lauten: "Dieses Bild wurde mit Hilfe von Künstlicher Intelligenz erstellt."

Dies fördert nicht nur das Vertrauen der Zielgruppe, sondern entspricht auch einer guten Praxis in Bezug auf die Kennzeichnung digitaler Inhalte, insbesondere wenn diese in der Werbung oder für kommerzielle Zwecke genutzt werden.

 


 
 

Artikel, die Sie interessieren könnten: