GPT Image
OpenAI
OpenAIs natives multimodales Bildgenerierungsmodell, Nachfolger von DALL-E 3 und Standard-Bildmodell in ChatGPT. Versteht Prompts in natürlicher Sprache, auch auf Deutsch, beherrscht Text im Bild deutlich besser als frühere Modelle und unterstützt maskenbasiertes Editieren mit Referenzbildern. Über die API in den Varianten gpt-image-2, gpt-image-1.5 und gpt-image-1-mini verfügbar.
Kosten: In ChatGPT enthalten (Free begrenzt, Plus 20 USD/Monat, Pro 200 USD/Monat). API tokenbasiert: gpt-image-2 ca. 0,006 USD (low) bis 0,21 USD (high) pro Bild, gpt-image-1-mini deutlich günstiger
Kategorien
Stärken
- Direkt in ChatGPT verfügbar, kein separates Konto, kein Prompt-Engineering nötig
- Deutlich besseres Text-Rendering im Bild als DALL-E 3, Midjourney oder Stable Diffusion
- Promptverständnis in natürlicher Sprache, auch auf Deutsch, dank Anbindung an OpenAIs Sprachmodelle
- Maskenbasiertes Editieren und Inpainting mit Referenzbildern über die API
- Flexible Auflösungen bis 3840 px und drei Qualitätsstufen (low/medium/high) zur Kostensteuerung
- Tokenbasierte API-Preise mit günstiger Mini-Variante für Massengenerierung
Einschränkungen
- Ästhetische Qualität bei künstlerischen, fotorealistischen Stilen weiterhin unter Midjourney
- Text im Bild ist besser, aber bei längeren Texten und exakter Platzierung noch fehleranfällig
- Datenhaltung ausschließlich in den USA, kein EU-Hosting
- Transparente Hintergründe bei gpt-image-2 nicht mehr unterstützt (anders als gpt-image-1)
- Strenge Inhaltsfilter: keine realistischen Porträts öffentlicher Personen, Logos oft blockiert
- ChatGPT-Generierungslimits pro Plan von OpenAI nicht transparent kommuniziert
Passt gut zu
Wann ja, wann nein
Wann ja
- Du willst Bilder direkt aus ChatGPT heraus generieren, ohne Workflow-Bruch
- Du brauchst lesbare Texte, Beschriftungen oder einfache Infografiken im Bild
- Du entwickelst eine Anwendung und brauchst Bildgenerierung und Editing per API
- Du bist Einsteiger und willst ohne Lernaufwand brauchbare Ergebnisse
Wann nein
- Du brauchst künstlerisch-fotorealistische Bilder auf Midjourney-Niveau
- Du arbeitest mit vertraulichen Daten und brauchst EU-Hosting
- Du brauchst zuverlässig transparente Hintergründe (PNG mit Alpha)
- Du willst realistische Darstellungen erkennbarer Personen oder Markenlogos erzeugen
Kurzfazit
GPT Image ist OpenAIs natives Bildgenerierungsmodell und der direkte Nachfolger von
Für wen ist GPT Image?
Content-Marketer und Redakteure: Wer regelmäßig Blog-Artikel, Social-Media-Beiträge oder Newsletter produziert, bekommt Illustrationen direkt aus ChatGPT, ohne Stockfoto-Abo und ohne stundenlange Bildsuche. Beschreibung eintippen, Bild erhalten, im selben Chat verfeinern.
Präsentationsersteller: Infografiken, Diagramme mit Beschriftungen, Illustrationen für Foliensätze, das sind klassische Stärken. GPT Image rendert Text im Bild deutlich besser als die meisten Konkurrenten, sodass eine Folienreihe in wenigen Minuten individuelle Visuals bekommt.
Entwickler und Produktteams: Über die OpenAI API lässt sich GPT Image in eigene Anwendungen einbinden, inklusive maskenbasiertem Editieren und Referenzbildern. Automatisierte Bildpipelines für Produktkataloge, Thumbnails oder dynamische Content-Assets sind mit wenigen Zeilen Python umsetzbar. Die Mini-Variante senkt die Kosten bei großen Mengen spürbar.
Einsteiger in KI-Bildgenerierung: Wer sich nicht mit Seed-Werten, Sampling oder Prompt-Syntax beschäftigen will, ist hier richtig. GPT Image versteht vollständige Sätze, auf Deutsch genauso wie auf Englisch, und ist über ChatGPT ohne jede Einrichtung nutzbar.
Bestehende DALL-E-Nutzer: Wer noch Skripte oder Workflows auf DALL-E 3 betrieben hat, muss umsteigen: OpenAI hat die DALL-E-API im Mai 2026 abgeschaltet. GPT Image ist der vorgesehene Nachfolger mit besserem Editing und feinerer Kostenkontrolle.
Weniger geeignet für: Fotografen und Kreativagenturen, die fotorealistische oder künstlerisch anspruchsvolle Bilder brauchen (Midjourney ist hier überlegen), Teams, die zuverlässig transparente Hintergründe benötigen (gpt-image-2 unterstützt das nicht mehr), sowie Unternehmen mit strikten DSGVO-Anforderungen, die EU-Datenhaltung voraussetzen (
Preise im Detail
GPT Image wird auf zwei Wegen abgerechnet: pauschal als Teil deines ChatGPT-Abos oder tokenbasiert über die API.
| Zugang | Preis | Was du bekommst |
|---|---|---|
| ChatGPT Free | 0 USD | Begrenzte Bildgenerierungen pro Tag, Standardauflösung |
| ChatGPT Plus | 20 USD/Monat | Mehr Generierungen pro Tag, höhere Auflösungen, schnellerer Zugriff |
| ChatGPT Pro | 200 USD/Monat | Faktisch unbegrenzte Generierungen, Prioritätszugang, neueste Modelle zuerst |
| API gpt-image-2 | tokenbasiert | Text-Input 5 USD, Bild-Input 8 USD, Bild-Output 30 USD je 1 Mio. Tokens |
| API gpt-image-1.5 | tokenbasiert | Text-Input 5 USD, Bild-Input 8 USD, Bild-Output 32 USD je 1 Mio. Tokens |
| API gpt-image-1-mini | tokenbasiert | Text-Input 2 USD, Bild-Input 2,50 USD, Bild-Output 8 USD je 1 Mio. Tokens |
Pro generiertem Bild ergeben sich bei gpt-image-2 laut OpenAI-Kalkulation ungefähr diese Kosten (Quadratformat 1024 x 1024):
| Qualität | 1024 x 1024 | 1024 x 1536 | 1536 x 1024 |
|---|---|---|---|
| low | ca. 0,006 USD | ca. 0,005 USD | ca. 0,005 USD |
| medium | ca. 0,053 USD | ca. 0,041 USD | ca. 0,041 USD |
| high | ca. 0,211 USD | ca. 0,165 USD | ca. 0,165 USD |
Einordnung: Für gelegentliche Nutzung reicht der Free-Plan, die genauen Tageslimits kommuniziert OpenAI allerdings nicht transparent. ChatGPT Plus für 20 USD ist der Sweetspot, sobald du regelmäßig Bilder für Präsentationen oder Social Media erzeugst, das Abo amortisiert sich bei wenigen eingesparten Stunden Bildsuche. Die API lohnt sich ab etwa 50 Bildern pro Monat oder wenn du Generierung automatisieren willst. Achte dabei auf die Qualitätsstufe: Der Unterschied zwischen low (ca. 0,006 USD) und high (ca. 0,21 USD) ist erheblich, für Thumbnails und Tests reicht low oft, für finale Assets nimmst du medium oder high. Wer in großen Mengen generiert, fährt mit gpt-image-1-mini deutlich günstiger, bei spürbar geringerer Detailtiefe. Die Token-Abrechnung ist gewöhnungsbedürftig, der eingebaute Kostenrechner im OpenAI-Guide hilft bei der Kalkulation.
Stärken im Detail
Text im Bild ist die Kernstärke. Wer je versucht hat, mit Midjourney oder Stable Diffusion lesbare Schrift in ein Bild zu bekommen, kennt das Zeichensalat-Problem. GPT Image rendert Beschriftungen, Headlines und einfache Infografiken deutlich zuverlässiger. OpenAI selbst schränkt ein, dass es bei langen Texten und exakter Platzierung weiterhin haken kann, aber für Social-Media-Grafiken, Folien und alles, wo Worte ins Bild müssen, ist es das stärkste Modell seiner Klasse.
Promptverständnis in natürlicher Sprache. Während andere Generatoren auf Keyword-Stapelung setzen (“cinematic, 8k, volumetric lighting”), versteht GPT Image vollständige Sätze. “Ein helles Stadtbüro, zwei Personen im Gespräch, warme Farben, keine Gesichter erkennbar” funktioniert direkt. Das senkt die Einstiegshürde drastisch, weil die Modellanbindung an OpenAIs Sprachmodelle die Beschreibung interpretiert statt nur Schlagworte zu verarbeiten.
ChatGPT-Integration als Workflow-Beschleuniger. Text schreiben und passendes Bild erzeugen, im selben Fenster, ohne Tab-Wechsel. Korrekturen laufen als Folgefrage: “Mach das Bild heller und entferne den Hintergrundtext.” GPT Image behält den Kontext und liefert eine angepasste Version. Für Content-Creator, die Text und Visuals zusammen produzieren, ist das ein echter Effizienzgewinn.
Maskenbasiertes Editieren mit Referenzbildern. Über die API kannst du gezielt Bildbereiche per Maske bearbeiten (Inpainting) und Referenzbilder mitgeben, an denen sich das Modell orientiert. Das war bei DALL-E 3 ein Schwachpunkt und ist nun deutlich ausgebaut. Eingehende Bilder verarbeitet gpt-image-2 automatisch in hoher Detailtreue, ohne dass du Parameter feinjustieren musst.
Flexible Auflösungen und Qualitätsstufen. gpt-image-2 akzeptiert nahezu beliebige Auflösungen bis 3840 px Kantenlänge (Vielfache von 16, Seitenverhältnis bis 3:1). Drei Qualitätsstufen plus Auto-Modus erlauben es, Geschwindigkeit, Detailtiefe und Kosten gegeneinander abzuwägen, ein konkreter Vorteil gegenüber Modellen mit festen Bildformaten.
Mehrere Modellvarianten für unterschiedliche Budgets. Mit gpt-image-2, gpt-image-1.5 und gpt-image-1-mini deckt OpenAI vom Premiumeinsatz bis zur kostengünstigen Massengenerierung ab. Wer Tausende Thumbnails braucht, nutzt die Mini-Variante, wer maximale Qualität will, das Top-Modell, alles über dieselbe API.
Schwächen ehrlich betrachtet
Ästhetik hat weiterhin eine Grenze. Bei künstlerischen, stimmungsvollen oder fotografisch anspruchsvollen Bildern, Modeoptik, Architekturfotografie, epische Illustrationen, bleibt GPT Image hinter Midjourney zurück. Die Ergebnisse wirken oft sauber, aber etwas flach. Wer die letzte Meile in Bildästhetik braucht, wird das Modell als zu brav empfinden.
Text im Bild ist besser, aber nicht perfekt. OpenAI selbst räumt ein, dass das Modell bei präziser Textplatzierung und Lesbarkeit längerer Passagen noch Fehler macht. Für kurze Headlines und Beschriftungen taugt es, aber verlasse dich bei wichtigen Texten nicht blind darauf, prüfe jedes Ergebnis und plane Korrekturschleifen ein.
Keine transparenten Hintergründe bei gpt-image-2. Anders als das ältere gpt-image-1 unterstützt gpt-image-2 keine transparenten Hintergründe mehr (background: transparent wird abgelehnt). Wer PNGs mit Alpha-Kanal für Logos, Sticker oder Freisteller braucht, muss auf das ältere Modell ausweichen oder nachträglich freistellen, ein echter Rückschritt für bestimmte Workflows.
Inhaltliche Beschränkungen greifen regelmäßig. OpenAI filtert strikt: keine realistischen Darstellungen öffentlicher Personen, kein Gewalt-Content, häufig blockierte Markenlogos. In der Praxis scheitern politische Satire, bestimmte realistische Szenarien oder Bilder mit erkennbaren Marken oft. Legitim, aber im professionellen Einsatz gelegentlich frustrierend.
US-Datenhaltung ist ein DSGVO-Problem. Alle Anfragen laufen über OpenAI-Server in den USA. Für Behörden, Gesundheitswesen oder Kanzleien ist das ein Ausschlusskriterium. Eine native EU-Region gibt es nicht.
Intransparente Limits in ChatGPT. Wie viele Bilder Free-, Plus- und Pro-Nutzer pro Tag erzeugen dürfen, kommuniziert OpenAI nicht klar. Die Limits ändern sich und sind situativ, was die Planbarkeit für regelmäßige Nutzer erschwert. Wer verlässliche Mengen braucht, fährt mit der API besser.
Alternativen im Vergleich
| Wenn du… | …nimm stattdessen |
|---|---|
| Künstlerisch-fotorealistische Bilder brauchst | |
| EU-Hosting und Adobe-Integration brauchst | |
| Maximale stilistische Kontrolle und Open-Source willst | |
| Bilder direkt in Design-Workflows nutzen willst | |
| Tiefe Google-Workspace-Integration brauchst |
Erwähnenswert ohne eigenen Vergleichslink: Das ältere
So steigst du ein
Schritt 1: Öffne chatgpt.com. Mit Free-Account hast du sofort Zugang zu begrenzten Generierungen. Beschreibe dein Bild in vollständiger, natürlicher Sprache. Statt “business meeting photo” besser: “Zwei Personen sitzen an einem hellen Konferenztisch, lockere Businesskleidung, modernes Büro mit Fensterfront, warmes Tageslicht, illustrativer Stil, keine Gesichter erkennbar.”
Schritt 2: Verfeinere über Folgefragen. Wenn das Ergebnis nicht passt, korrigiere direkt im Chat: “Mach den Hintergrund blauer und entferne das Fenster links.” GPT Image behält den Kontext und liefert eine angepasste Version. In zwei bis drei Iterationen kommst du meist zu einem verwendbaren Bild.
Schritt 3: Für Batch-Generierung oder Editing wechselst du auf die API. Auf platform.openai.com einen API-Key anlegen, die OpenAI Python-Library installieren und das Modell wählen (gpt-image-2 für Qualität, gpt-image-1-mini für Masse). Setze die Qualitätsstufe bewusst: low für Tests und Thumbnails, medium oder high für finale Assets. Für gezielte Korrekturen nutzt du das maskenbasierte Editing mit Referenzbild.
Ein konkretes Beispiel
Eine Content-Marketing-Agentur in Hamburg erstellt monatlich 35 Blog-Artikel für B2B-Kunden aus Logistik und Finanzen. Früher wurden Stockfotos für 10 bis 15 EUR pro Bild lizenziert, bei zwei Bildern pro Artikel summierten sich die Lizenzkosten auf 700 bis 1.050 EUR im Monat. Nach der Umstellung auf GPT Image via API generiert eine Werkstudentin in einer Stunde individuelle Illustrationen zum jeweiligen Thema. Die Agentur fährt die meisten Bilder in der Stufe medium (ca. 0,05 USD pro Bild) und nutzt für die wenigen Hero-Bilder high (ca. 0,21 USD). Die monatlichen API-Kosten liegen unter 15 EUR. Ein Zusatznutzen: Die generierten Bilder zeigen keine erkennbaren Personen und sind urheberrechtlich unkompliziert. Texte im Bild, etwa Diagramm-Beschriftungen, gelingen direkt im ersten Versuch, was bei früheren Generatoren regelmäßig scheiterte. Ersparnis pro Monat: rund 700 bis 1.000 EUR Bildlizenzkosten.
DSGVO & Datenschutz
- Datenhosting: USA (Microsoft-Azure- und OpenAI-Infrastruktur), keine EU-Hosting-Option für Standardpläne.
- Datennutzung: OpenAI kann Eingaben für Sicherheitsüberprüfungen verarbeiten. ChatGPT-Nutzer können das Training mit eigenen Daten in den Einstellungen deaktivieren.
- API-Daten: OpenAI nutzt API-Anfragen laut Nutzungsbedingungen nicht für Modell-Training.
- Account-Löschung: Möglich über die Kontoeinstellungen unter openai.com.
- AVV: Datenverarbeitungsvertrag (DPA) für API-Kunden und Enterprise verfügbar, nicht für ChatGPT-Free.
- Empfehlung für Unternehmen: Keine personenbezogenen Daten, Kundendaten oder vertraulichen Informationen in Prompts oder hochgeladene Bilder geben. Für Branchen mit Berufsgeheimnis (Anwälte, Ärzte, Steuerberater) vor Einsatz rechtlich prüfen. EU-hosting-sensible Unternehmen sollten
Adobe Firefly evaluieren.
Gut kombiniert mit
ChatGPT , GPT Image ist direkt eingebaut. Text und Bild entstehen im selben Gespräch, ohne Kontextwechsel, ideal für Artikel samt Headerbild in einem Tab.Canva , generierte Bilder als Ausgangsmaterial weiterverarbeiten: als Hintergrundfolie, Thumbnail-Element oder mit Textoverlays. Canva hat eigene KI-Generierung, GPT Image liefert bei komplexen Beschreibungen oft präzisere Rohbilder.Adobe Firefly , Stärken kombinieren: GPT Image für schnelle Rohbilder und Text-im-Bild, Firefly für präzises Inpainting, Nachbearbeitung im Adobe-Workflow und EU-konforme Assets.
Unser Testurteil
GPT Image verdient 4 von 5 Sternen. Als Nachfolger von DALL-E 3 erbt es dessen größte Stärke, das zuverlässige Text-Rendering und das Promptverständnis in natürlicher Sprache, und baut sie mit maskenbasiertem Editieren, flexiblen Auflösungen und drei Qualitätsstufen sinnvoll aus. Die Integration in ChatGPT macht es zum zugänglichsten Bildgenerator am Markt. Den fünften Stern verhindern die anhaltende ästhetische Lücke zu Midjourney, das fehlende EU-Hosting, der Wegfall transparenter Hintergründe bei gpt-image-2, die strengen Inhaltsfilter und die intransparenten ChatGPT-Limits. Für Einsteiger, Content-Teams und Entwickler, die schnelle, zweckorientierte Bilder mit Text brauchen, ist GPT Image die erste Wahl. Für Kreativprofis, die maximale Bildästhetik herausholen wollen, bleibt Midjourney vorn.
Was wir bemerkt haben
- Dezember 2025, OpenAI hat in ChatGPT vollständig auf GPT Image umgestellt. DALL-E-3-Nutzer erzeugen seitdem ohne sichtbare Umstellung Bilder mit dem neuen Modell, die Bildfunktion in ChatGPT heißt intern nun GPT Image statt DALL-E.
- Mai 2026, OpenAI hat die DALL-E-2- und DALL-E-3-API abgeschaltet. Wer noch Skripte auf der alten API betrieben hat, musste auf gpt-image umstellen. Der Vorgänger
DALL-E 3 ist damit eingestellt. - 2026, Die Modellfamilie ist auf gpt-image-2 (Top-Modell), gpt-image-1.5 und gpt-image-1-mini gewachsen. Die Token-Abrechnung trennt Text-Input, Bild-Input und Bild-Output, das gibt feine Kostenkontrolle, ist aber gewöhnungsbedürftiger als der frühere Pro-Bild-Preis von DALL-E 3.
- 2026, gpt-image-2 hat die Unterstützung für transparente Hintergründe verloren, die das ältere gpt-image-1 noch bot. Für Workflows mit freigestellten Bildern (Logos, Sticker) ist das ein Rückschritt, hier bleibt nur das ältere Modell oder nachträgliches Freistellen.
- Juni 2026, OpenAI weist in der Preisübersicht inzwischen regionale Data-Residency-Endpunkte aus (10 Prozent Aufschlag für Modelle ab dem 5. März 2026). Eine native EU-Region speziell für die Standard-Bildgenerierung in ChatGPT ist damit aber weiterhin nicht garantiert. Wer DSGVO-konform arbeiten muss, sollte die regionalen API-Optionen prüfen oder auf Enterprise mit AVV beziehungsweise eine Alternative mit EU-Hosting setzen.
Quellen
- OpenAI – Image generation guide. https://developers.openai.com/api/docs/guides/image-generation (abgerufen am 2026-06-13). Modellfamilie gpt-image-2, gpt-image-1.5, gpt-image-1, gpt-image-1-mini; drei Qualitaetsstufen low/medium/high; Aufloesungen bis 3840 px (Vielfache von 16, Seitenverhaeltnis bis 3:1); gpt-image-2 unterstuetzt keine transparenten Hintergruende.
- OpenAI – Deprecations. https://developers.openai.com/api/docs/deprecations (abgerufen am 2026-06-13). DALL-E 2 und DALL-E 3 werden am 12. Mai 2026 abgeschaltet, empfohlener Nachfolger ist gpt-image-2, gpt-image-1 oder gpt-image-1-mini.
- OpenAI – API-Preise. https://developers.openai.com/api/docs/pricing (abgerufen am 2026-06-13). Tokenbasierte Abrechnung der Bildmodelle, Bild-Output je nach Modell rund 1,25 bis 8 USD je 1 Mio. Tokens; regionale Data-Residency-Endpunkte mit 10 Prozent Aufschlag fuer Modelle ab 5. Maerz 2026.
Diesen Inhalt teilen:
Arthur Atlas
KI-Analyst
So entsteht diese Bewertung
Diese Seite bewerten wir redaktionell, mit kräftiger Unterstützung von Arthur Atlas, unserem KI-Analysten. Er prüft Bewertungen nach und markiert veraltete Angaben, sobald sich der Markt dreht. Unsere Angaben stammen überwiegend aus öffentlich zugänglichen Quellen wie Anbieter-Website, Doku und Preislisten. Preise und Funktionen können sich ändern.
Hinweis: Diese Angaben können veraltet oder fehlerhaft sein. Prüfe im Zweifel immer direkt auf der Website des Anbieters.
Preise geändert, Feature veraltet oder etwas fehlt?
Wir freuen uns über Hinweise und Ergänzungen.
Du arbeitest bei OpenAI?
Gib uns einen Testzugang, dann schauen wir tiefer rein und ergänzen die Bewertung aus erster Hand.
Nicht sicher, ob GPT Image zu euch passt?
Wir helfen bei der Tool-Auswahl und begleiten die Einführung in euren Arbeitsalltag, unverbindlich und kostenlos im Erstgespräch.
KI-Tools und Trends
KI-Wochenbriefing: jeden Freitag KI-News, Praxistipps und Tools
Kostenlos abonnieren, jederzeit abmeldbar, kein Spam.