Freemium Ohne Setup 🇩🇪 Deutschsprachig 🇺🇸 US-Server Zuletzt geprüft: Juni 2026

GPT Image

OpenAI

4/5

OpenAIs natives multimodales Bildgenerierungsmodell, Nachfolger von DALL-E 3 und Standard-Bildmodell in ChatGPT. Versteht Prompts in natürlicher Sprache, auch auf Deutsch, beherrscht Text im Bild deutlich besser als frühere Modelle und unterstützt maskenbasiertes Editieren mit Referenzbildern. Über die API in den Varianten gpt-image-2, gpt-image-1.5 und gpt-image-1-mini verfügbar.

Kosten: In ChatGPT enthalten (Free begrenzt, Plus 20 USD/Monat, Pro 200 USD/Monat). API tokenbasiert: gpt-image-2 ca. 0,006 USD (low) bis 0,21 USD (high) pro Bild, gpt-image-1-mini deutlich günstiger

Kategorien

Bildgenerierung

Stärken

Direkt in ChatGPT verfügbar, kein separates Konto, kein Prompt-Engineering nötig
Deutlich besseres Text-Rendering im Bild als DALL-E 3, Midjourney oder Stable Diffusion
Promptverständnis in natürlicher Sprache, auch auf Deutsch, dank Anbindung an OpenAIs Sprachmodelle
Maskenbasiertes Editieren und Inpainting mit Referenzbildern über die API
Flexible Auflösungen bis 3840 px und drei Qualitätsstufen (low/medium/high) zur Kostensteuerung
Tokenbasierte API-Preise mit günstiger Mini-Variante für Massengenerierung

Einschränkungen

Ästhetische Qualität bei künstlerischen, fotorealistischen Stilen weiterhin unter Midjourney
Text im Bild ist besser, aber bei längeren Texten und exakter Platzierung noch fehleranfällig
Datenhaltung ausschließlich in den USA, kein EU-Hosting
Transparente Hintergründe bei gpt-image-2 nicht mehr unterstützt (anders als gpt-image-1)
Strenge Inhaltsfilter: keine realistischen Porträts öffentlicher Personen, Logos oft blockiert
ChatGPT-Generierungslimits pro Plan von OpenAI nicht transparent kommuniziert

Passt gut zu

ChatGPT-Nutzer Content-Marketing Präsentationen Text-in-Bild API-Entwicklung

Wann ja, wann nein

Wann ja

Du willst Bilder direkt aus ChatGPT heraus generieren, ohne Workflow-Bruch
Du brauchst lesbare Texte, Beschriftungen oder einfache Infografiken im Bild
Du entwickelst eine Anwendung und brauchst Bildgenerierung und Editing per API
Du bist Einsteiger und willst ohne Lernaufwand brauchbare Ergebnisse

Wann nein

Du brauchst künstlerisch-fotorealistische Bilder auf Midjourney-Niveau
Du arbeitest mit vertraulichen Daten und brauchst EU-Hosting
Du brauchst zuverlässig transparente Hintergründe (PNG mit Alpha)
Du willst realistische Darstellungen erkennbarer Personen oder Markenlogos erzeugen

Kurzfazit

GPT Image ist OpenAIs natives Bildgenerierungsmodell und der direkte Nachfolger von DALL-E 3. Es steckt seit Ende 2025 hinter der Bildfunktion in ChatGPT und ist über die API in mehreren Varianten verfügbar (gpt-image-2, gpt-image-1.5, gpt-image-1-mini). Seine Kernstärke bleibt dieselbe wie bei DALL-E: Text im Bild funktioniert zuverlässiger als bei Midjourney oder Stable Diffusion, und Prompts versteht das Modell in natürlicher Sprache, auch auf Deutsch. Neu hinzugekommen sind maskenbasiertes Editieren mit Referenzbildern, flexible Auflösungen bis 3840 px und drei Qualitätsstufen, mit denen sich die API-Kosten gezielt steuern lassen. Für künstlerisch hochwertige, fotorealistische Bilder bleibt Midjourney die bessere Wahl. Für schnelle, zweckorientierte Visuals aus dem ChatGPT-Workflow heraus ist GPT Image die praktischste Lösung am Markt.

Für wen ist GPT Image?

Content-Marketer und Redakteure: Wer regelmäßig Blog-Artikel, Social-Media-Beiträge oder Newsletter produziert, bekommt Illustrationen direkt aus ChatGPT, ohne Stockfoto-Abo und ohne stundenlange Bildsuche. Beschreibung eintippen, Bild erhalten, im selben Chat verfeinern.

Präsentationsersteller: Infografiken, Diagramme mit Beschriftungen, Illustrationen für Foliensätze, das sind klassische Stärken. GPT Image rendert Text im Bild deutlich besser als die meisten Konkurrenten, sodass eine Folienreihe in wenigen Minuten individuelle Visuals bekommt.

Entwickler und Produktteams: Über die OpenAI API lässt sich GPT Image in eigene Anwendungen einbinden, inklusive maskenbasiertem Editieren und Referenzbildern. Automatisierte Bildpipelines für Produktkataloge, Thumbnails oder dynamische Content-Assets sind mit wenigen Zeilen Python umsetzbar. Die Mini-Variante senkt die Kosten bei großen Mengen spürbar.

Einsteiger in KI-Bildgenerierung: Wer sich nicht mit Seed-Werten, Sampling oder Prompt-Syntax beschäftigen will, ist hier richtig. GPT Image versteht vollständige Sätze, auf Deutsch genauso wie auf Englisch, und ist über ChatGPT ohne jede Einrichtung nutzbar.

Bestehende DALL-E-Nutzer: Wer noch Skripte oder Workflows auf DALL-E 3 betrieben hat, muss umsteigen: OpenAI hat die DALL-E-API im Mai 2026 abgeschaltet. GPT Image ist der vorgesehene Nachfolger mit besserem Editing und feinerer Kostenkontrolle.

Weniger geeignet für: Fotografen und Kreativagenturen, die fotorealistische oder künstlerisch anspruchsvolle Bilder brauchen (Midjourney ist hier überlegen), Teams, die zuverlässig transparente Hintergründe benötigen (gpt-image-2 unterstützt das nicht mehr), sowie Unternehmen mit strikten DSGVO-Anforderungen, die EU-Datenhaltung voraussetzen (Adobe Firefly ist dann die bessere Option).

Preise im Detail

GPT Image wird auf zwei Wegen abgerechnet: pauschal als Teil deines ChatGPT-Abos oder tokenbasiert über die API.

Zugang	Preis	Was du bekommst
ChatGPT Free	0 USD	Begrenzte Bildgenerierungen pro Tag, Standardauflösung
ChatGPT Plus	20 USD/Monat	Mehr Generierungen pro Tag, höhere Auflösungen, schnellerer Zugriff
ChatGPT Pro	200 USD/Monat	Faktisch unbegrenzte Generierungen, Prioritätszugang, neueste Modelle zuerst
API gpt-image-2	tokenbasiert	Text-Input 5 USD, Bild-Input 8 USD, Bild-Output 30 USD je 1 Mio. Tokens
API gpt-image-1.5	tokenbasiert	Text-Input 5 USD, Bild-Input 8 USD, Bild-Output 32 USD je 1 Mio. Tokens
API gpt-image-1-mini	tokenbasiert	Text-Input 2 USD, Bild-Input 2,50 USD, Bild-Output 8 USD je 1 Mio. Tokens

Pro generiertem Bild ergeben sich bei gpt-image-2 laut OpenAI-Kalkulation ungefähr diese Kosten (Quadratformat 1024 x 1024):

Qualität	1024 x 1024	1024 x 1536	1536 x 1024
low	ca. 0,006 USD	ca. 0,005 USD	ca. 0,005 USD
medium	ca. 0,053 USD	ca. 0,041 USD	ca. 0,041 USD
high	ca. 0,211 USD	ca. 0,165 USD	ca. 0,165 USD

Einordnung: Für gelegentliche Nutzung reicht der Free-Plan, die genauen Tageslimits kommuniziert OpenAI allerdings nicht transparent. ChatGPT Plus für 20 USD ist der Sweetspot, sobald du regelmäßig Bilder für Präsentationen oder Social Media erzeugst, das Abo amortisiert sich bei wenigen eingesparten Stunden Bildsuche. Die API lohnt sich ab etwa 50 Bildern pro Monat oder wenn du Generierung automatisieren willst. Achte dabei auf die Qualitätsstufe: Der Unterschied zwischen low (ca. 0,006 USD) und high (ca. 0,21 USD) ist erheblich, für Thumbnails und Tests reicht low oft, für finale Assets nimmst du medium oder high. Wer in großen Mengen generiert, fährt mit gpt-image-1-mini deutlich günstiger, bei spürbar geringerer Detailtiefe. Die Token-Abrechnung ist gewöhnungsbedürftig, der eingebaute Kostenrechner im OpenAI-Guide hilft bei der Kalkulation.

Stärken im Detail

Text im Bild ist die Kernstärke. Wer je versucht hat, mit Midjourney oder Stable Diffusion lesbare Schrift in ein Bild zu bekommen, kennt das Zeichensalat-Problem. GPT Image rendert Beschriftungen, Headlines und einfache Infografiken deutlich zuverlässiger. OpenAI selbst schränkt ein, dass es bei langen Texten und exakter Platzierung weiterhin haken kann, aber für Social-Media-Grafiken, Folien und alles, wo Worte ins Bild müssen, ist es das stärkste Modell seiner Klasse.

Promptverständnis in natürlicher Sprache. Während andere Generatoren auf Keyword-Stapelung setzen (“cinematic, 8k, volumetric lighting”), versteht GPT Image vollständige Sätze. “Ein helles Stadtbüro, zwei Personen im Gespräch, warme Farben, keine Gesichter erkennbar” funktioniert direkt. Das senkt die Einstiegshürde drastisch, weil die Modellanbindung an OpenAIs Sprachmodelle die Beschreibung interpretiert statt nur Schlagworte zu verarbeiten.

ChatGPT-Integration als Workflow-Beschleuniger. Text schreiben und passendes Bild erzeugen, im selben Fenster, ohne Tab-Wechsel. Korrekturen laufen als Folgefrage: “Mach das Bild heller und entferne den Hintergrundtext.” GPT Image behält den Kontext und liefert eine angepasste Version. Für Content-Creator, die Text und Visuals zusammen produzieren, ist das ein echter Effizienzgewinn.

Maskenbasiertes Editieren mit Referenzbildern. Über die API kannst du gezielt Bildbereiche per Maske bearbeiten (Inpainting) und Referenzbilder mitgeben, an denen sich das Modell orientiert. Das war bei DALL-E 3 ein Schwachpunkt und ist nun deutlich ausgebaut. Eingehende Bilder verarbeitet gpt-image-2 automatisch in hoher Detailtreue, ohne dass du Parameter feinjustieren musst.

Flexible Auflösungen und Qualitätsstufen. gpt-image-2 akzeptiert nahezu beliebige Auflösungen bis 3840 px Kantenlänge (Vielfache von 16, Seitenverhältnis bis 3:1). Drei Qualitätsstufen plus Auto-Modus erlauben es, Geschwindigkeit, Detailtiefe und Kosten gegeneinander abzuwägen, ein konkreter Vorteil gegenüber Modellen mit festen Bildformaten.

Mehrere Modellvarianten für unterschiedliche Budgets. Mit gpt-image-2, gpt-image-1.5 und gpt-image-1-mini deckt OpenAI vom Premiumeinsatz bis zur kostengünstigen Massengenerierung ab. Wer Tausende Thumbnails braucht, nutzt die Mini-Variante, wer maximale Qualität will, das Top-Modell, alles über dieselbe API.

Schwächen ehrlich betrachtet

Ästhetik hat weiterhin eine Grenze. Bei künstlerischen, stimmungsvollen oder fotografisch anspruchsvollen Bildern, Modeoptik, Architekturfotografie, epische Illustrationen, bleibt GPT Image hinter Midjourney zurück. Die Ergebnisse wirken oft sauber, aber etwas flach. Wer die letzte Meile in Bildästhetik braucht, wird das Modell als zu brav empfinden.

Text im Bild ist besser, aber nicht perfekt. OpenAI selbst räumt ein, dass das Modell bei präziser Textplatzierung und Lesbarkeit längerer Passagen noch Fehler macht. Für kurze Headlines und Beschriftungen taugt es, aber verlasse dich bei wichtigen Texten nicht blind darauf, prüfe jedes Ergebnis und plane Korrekturschleifen ein.

Keine transparenten Hintergründe bei gpt-image-2. Anders als das ältere gpt-image-1 unterstützt gpt-image-2 keine transparenten Hintergründe mehr (background: transparent wird abgelehnt). Wer PNGs mit Alpha-Kanal für Logos, Sticker oder Freisteller braucht, muss auf das ältere Modell ausweichen oder nachträglich freistellen, ein echter Rückschritt für bestimmte Workflows.

Inhaltliche Beschränkungen greifen regelmäßig. OpenAI filtert strikt: keine realistischen Darstellungen öffentlicher Personen, kein Gewalt-Content, häufig blockierte Markenlogos. In der Praxis scheitern politische Satire, bestimmte realistische Szenarien oder Bilder mit erkennbaren Marken oft. Legitim, aber im professionellen Einsatz gelegentlich frustrierend.

US-Datenhaltung ist ein DSGVO-Problem. Alle Anfragen laufen über OpenAI-Server in den USA. Für Behörden, Gesundheitswesen oder Kanzleien ist das ein Ausschlusskriterium. Eine native EU-Region gibt es nicht.

Intransparente Limits in ChatGPT. Wie viele Bilder Free-, Plus- und Pro-Nutzer pro Tag erzeugen dürfen, kommuniziert OpenAI nicht klar. Die Limits ändern sich und sind situativ, was die Planbarkeit für regelmäßige Nutzer erschwert. Wer verlässliche Mengen braucht, fährt mit der API besser.

Alternativen im Vergleich

Wenn du…	…nimm stattdessen
Künstlerisch-fotorealistische Bilder brauchst	Midjourney
EU-Hosting und Adobe-Integration brauchst	Adobe Firefly
Maximale stilistische Kontrolle und Open-Source willst	Stable Diffusion
Bilder direkt in Design-Workflows nutzen willst	Canva
Tiefe Google-Workspace-Integration brauchst	Gemini

Erwähnenswert ohne eigenen Vergleichslink: Das ältere DALL-E 3 wurde von GPT Image abgelöst (API-Abschaltung im Mai 2026) und ist keine Alternative mehr, sondern Vorgänger. Geminis Bildmodell (“Nano Banana”) hat 2025/26 stark aufgeholt und ist beim Editieren bestehender Bilder oft überlegen. GPT Image ist kein Ästhetik-Champion, sondern das pragmatischste Allround-Modell, besonders wenn du ohnehin ChatGPT nutzt oder Text im Bild brauchst. Für Spezialanforderungen (Ästhetik, EU-Compliance, Transparenz, tiefe Bildkontrolle) gibt es die besseren Alternativen oben.

So steigst du ein

Schritt 1: Öffne chatgpt.com. Mit Free-Account hast du sofort Zugang zu begrenzten Generierungen. Beschreibe dein Bild in vollständiger, natürlicher Sprache. Statt “business meeting photo” besser: “Zwei Personen sitzen an einem hellen Konferenztisch, lockere Businesskleidung, modernes Büro mit Fensterfront, warmes Tageslicht, illustrativer Stil, keine Gesichter erkennbar.”

Schritt 2: Verfeinere über Folgefragen. Wenn das Ergebnis nicht passt, korrigiere direkt im Chat: “Mach den Hintergrund blauer und entferne das Fenster links.” GPT Image behält den Kontext und liefert eine angepasste Version. In zwei bis drei Iterationen kommst du meist zu einem verwendbaren Bild.

Schritt 3: Für Batch-Generierung oder Editing wechselst du auf die API. Auf platform.openai.com einen API-Key anlegen, die OpenAI Python-Library installieren und das Modell wählen (gpt-image-2 für Qualität, gpt-image-1-mini für Masse). Setze die Qualitätsstufe bewusst: low für Tests und Thumbnails, medium oder high für finale Assets. Für gezielte Korrekturen nutzt du das maskenbasierte Editing mit Referenzbild.

Ein konkretes Beispiel

Eine Content-Marketing-Agentur in Hamburg erstellt monatlich 35 Blog-Artikel für B2B-Kunden aus Logistik und Finanzen. Früher wurden Stockfotos für 10 bis 15 EUR pro Bild lizenziert, bei zwei Bildern pro Artikel summierten sich die Lizenzkosten auf 700 bis 1.050 EUR im Monat. Nach der Umstellung auf GPT Image via API generiert eine Werkstudentin in einer Stunde individuelle Illustrationen zum jeweiligen Thema. Die Agentur fährt die meisten Bilder in der Stufe medium (ca. 0,05 USD pro Bild) und nutzt für die wenigen Hero-Bilder high (ca. 0,21 USD). Die monatlichen API-Kosten liegen unter 15 EUR. Ein Zusatznutzen: Die generierten Bilder zeigen keine erkennbaren Personen und sind urheberrechtlich unkompliziert. Texte im Bild, etwa Diagramm-Beschriftungen, gelingen direkt im ersten Versuch, was bei früheren Generatoren regelmäßig scheiterte. Ersparnis pro Monat: rund 700 bis 1.000 EUR Bildlizenzkosten.

DSGVO & Datenschutz

Datenhosting: USA (Microsoft-Azure- und OpenAI-Infrastruktur), keine EU-Hosting-Option für Standardpläne.
Datennutzung: OpenAI kann Eingaben für Sicherheitsüberprüfungen verarbeiten. ChatGPT-Nutzer können das Training mit eigenen Daten in den Einstellungen deaktivieren.
API-Daten: OpenAI nutzt API-Anfragen laut Nutzungsbedingungen nicht für Modell-Training.
Account-Löschung: Möglich über die Kontoeinstellungen unter openai.com.
AVV: Datenverarbeitungsvertrag (DPA) für API-Kunden und Enterprise verfügbar, nicht für ChatGPT-Free.
Empfehlung für Unternehmen: Keine personenbezogenen Daten, Kundendaten oder vertraulichen Informationen in Prompts oder hochgeladene Bilder geben. Für Branchen mit Berufsgeheimnis (Anwälte, Ärzte, Steuerberater) vor Einsatz rechtlich prüfen. EU-hosting-sensible Unternehmen sollten Adobe Firefly evaluieren.

Gut kombiniert mit

ChatGPT, GPT Image ist direkt eingebaut. Text und Bild entstehen im selben Gespräch, ohne Kontextwechsel, ideal für Artikel samt Headerbild in einem Tab.
Canva, generierte Bilder als Ausgangsmaterial weiterverarbeiten: als Hintergrundfolie, Thumbnail-Element oder mit Textoverlays. Canva hat eigene KI-Generierung, GPT Image liefert bei komplexen Beschreibungen oft präzisere Rohbilder.
Adobe Firefly, Stärken kombinieren: GPT Image für schnelle Rohbilder und Text-im-Bild, Firefly für präzises Inpainting, Nachbearbeitung im Adobe-Workflow und EU-konforme Assets.

Unser Testurteil

GPT Image verdient 4 von 5 Sternen. Als Nachfolger von DALL-E 3 erbt es dessen größte Stärke, das zuverlässige Text-Rendering und das Promptverständnis in natürlicher Sprache, und baut sie mit maskenbasiertem Editieren, flexiblen Auflösungen und drei Qualitätsstufen sinnvoll aus. Die Integration in ChatGPT macht es zum zugänglichsten Bildgenerator am Markt. Den fünften Stern verhindern die anhaltende ästhetische Lücke zu Midjourney, das fehlende EU-Hosting, der Wegfall transparenter Hintergründe bei gpt-image-2, die strengen Inhaltsfilter und die intransparenten ChatGPT-Limits. Für Einsteiger, Content-Teams und Entwickler, die schnelle, zweckorientierte Bilder mit Text brauchen, ist GPT Image die erste Wahl. Für Kreativprofis, die maximale Bildästhetik herausholen wollen, bleibt Midjourney vorn.

Was wir bemerkt haben

Dezember 2025, OpenAI hat in ChatGPT vollständig auf GPT Image umgestellt. DALL-E-3-Nutzer erzeugen seitdem ohne sichtbare Umstellung Bilder mit dem neuen Modell, die Bildfunktion in ChatGPT heißt intern nun GPT Image statt DALL-E.
Mai 2026, OpenAI hat die DALL-E-2- und DALL-E-3-API abgeschaltet. Wer noch Skripte auf der alten API betrieben hat, musste auf gpt-image umstellen. Der Vorgänger DALL-E 3 ist damit eingestellt.
2026, Die Modellfamilie ist auf gpt-image-2 (Top-Modell), gpt-image-1.5 und gpt-image-1-mini gewachsen. Die Token-Abrechnung trennt Text-Input, Bild-Input und Bild-Output, das gibt feine Kostenkontrolle, ist aber gewöhnungsbedürftiger als der frühere Pro-Bild-Preis von DALL-E 3.
2026, gpt-image-2 hat die Unterstützung für transparente Hintergründe verloren, die das ältere gpt-image-1 noch bot. Für Workflows mit freigestellten Bildern (Logos, Sticker) ist das ein Rückschritt, hier bleibt nur das ältere Modell oder nachträgliches Freistellen.
Juni 2026, OpenAI weist in der Preisübersicht inzwischen regionale Data-Residency-Endpunkte aus (10 Prozent Aufschlag für Modelle ab dem 5. März 2026). Eine native EU-Region speziell für die Standard-Bildgenerierung in ChatGPT ist damit aber weiterhin nicht garantiert. Wer DSGVO-konform arbeiten muss, sollte die regionalen API-Optionen prüfen oder auf Enterprise mit AVV beziehungsweise eine Alternative mit EU-Hosting setzen.

Quellen

OpenAI – Image generation guide. https://developers.openai.com/api/docs/guides/image-generation (abgerufen am 2026-06-13). Modellfamilie gpt-image-2, gpt-image-1.5, gpt-image-1, gpt-image-1-mini; drei Qualitaetsstufen low/medium/high; Aufloesungen bis 3840 px (Vielfache von 16, Seitenverhaeltnis bis 3:1); gpt-image-2 unterstuetzt keine transparenten Hintergruende.
OpenAI – Deprecations. https://developers.openai.com/api/docs/deprecations (abgerufen am 2026-06-13). DALL-E 2 und DALL-E 3 werden am 12. Mai 2026 abgeschaltet, empfohlener Nachfolger ist gpt-image-2, gpt-image-1 oder gpt-image-1-mini.
OpenAI – API-Preise. https://developers.openai.com/api/docs/pricing (abgerufen am 2026-06-13). Tokenbasierte Abrechnung der Bildmodelle, Bild-Output je nach Modell rund 1,25 bis 8 USD je 1 Mio. Tokens; regionale Data-Residency-Endpunkte mit 10 Prozent Aufschlag fuer Modelle ab 5. Maerz 2026.

Diesen Inhalt teilen:

LinkedIn X / Twitter E-Mail WhatsApp

Arthur Atlas

KI-Analyst

So entsteht diese Bewertung

Diese Seite bewerten wir redaktionell, mit kräftiger Unterstützung von Arthur Atlas, unserem KI-Analysten. Er prüft Bewertungen nach und markiert veraltete Angaben, sobald sich der Markt dreht. Unsere Angaben stammen überwiegend aus öffentlich zugänglichen Quellen wie Anbieter-Website, Doku und Preislisten. Preise und Funktionen können sich ändern.

Hinweis: Diese Angaben können veraltet oder fehlerhaft sein. Prüfe im Zweifel immer direkt auf der Website des Anbieters.

Preise geändert, Feature veraltet oder etwas fehlt?

Wir freuen uns über Hinweise und Ergänzungen.

Feedback geben

Du arbeitest bei OpenAI?

Gib uns einen Testzugang, dann schauen wir tiefer rein und ergänzen die Bewertung aus erster Hand.

Testzugang anbieten

Nicht sicher, ob GPT Image zu euch passt?

Wir helfen bei der Tool-Auswahl und begleiten die Einführung in euren Arbeitsalltag, unverbindlich und kostenlos im Erstgespräch.

Erstgespräch anfragen

KI-Tools und Trends

KI-Wochenbriefing: jeden Freitag KI-News, Praxistipps und Tools

Kostenlos abonnieren, jederzeit abmeldbar, kein Spam.

Newsletter abonnieren

Zurück zur Tool-Übersicht