
gpt-image-2 is de tweede generatie van OpenAI's toegewijde beeldstack en de versie waarin het bewerkingsverhaal van bruikbaar naar werkelijk krachtig schuift. Waar gpt-image-1 generatie en bewerking in één endpoint samenbracht, maakt gpt-image-2 de bewerkingsstap goed genoeg om productieworkflows op te bouwen rond iteratieve verfijning in plaats van bij elke nieuwe generatie de dobbelsteen te werpen.
Wat het brengt
Compositorische trouw is de belangrijkste verbetering. Scènes met meerdere onderwerpen met gedefinieerde ruimtelijke verhoudingen, consistente belichting over de onderwerpen heen, en fysisch plausibele interacties landen betrouwbaarder dan bij welke eerdere OpenAI-beeldrelease dan ook. Als je het model instrueert om drie mensen rond een tafel te zetten met een specifiek object ertussen, heb je nu een redelijke kans dat je precies dat terugkrijgt in plaats van een bijna-treffer.
Tekstweergave binnen afbeeldingen is voor het eerst echt goed in de OpenAI-lijn. Tekst over meerdere regels, gemengde lettergroottes en tekst binnen complexe composities zijn bruikbaar voor productiewerk. Dit telt vooral voor marketingcreatie, waar het verschil tussen gpt-image-1.5 en gpt-image-2 op een banneradvertentie met overlaytekst het verschil is tussen het verzenden van de output en het terugsturen ervan naar een ontwerper.
Het patroon van het uniforme endpoint blijft behouden. Je roept nog steeds één API aan voor generatie, bewerking, inpainting en variaties. Het bewerkingsgedrag is strakker in deze versie. Bewerkingen blijven gelokaliseerd tot het gemaskerde gebied zonder structuur uit de omliggende afbeelding te laten doorlekken, wat een terugkerende faalmodus was in eerdere releases.
Architectuurnotities
OpenAI heeft geen architectuurdetails gepubliceerd. Vanuit observeerbaar gedrag verwerkt het model veel hogere promptdichtheid dan gpt-image-1 zonder te degraderen op lange of compositorisch complexe prompts. De outputresolutie heeft hetzelfde native plafond van 2048×2048, met dezelfde presets voor beeldverhouding, hoewel het upscale-pad via de API schonere groot-formaatoutput produceert dan de vorige generatie.
Anatomie van handen en vingers is sterk verbeterd. De faalpercentages zijn laag genoeg dat je voor de meeste workflows niet langer een aparte anatomie-controleslag nodig hebt. Je wilt nog steeds een menselijke reviewer voor premium output, maar het budget voor die review is kleiner.
Stijlconsistentie over een reeks gerelateerde afbeeldingen is daadwerkelijk beter dan bij gpt-image-1. Als je tien variaties op een thema genereert, houdt gpt-image-2 de esthetiek over de set betrouwbaarder vast. Dat telt voor verhalend werk, comicachtige sequenties en elke output waarin visuele continuïteit over meerdere frames deel van de briefing is.
Waar het tekortschiet
Mensen met een specifieke identiteit over een reeks heen blijft een grens. Het model is goed in generieke fotorealistische mensen en in consistente gestileerde personages, maar als je een specifiek benoemd personage identiek over honderd afbeeldingen wilt laten verschijnen, wint een controleerbare diffusiestack met referentiebeeld-conditionering nog steeds. Dit is een categoriegrens van hoe het model is ontworpen, niet een kwaliteitsverschil.
Industriële diagrammen met strikte dimensionele nauwkeurigheid zijn geen sterk punt. Het model produceert iets dat eruitziet als een technisch diagram, maar je kunt er niet op vertrouwen voor precisie op engineeringniveau. CAD-aanverwant werk hoort thuis in CAD-software, niet in een generatief model.
Zeer kleine tekst binnen afbeeldingen, beneden ongeveer twintig pixels per teken bij de outputresolutie, is nog steeds inconsistent. Voor dichte specificatietekst of kleine lettertjes wil je nog steeds echte tekst overlayen in je applicatiecode in plaats van te vertrouwen op de rendering door het model.
Het kiezen
Voor nieuw beeldgeneratiewerk waarbij je het beste uit OpenAI's catalogus wilt en de premiumkosten kunt absorberen, is gpt-image-2 de standaardkeuze. De gedateerde snapshot gpt-image-2-2026-04-21 is de versie om vast te pinnen in gereguleerde workflows of waar reproduceerbaarheid telt.
Voor high-volume werk waarin kosten per afbeelding dominant zijn, is gpt-image-1-mini het budgetniveau en gpt-image-1.5 de middenmoot. De keuze tussen deze en gpt-image-2 is voornamelijk economisch in plaats van kwalitatief, aangezien alle drie bruikbare output produceren voor de meeste workflows.
Cross-vendor is nano-banana-pro-preview de dichtstbijzijnde concurrent op het premiumniveau. Het wint op sommige gestileerde esthetiek en verliest op tekstweergave binnen afbeeldingen. Benchmark op je werkelijke promptdistributie voordat je een keuze maakt, want de relatieve rangschikking tussen gpt-image-2 en Nano Banana Pro keert om afhankelijk van wat voor werk je het vaakst aflevert.
EU-dataresidentie wordt standaard nog steeds niet voldaan. Het patroon van regionale gateways is de workaround voor gereguleerde Europese implementaties, en er is nog geen signaal dat OpenAI op korte termijn EU-gehoste image-endpoints zal aanbieden.
Laatste technische review: 2026-05-22 — Tokonomix.ai
