
Let op — legacy snapshot. Claude Opus 4 (
claude-opus-4-20250514) is de mei 2025-release die de 4.x-generatie opende. Teams die nu een Opus kiezen, vergelijken beter met Opus 4.5, 4.6 en 4.7. Deze pagina bestaat voor migratieplanning en historische referentie.
Claude Opus 4 was het eerste model in de Anthropic 4.x-lijn. Tweehonderdduizend tokens context. Tekst- én vision-input. De redeneerwijze die de familie definieerde: voorzichtig, expliciet, traag in verzinnen bij ambigue prompts, met een voorkeur voor het uitleggen van stappen vóór een antwoord.
Bij lancering stond het aan de top van de Anthropic-stack en hield het stand naast de GPT-4-generatie waartegen het gebouwd was. Een jaar later ziet het plaatje er anders uit.
Waarom het nog op deze site staat
De meeste teams zijn doorgemoveerd, maar een paar situaties houden oudere Opus-snapshots actief in gebruik:
- Gepinde evaluatiesuites die over lange benchmarkcycli stabiel modelgedrag nodig hebben.
- Compliance-pipelines die geaudit zijn tegen Opus 4-output en nog niet heraudit zijn voor een nieuwere snapshot.
- Workflows die load verdelen over meerdere Opus-versies om per-tier rate limits te managen.
- Onderzoek dat de 4.x-evolutie bestudeert en de oorspronkelijke 4.0 als baseline nodig heeft.
Zit je niet in een van die situaties, beschouw deze pagina dan als achtergrondinformatie en kies een huidig model.
Wat het goed doet
Opus 4 bracht het constitutional-AI-erfgoed schoon vooruit. Weigeringen zijn coherent en uitlegbaar. Structured output is betrouwbaar: JSON-schema's worden gerespecteerd, tool-use calls geven schone payloads terug. Meertalig administratief proza wordt verzorgd behandeld in het Duits, Frans, Nederlands en de Scandinavische talen. Die Europese taalsterkte loopt als een stille rode draad door de hele Opus-familie.
Vision-input werkt voor de standaard documentleestaken. Dashboard-screenshots, gescande formulieren, PDF's als paginaplaatjes. Het model redeneert over wat het ziet, transcribeert niet alleen. Dat onderscheid was bij lancering minder gangbaar dan nu.
Wat het slecht doet
Long-context retention. Het 200k-window is reëel, maar de aandachtskwaliteit verdwijnt in het midden van lange buffers. Needle-retrieval op diepte was bij lancering matig en is overtroffen door elke Opus-snapshot die Anthropic daarna uitbracht. Als je workload afhankelijk is van feiten die vooraan in een 150k-token input begraven zijn, zoek je elders.
Snelheid. Opus 4 was de traagste tier bij lancering en de kloof is niet in zijn voordeel gesloten. Time-to-first-token loopt snel op bij langere prompts. Het actuele latencybeeld staat op /benchmarks/speed.
Code genereren onder snel bewegende frameworks. Het model schrijft uitvoerige, defensieve code waar huidige frontiers idiomatisch schrijven. Voor IDE-geschikt coderingswerk behandelt de model-survey op /usecases/code de alternatieven.
Hoe het zich verhoudt tot het veld van nu
Vergeleken met nieuwere Anthropic-flagships — Opus 4.5, 4.6, 4.7 — ligt versie 4.0 achter in elke categorie op /benchmarks/intelligence. Opus 4.7 heeft met name een miljoen-token context window en aanzienlijk betere attention op diepte.
Vergeleken met de rest van de frontier medio 2026: GPT-5 en Gemini 3 Pro Preview verslaan Opus 4.0 in de meeste gepubliceerde benchmarkcategorieën. Die kloof was een muntgooi toen 4.0 lanceerde. De frontier heeft bewogen.
Als je in 2026 een model van scratch kiest, is er geen kwaliteitsreden om met Opus 4.0 te beginnen. Het volledige beeld per categorie staat op /benchmarks/leaderboard.
Migratiepaden
De directe upgrades:
- Zelfde context window, vergelijkbaar gedrag: Opus 4.5. Productieteams melden drop-in compatibiliteit voor de meeste workloads na een korte shadow-traffic-run.
- Groter context window: Opus 4.7 heeft een miljoen tokens en de sterkste long-context attention in de Claude-lijn.
- Kostgevoelig: Sonnet 4.5 of 4.6 dekt veel van hetzelfde terrein voor een andere prijs. De moeite waard om op je eigen evaluatieset te testen.
De eerlijke regel: frontier-kloven gemeten op publieke benchmarks komen zelden overeen met de kloven die je op jouw eigen prompts ziet. Draai de kandidaat eerst door je eigen evaluatieset.
Deployment
Standaard Anthropic API. REST. Streaming. System prompts gedragen zich zoals verwacht. Tool-use is betrouwbaar genoeg om er agents bovenop te bouwen zonder defensieve parsing.
EU-dataresidency is het terugkerende struikelblok. Anthropic's inference draait op AWS en Google Cloud; de publieke API heeft geen region-selectieparameter voor Opus 4.0 of enig ander Claude-model. Standaard kun je geen EU-only inference afdwingen. Enterprise-contracten kunnen residency-clausules bedingen. Teams met harde residency-eisen kijken naar de open-weight survey op /usecases/local.
Logs worden dertig dagen bewaard voor misbruikmonitoring. Input wordt niet gebruikt voor training tenzij opt-in. Zero-retention is een contractonderhandeling, geen instellingenschakelaar.
Wanneer het antwoord is om op 4.0 te blijven
Auditoverhead is de meest voorkomende reden. Een gereguleerde pipeline met gedocumenteerd modelgedrag is geen configuratiewijziging om te migreren. Heraudit, hervalidatie, mogelijk hercertificering — de kosten van dat werk moeten een lat halen.
Gepinde-snapshot-onderzoek is de andere veelvoorkomende situatie. Een studie die de evolutie van de 4.x-lijn vergelijkt heeft 4.0 als referentiepunt nodig. Anthropic houdt gedateerde snapshots beschikbaar precies daarvoor.
Bij nieuwe builds zijn beide situaties niet van toepassing, en een huidige Opus-revisie is het juiste startpunt.
Wanneer je het kiest
Kies Claude Opus 4 als:
- Je een bestaande geaudite integratie erop hebt.
- Je een gepinde snapshot nodig hebt voor vergelijking of onderzoek.
- Een migratie naar een huidige Opus-revisie nog niet gerechtvaardigd is.
Kies iets anders als:
- Je in 2026 een verse keuze maakt.
- De workload afhankelijk is van long-context attention op diepte.
- Latency, kosten of sterke codegeneratie zwaarder wegen dan de redeneerwijze van Opus 4.
- Je iets buiten tekst en vision nodig hebt — audio, voice, video, embeddings.
Test Opus 4 naast huidige frontiers op /live-test. De verschillen zijn het duidelijkst wanneer je dezelfde prompt naast elkaar oplost.
Laatste technische beoordeling: 2026-05-22 — Tokonomix.ai

