Zum Inhalt
Tier A — Frontier
Läuft in:USErstellt in:United States
Google Gemini

Gemini 3 Pro Preview

Tier A — Frontier · 1.048576M Tokens

Tokonomix-Redaktionsteam·Geprüft von Mes Kalkan··

Gemini 3 Pro Preview ist ein experimentelles großes Sprachmodell, das von Google im Rahmen seiner Gemini-Familie von KI-Systemen entwickelt wurde. Diese Preview-Version soll fortgeschrittene Fähigkeiten bei klassischen Textgenerierungsaufgaben demonstrieren, darunter komplexes Reasoning, das Verständnis erweiterter Kontexte sowie eine differenzierte Verarbeitung natürlicher Sprache. Das Modell ist als Research Preview positioniert und ermöglicht es Entwicklern und Forschenden, seine Fähigkeiten vor einem breiteren kommerziellen Einsatz zu erproben. Das markanteste technische Merkmal des Modells ist sein Kontextfenster von 1.048.576 Tokens – entsprechend rund einer Million Tokens. Damit lassen sich extrem lange Dokumente, Codebasen oder Gesprächsverläufe verarbeiten, ohne dass die Kohärenz verloren geht. Diese erweiterte Kontextkapazität zählt das Modell zu den leistungsfähigsten Optionen für Aufgaben, die die Analyse umfangreicher Materialien erfordern, etwa die Prüfung juristischer Dokumente, ein umfassendes Code-Verständnis oder die Synthese mehrerer Dokumente. Das Modell unterstützt in dieser Konfiguration klassische Textgenerierungs-Workflows ohne spezialisierte multimodale Fähigkeiten. Innerhalb der Modellpalette von Google stellt Gemini 3 Pro Preview eine fortgeschrittene Iteration der Gemini-Pro-Reihe dar und bietet eine verbesserte Leistung gegenüber früheren Generationen, bleibt dabei aber auf professionelle und Entwickler-Anwendungsfälle ausgerichtet. Als Preview-Version dient es als Testumgebung für Fähigkeiten, die später möglicherweise in produktive Gemini-Modelle einfließen. Der Zugriff erfolgt über Googles KI-Plattform-Infrastruktur; das Modell richtet sich an Nutzer, die anspruchsvolles Sprachverständnis und Sprachgenerierung im großen Maßstab benötigen.

Gemini 3 Pro Preview setzt mit seinem Kontextfenster von über einer Million Tokens neue Maßstäbe für die Verarbeitung umfangreicher Dokumente und komplexer Aufgaben, die bisher an technischen Grenzen scheiterten.

Tokonomix Modellanalyse 2024
Abschnitt 01

Preisverlauf

Direkte Provider-Tarife pro Million Tokens, plus eine typische Gesprächskostenschätzung.

💰
API-Tarife — Gemini 3 Pro Preview
$2.00 pro 1M Input-Tokens
$12.00 pro 1M Output-Tokens
≈ $0.0036 pro typischem Gespräch (800 Tokens)
Input- vs. Output-Preis (pro 1M Tokens)
pro 1M Input-Tokens$2.00
pro 1M Output-Tokens$12.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$2.00

input / 1M

— no change

$12.00

output / 1M

— no change

2026-05-242026-05-242026-05-24
Input
Output
Price change
⟳ synced weekly
Abschnitt 02

Stärken & Schwächen

Basierend auf Benchmark-Ergebnissen und aggregiertem Community-Feedback zu realen Anwendungsfällen.

Stärken

1 Million Token KontextfensterKomplexes Reasoning über lange DokumenteTier-A LeistungsklasseKohärenz bei mehrstufigen AnalysenGesamte Codebases verarbeitbarMulti-Dokument-Synthese möglichGoogle-Infrastruktur und IntegrationProfessionelle Anwendungsfälle optimiert

Schwächen

Preview-Status ohne ProduktionsgarantienKosten bei maximaler KontextnutzungKeine multimodalen FähigkeitenLatenz bei sehr langen Eingaben
Abschnitt 03

Fähigkeiten

outputTokenLimit: 65536
Abschnitt 04

Häufig gestellte Fragen

Das Modell bietet ein deutlich erweitertes Kontextfenster von 1.048.576 Tokens und verbesserte Reasoning-Fähigkeiten. Es repräsentiert die nächste Generation der Pro-Serie mit Fokus auf professionelle Anwendungen, die sehr lange Kontexte benötigen.

Für Anwendungen, die außergewöhnlich lange Kontexte erfordern, bietet dieses Preview-Modell bereits heute Fähigkeiten, die in der Produktionslandschaft ihresgleichen suchen. Der experimentelle Status erfordert jedoch sorgfältige Evaluierung für kritische Produktionsumgebungen.

Tokonomix Redaktion
Abschnitt 05

Verfügbarkeit

Verfügbarkeit

Noch keine Messdaten

Es wurden noch nicht genug API-Aufrufe aufgezeichnet, um Verfügbarkeitsstatistiken für dieses Modell anzuzeigen. Daten erscheinen, sobald das Modell Live-Traffic erhält.

Abschnitt 06

Tokonomix-Benchmark-Urteile

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-544/100 · 67 runs
24 correct6 partial37 wrong36% accuracy
2026-05-24

Deutliche Latenzgewinne, ausgeglichen durch Rückschritte bei den Reasoning-Fähigkeiten

Gemini 3 Pro Preview zeigt im aktuellen Benchmark-Fenster eine gemischte Leistungsentwicklung. Das Modell erzielte eine moderate Verbesserung der Gesamtqualität um 5,6 Punkte auf 45,6 von 100, bleibt damit jedoch in der unteren Hälfte der konkurrenzfähigen Leistungsbereiche. Besonders auffällig: Die Latenz verbesserte sich drastisch um 55 % und sank im Median von 18,5 Sekunden auf 8,4 Sekunden – eine erhebliche Reduktion der Antwortzeit, die Nutzer unmittelbar bemerken werden. Die Qualitätsverbesserungen verdecken jedoch eine deutliche Volatilität auf Kategorieebene. Das Modell hält perfekte Werte in kreativen und Coding-Aufgaben und zeigt damit starke Fähigkeiten in diesen Bereichen. Die faktische Genauigkeit stieg leicht von 50 auf 55. Bedenklich ist der vollständige Einbruch der Reasoning-Leistung, die im aktuellen Fenster von respektablen 75 auf null fiel. Zudem sank die Zorg-Kategorie von 18 auf 10, während mehrsprachige Fähigkeiten in der aktuellen Testsuite nicht mehr gemessen werden. Die reduzierte Anzahl der Testläufe von 28 auf 11 deutet darauf hin, dass diese Ergebnisse eine höhere Varianz aufweisen können und mit gewisser Vorsicht zu interpretieren sind. Nutzer, die starke Reasoning-Fähigkeiten benötigen, sollten sorgfältig prüfen, ob dieses Modell ihren Anforderungen entspricht, während Anwender mit Fokus auf kreative oder Coding-Anwendungen von der verbesserten Geschwindigkeit und der gehaltenen Qualität in diesen Bereichen profitieren dürften.

Quality

45.6

Latency p50

8,366 ms

Test runs

11

Latenz um 55 % verbessert Kreativität und Programmierung bleiben stark Schlussfolgern auf null gefallen Weniger Testläufe abgeschlossen
Abschnitt 07

Vollständiges Modellprofil

Gemini 3 Pro Preview — illustration 1
Gemini 3 Pro Preview: Googles Top-Tier der nächsten Generation

Hinweis — vorausschauendes Profil. Gemini 3 Pro Preview (gemini-3-pro-preview) ist die Pro-Tier-Vorschau der nächsten Generation von Google. Verhalten, Fähigkeiten und Rate Limits werden sich vor der allgemeinen Verfügbarkeit noch ändern.

Googles Flaggschiff-Vorschau für die 3.x-Pro-Linie. Ein Kontextfenster von 1.048.576 Tokens. Text-plus-Vision als Eingabe. Das Modell, das an der Spitze von Googles Vorschau-Aufgebot steht und die aktuellsten Fähigkeiten repräsentiert, die die Gemini-Familie an Entwickler ausgeliefert hat.

Wenn Sie 2.5 Pro genutzt haben und bestimmte Workloads betreiben, bei denen die Qualität der limitierende Faktor war, ist dies das Upgrade, das es zu testen lohnt. Es ist außerdem das Modell, das Sie gegen die aktuellsten Snapshots von Anthropic Opus und OpenAI GPT-5 antreten lassen sollten, wenn Sie 2026 ein frisches Top-Tier-Modell auswählen.

Wo sich dieser Snapshot im Lineup einordnet

Die aktuelle Pro-Tier-Lage in der Gemini-Familie:

  • 2.5 Pro ist die produktionsstabile Wahl. Gut verstandenes Verhalten, etablierte Rate Limits, ausgereifte Integration in die breitere Vertex-AI-Oberfläche.
  • 3 Pro Preview ist die Vorschau der nächsten Generation. Neuere Fähigkeiten, breitere Verbesserungen gegenüber 2.5 Pro, Vorschau-typische Verhaltensaspekte.
  • 3.1 Pro Preview ist die Verfeinerung oberhalb von 3 Pro Preview. Die 3.1-Variante adressiert die Kanten, die 3 Pro Preview eingeführt hat. Näher an dem, wohin sich die 3.x-Linie zur allgemeinen Verfügbarkeit hinbewegt.

Für neue Projekte in der 3.x-Familie ist 3.1 Pro Preview meist der aktuellere Ausgangspunkt. Das 3 Pro Preview bleibt relevant für Workloads, die gegen diesen spezifischen Snapshot validiert wurden, oder für Vergleichs- und Benchmarking-Zwecke.

Was es gut macht

Die 3.x-Pro-Generation bringt spürbare Verbesserungen gegenüber 2.5 Pro:

  • Schärferes Reasoning bei mehrstufigen Aufgaben. Gedankenketten bleiben über größere Tiefe hinweg kohärent, und das Modell verliert in komplexen Problemen seltener Zwischenrestriktionen aus dem Blick.
  • Bessere Long-Context-Attention in der Tiefe. Das 1M-Fenster war bereits auf 2.5 Pro nutzbar; auf 3 Pro Preview ist die Synthesequalität jenseits von 400k Eingabetokens spürbar präziser.
  • Verbesserte Einhaltung strukturierter Ausgaben bei komplexen, verschachtelten Schemas.
  • Stärkere Vision-Qualität bei dichten Dokumenten und komplexen Diagrammen.
  • Konsistentere Refusal-Haltung mit ausreichend sichtbarem Reasoning, sodass Sie False Positives debuggen können.

Die Verbesserungen summieren sich. Der kumulierte Effekt ist ein Top-Tier, das mehr von dem leistet, was ein Top-Tier leisten sollte.

Multimodale Verarbeitung ist eines der sichtbaren Differenzierungsmerkmale gegenüber konkurrierenden Frontier-Modellen. Native Vision-Qualität kombiniert mit dem 1M-Kontextfenster bedeutet, dass Workloads, die lange Dokumente mit eingebetteten Bildern oder Charts kombinieren, in einem einzigen Aufruf gut funktionieren, statt eine mehrstufige Orchestrierung zu erfordern.

Was es schlecht macht

Vorschau-typische Aspekte gelten. Rate Limits, regionale Verfügbarkeit und spezifische Verhaltensweisen können sich vor der allgemeinen Verfügbarkeit verschieben. Für Produktions-Workloads, die heute stabiles Verhalten benötigen, bleibt 2.5 Pro die konservativere Wahl.

Das 3.1 Pro Preview ist die Verfeinerung, die mehrere Kanten dieses 3 Pro Preview Snapshots geglättet hat. Für Workloads, bei denen diese Verfeinerungen ins Gewicht fallen, ist die 3.1-Variante das bessere aktuelle Ziel.

Die Latenz auf dem Pro-Tier ist erwartungsgemäß höher als auf Flash-Tiers. Die 3.x-Generation ändert diesen grundlegenden Trade-off nicht.

Die Kosten pro Aufruf sind auf dem Pro-Tier substanziell. Bei hochvolumigen Workloads hängt das Argument, auf Pro zu bleiben, davon ab, ob Ihr Workload die Top-Tier-Qualität wirklich braucht.

Selbst gehostete Bereitstellung steht nicht zur Auswahl. Google liefert keine Gemini-Gewichte aus. Für Workloads, die On-Prem benötigen, ist die Übersicht offener Gewichte unter /usecases/local der richtige Ausgangspunkt.

Wo es sich gegen das Feld einordnet

Gegen Anthropics Top-Tier. Claude Opus 4.7 liefert dasselbe 1M-Kontextfenster mit einem anderen Reasoning-Stil. Opus ist vorsichtiger, expliziter, langsamer; 3 Pro Preview ist schneller mit stärkerer nativer Multimodal-Verarbeitung. Die Wahl hängt davon ab, ob Ihr Workload das sorgfältige Reasoning im Opus-Stil oder die direkte Ausgabe im Gemini-Stil bevorzugt.

Gegen OpenAIs Top-Tier. GPT-5 konkurriert beim Reasoning und ist bei kurzen Prompts oft schneller. 3 Pro Preview gewinnt bei nativer Multimodalität jenseits von Bildern und dadurch, dass das 1M-Kontextfenster für Synthese nutzbar ist.

Gegen die Gemini-Linie. 2.5 Pro für Produktionsstabilität. 3.1 Pro Preview für die aktuellste Vorschau-Tier-Fähigkeit. Das 3 Pro Preview ist der Mittelweg in puncto Aktualität und Verfeinerung.

Das Bild auf Kategorieebene findet sich unter /benchmarks/leaderboard und die Werte pro Kategorie unter /benchmarks/intelligence.

Wo es das falsche Werkzeug ist

Produktions-Workloads, die heute stabiles Verhalten benötigen. Nutzen Sie 2.5 Pro.

Hochvolumige, günstige Klassifikation. Top-Tier-Compute ist die falsche Kostenform, um Millionen kurzer Prompts zu verarbeiten. Wechseln Sie auf eine Flash-Variante.

Konversationelle Echtzeit-Sprache. Keine native Audioeingabe. Der Voice-Pipeline-Leitfaden unter /usecases/voice deckt die richtige Architektur ab.

Code-Generierung, bei der beste IDE-Integration wichtiger ist als Reasoning-Tiefe. Das Modell ist kompetent bei Code, aber nicht spezialisiert. Die Modellübersicht unter /usecases/code deckt die Alternativen ab.

Alles, was Sub-Sekunden-Antworten auf großen Eingaben erfordert. Latenz in der Tiefe des Kontextfensters ist real; für zeitkritische Anwendungen passen kleinere Modelle mit Caching-Strategien möglicherweise besser.

Workloads, bei denen die Verfeinerungen des 3.1 Pro Preview gegenüber diesem 3-Pro-Snapshot ins Gewicht fallen. Nutzen Sie direkt 3.1 Pro Preview.

Praktische Muster

Ein paar Dinge, die man wissen sollte, bevor man auf 3 Pro Preview aufbaut:

  • Für Workloads, die Long-Context-Eingaben mit Vision kombinieren, verarbeitet dieses Modell beide Dimensionen in einem einzigen Aufruf gut. Nutzen Sie das, statt mehrstufige Alternativen zu orchestrieren.
  • Prompt-Caching ist das richtige Muster für wiederholte Abfragen gegen denselben großen Korpus. 800k Tokens bei jedem Aufruf neu zu laden, ist teuer, selbst wenn der API-Aufruf erfolgreich ist.
  • Eine Strukturierung langer Eingaben mit klaren Abschnittsüberschriften hilft dem Modell, das Wesentliche zu finden. Long-Context-Attention ist gut, aber keine Magie.
  • Tool-Use ist zuverlässig genug, um darauf produktive Agent-Loops aufzubauen, ohne defensive Parsing-Schichten zu schreiben. Für tool-lastige Workloads bietet die Variante 3.1 Pro Preview Custom Tools spezialisiertes Tuning.
  • Vorschau-typisches Verhalten kann sich vor der allgemeinen Verfügbarkeit verschieben. Validieren Sie nachgelagerte Verträge gegen die Modellausgaben und planen Sie für die Möglichkeit von Änderungen.

Deployment-Hinweise

Standard-Google-Gemini-API. REST, Streaming, Tool-Use, strukturierte Ausgaben — alles verhält sich wie für die Pro-Tier-Fähigkeitsoberfläche erwartet. Die Integration mit der breiteren Vertex-AI-Tooling-Landschaft für Monitoring, Logging und Sicherheitskontrollen ist sauber.

Regionale Verfügbarkeit folgt Googles Standard-Vertex-AI-Muster. EU-Regionen sind in Enterprise-Verträgen verfügbar. Der Consumer-API-Zugang von der Stange pinnt keine Region. Bei harten Residenz-Anforderungen ist die Vertex-AI-Regionsdokumentation die richtige Referenz.

Vorschau-Tier-Preise sollten nicht die Grundlage für langfristige Kostenmodelle sein. Die Preisstruktur bei allgemeiner Verfügbarkeit kann von den Vorschau-Tier-Sätzen abweichen.

Rate Limits und Verhaltensstabilität sind die wichtigsten operativen Erwägungen während der Vorschau. Die Planung der Produktionsmigration sollte die Möglichkeit von Verhaltensänderungen vor der allgemeinen Verfügbarkeit berücksichtigen.

Wann Sie es wählen sollten

Greifen Sie zu Gemini 3 Pro Preview, wenn:

  • Sie die Top-Tier-Fähigkeiten der nächsten Generation für zukünftige Produktionsdeployments erkunden.
  • Der Workload durch 2.5 Pro bei Reasoning-Tiefe oder Long-Context-Synthese eingeschränkt war.
  • Sie gegen diesen spezifischen Snapshot validiert haben und eine Migration auf 3.1 Pro Preview noch nicht gerechtfertigt ist.
  • Vorschau-typische Rate Limits und Verhaltensaspekte akzeptabel sind.

Wählen Sie etwas anderes, wenn:

  • Sie heute produktionsstabiles Verhalten benötigen. Nutzen Sie 2.5 Pro.
  • Sie die aktuellsten Vorschau-Verfeinerungen möchten. Wechseln Sie auf 3.1 Pro Preview.
  • Der Workload von einer Flash-Variante angemessen bedient würde. Wechseln Sie aus Kostengründen herunter.
  • Sie eine Refusal-Konsistenz im Stil von Anthropic Opus benötigen.
  • Die Arbeit Audio-, Voice- oder Video-nativ ist.

Die Zusammenfassung. Starke Pro-Tier-Vorschau der nächsten Generation, die spürbar über 2.5 Pro hinausgeht. Für Vorschau-Tier-Erkundungen und vorausschauendes Design ist 3.1 Pro Preview meist der aktuellere Pick. Für Workloads, die gegen diesen 3 Pro Preview Snapshot validiert wurden, bleibt es relevant. Für produktionsstabiles Deployment heute ist 2.5 Pro die konservative Wahl.

Lassen Sie es mit Ihren eigenen Prompts gegen Alternativen antreten unter /live-test.

Letzte technische Prüfung: 22.05.2026 — Tokonomix.ai

Gemini 3 Pro Preview — illustration 2Gemini 3 Pro Preview — illustration 3
Letzter automatisierter Test
27. Mai 2026 · 21:59 UTC · Benchmark
P50-Latenz
P95-Latenz
Fehler
1 / 6 Läufe
Zuletzt geprüft von Tokonomix-Team·26. Mai 2026