Zum Inhalt
Läuft in:USErstellt in:United States
Google Gemini

Deep Research Pro Preview (Dec-12-2025)

131K Tokens

Tokonomix-Redaktionsteam·Geprüft von Mes Kalkan··

Deep Research Pro Preview ist ein experimentelles Modell aus Googles Gemini-Familie, das im Dezember 2025 veröffentlicht wurde. Es stellt eine spezialisierte Variante dar, die gezielt für komplexe Rechercheaufgaben entwickelt wurde, die erweiterte Denkprozesse und umfassende Informationssynthese erfordern. Das Modell baut auf Googles grundlegender Sprachmodellarchitektur auf, mit Modifikationen, die für tiefgehende Analyseworkflows optimiert wurden – nicht für allgemeine Chat-Zwecke oder schnelle Antworten. Dieses Modell verfügt über ein Kontextfenster von 131.000 Token, was die Verarbeitung erheblicher Informationsmengen in einer einzelnen Sitzung ermöglicht. Anders als standardmäßige Konversationsmodelle ist Deep Research Pro Preview darauf ausgelegt, mehrstufige Rechercheprozesse durchzuführen, einschließlich Zerlegung von Anfragen, systematischer Informationsbeschaffung, Quellenbewertung und Synthese der Erkenntnisse in strukturierte Berichte. Es zeichnet sich bei Aufgaben aus, die gründliche Untersuchung technischer Themen, vergleichende Analysen über mehrere Domänen hinweg und Erstellung detaillierter Dokumentation mit ordnungsgemäßer Quellenangabe erfordern. Innerhalb von Googles Gemini-Produktpalette nimmt Deep Research Pro Preview eine spezialisierte Nische ein, die sich von den allgemeinen Gemini-Modellen und den codeorientierten Varianten unterscheidet. Während standardmäßige Gemini-Modelle konversationelle Flüssigkeit und breite Aufgabenabdeckung priorisieren, opfert dieses forschungsorientierte Modell Antwortgeschwindigkeit zugunsten von Tiefe und Gründlichkeit. Die „Preview"-Bezeichnung weist auf seinen experimentellen Status hin, wobei Fähigkeiten und Verhaltensweisen basierend auf Nutzerfeedback verfeinert werden. Es richtet sich an Nutzer, die rigorose analytische Fähigkeiten benötigen statt schneller Interaktion, wie etwa Forscher, Analysten und Fachleute, die tiefgehende technische Evaluierungen durchführen.

Deep Research Pro Preview definiert den Ansatz für KI-gestützte Recherche neu – nicht als schneller Chatbot, sondern als methodischer Analytiker, der komplexe Fragestellungen in strukturierte, nachvollziehbare Berichte verwandelt.

Tokonomix Modellanalyse, Dezember 2025
Abschnitt 01

Preisverlauf

Direkte Provider-Tarife pro Million Tokens, plus eine typische Gesprächskostenschätzung.

💰
API-Tarife — Deep Research Pro Preview (Dec-12-2025)
$2.00 pro 1M Input-Tokens
$12.00 pro 1M Output-Tokens
≈ $0.0036 pro typischem Gespräch (800 Tokens)
Input- vs. Output-Preis (pro 1M Tokens)
pro 1M Input-Tokens$2.00
pro 1M Output-Tokens$12.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$2.00

input / 1M

— stable

$12.00

output / 1M

— stable

2026-05-242026-06-072026-06-14
Input
Output
Price change
⟳ synced weekly
Abschnitt 02

Stärken & Schwächen

Basierend auf Benchmark-Ergebnissen und aggregiertem Community-Feedback zu realen Anwendungsfällen.

Stärken

131.000 Token für umfangreiche DokumentenanalyseSpezialisiert auf mehrstufige RechercheprozesseSystematische Quellenauswertung und -syntheseStrukturierte Berichtserstellung mit NachweisenOptimiert für technische TiefenanalysenDomänenübergreifende vergleichende UntersuchungenMethodische Informationsaggregation über IterationenGoogle Gemini Infrastruktur und Zuverlässigkeit

Schwächen

Langsamer als KonversationsmodellePreview-Status – Verhalten kann sich ändernTier und Kosten nicht öffentlich dokumentiertEingeschränkte Capabilities-Informationen verfügbar
Abschnitt 03

Fähigkeiten

source: litellmvisionjson modejson schemaprompt cachingoutputTokenLimit: 65536max output tokens: 32768
Abschnitt 04

Häufig gestellte Fragen

Wenn Sie strukturierte, quellenbasierte Analysen über mehrere Schritte benötigen – etwa für Literaturrecherche, Technologievergleiche oder Due-Diligence-Berichte. Für schnelle Frage-Antwort-Interaktionen sind Standard-Gemini-Modelle effizienter.

Für Organisationen, die fundierte Analysen über schnelle Antworten stellen, bietet dieses Modell eine spezialisierte Alternative zu generalistischen LLMs – mit der Einschränkung, dass der experimentelle Status sorgfältige Evaluierung vor dem Produktiveinsatz erfordert.

Tokonomix Editorial Board
Abschnitt 05

Verfügbarkeit

Verfügbarkeit

Noch keine Messdaten

Es wurden noch nicht genug API-Aufrufe aufgezeichnet, um Verfügbarkeitsstatistiken für dieses Modell anzuzeigen. Daten erscheinen, sobald das Modell Live-Traffic erhält.

Abschnitt 06

Tokonomix-Benchmark-Urteile

2026-06-14

Benchmark window closed with no performance data available

The current benchmark window for Deep Research Pro Preview shows no measurable performance data across any evaluated categories. Without active benchmark results, it is impossible to assess the model's capabilities in areas such as reasoning, coding, mathematics, or multimodal tasks. The previous window indicated the addition of vision, JSON mode, JSON schema, and prompt caching capabilities, suggesting the model had functional multimodal features at that time. However, the absence of current data prevents verification of whether these capabilities remain operational or have been improved. Users should be aware that this lack of benchmark results may indicate the model is undergoing significant changes, has been temporarily disabled for testing, or is not currently available for evaluation. The previous verdict noted stable core performance alongside new multimodal capabilities, but without current measurements, no meaningful comparison can be drawn. Until new benchmark data becomes available, users cannot reliably assess this model's suitability for production workloads or compare its performance against alternatives in the market.

Quality

Latency p50

Test runs

0

No benchmark data available Cannot verify capability status
Abschnitt 07

Vollständiges Modellprofil

Deep Research Pro Preview (Dec-12-2025) — illustration 1
Deep Research Pro Preview (Dez. 2025): die ursprüngliche Pro-Stufe von Googles Recherche-Stack

Hinweis — zukunftsgerichtetes Profil. Deep Research Pro Preview (deep-research-pro-preview-12-2025) ist der Preview-Snapshot vom Dezember 2025. Verhalten, Fähigkeiten und Ratenlimits werden sich vor der allgemeinen Verfügbarkeit ändern und haben sich seit diesem Snapshot wahrscheinlich bereits verändert.

Deep Research Pro Preview ist der Dezember-2025-Snapshot, der die Pro-Stufe der Deep-Research-Familie einführte. Ein Kontextfenster von 131.072 Token. Langformige Synthese mit Zitaten. Ein agentischer Loop, der Quellen zieht, sie liest und einen strukturierten Bericht produziert.

Er liegt zwischen der Basis-Deep-Research-Preview-Stufe und der Max-Stufe auf der Tiefen-versus-Geschwindigkeits-Kurve. Gründlicher als die Basis, schneller als Max. Für eine Zeit in Anfang 2026 war er die einzige Pro-Tier-Option in dieser Familie.

Wo dieser Snapshot heute noch passt

Einige Situationen, in denen dieser Dezember-2025-Pro-Snapshot der richtige ist und nicht die neueren April-2026-Basis- oder Max-Previews:

  • Verankerte Evaluierungen und Regressions-Suites, bei denen stabiles Agent-Loop-Verhalten über Monate wichtiger ist als neuere Fähigkeiten.
  • Workflows, die gegen die Ausgabeverteilung dieses spezifischen Snapshots auditiert wurden und noch nicht neu validiert sind.
  • Fortgesetzter Zugang, wo die neueren April-2026-Previews ratenlimitiert oder in einer Region vorübergehend nicht verfügbar sind.

Wenn keines davon zutrifft, ist die April-2026-Basis- oder Max-Preview in der Regel der bessere aktuelle Ausgangspunkt. Die Basis-Preview ist schneller; die Max-Preview geht tiefer.

Was es tatsächlich tut

Die Form der Arbeit ist dieselbe wie beim Rest der Deep-Research-Familie. Eine Frage einreichen, die von aktuellen Quellen und expliziten Zitaten profitiert. Der Agent führt mehrere gezielte Suchen durch, liest die relevantesten Ergebnisse, prüft sie gegeneinander und produziert eine strukturierte Antwort:

  • Eine Zusammenfassung am Anfang.
  • Aufgliederung in Teilfragen.
  • Zitate für jede sachliche Aussage mit zitiertem Quellenmaterial.
  • Eine Liste der verwendeten Quellen.

Läufe dauern typischerweise 30 Sekunden bis ein paar Minuten je nach Fragenkomplexität. Die Ausgabe ist länger und gründlicher als die Basis-Preview, kürzer und schneller als Max.

Wo es wirklich nützlich ist

Dieselbe Anwendungsfallform wie beim Rest der Familie:

  • Quellenübergreifende Synthese zu Themen, bei denen die Belege über mehrere Primärquellen verstreut sind.
  • Langformige Berichte, die gegenüber externen Gutachtern vertretbar sein müssen.
  • Regulatorische oder politische Fragen, bei denen die oberflächliche Zusammenfassung von dem abweicht, was die zugrundeliegenden Dokumente sagen.
  • Investigative Arbeiten, bei denen die richtige Antwort das Lesen mehrerer Quellen erfordert, statt eine sekundäre Zusammenfassung zu liefern.

Das Muster: Aufgaben, bei denen ein Mensch eine halbe bis eine ganze Stunde sorgfältig lesen würde, passen gut zu dieser Pro-Stufe. Kürzere Aufgaben passen zur Basis-Preview. Längere Aufgaben zu Max.

Vergleich mit den neueren Previews

Gegenüber Deep Research Preview (April 2026), der Basis-Stufe: Die Basis-Preview ist schneller und produziert kürzere Ausgaben. Pro Preview geht tiefer. Wenn der Workload bereits an der Grenze dessen war, was die Basis-Stufe leisten konnte, ist Pro das natürliche Upgrade-Ziel.

Gegenüber Deep Research Max Preview (April 2026): Max läuft länger, liest mehr Quellen und produziert gründlichere Ausgaben auf Kosten von mehr Latenz. Wenn der Workload Tiefe erfordert, die Pro knapp verfehlt, ist Max die Wahl.

Für Workloads, bei denen der Dezember-2025-Pro-Snapshot validiert ist und funktioniert, gibt es selten einen starken Qualitätsgrund für einen Wechsel. Die neueren Snapshots verfeinern den Agent-Loop und das Zitationsverhalten, aber die Kernform der Ausgabe ist ähnlich.

Vergleich außerhalb der Familie

Die direktesten Vergleiche sind suchangereicherte Modi bei OpenAIs GPT-5-Serie und Anthropics Claude-Familie mit aktiviertem Websuche-Tooling. Die Ausgabeform ist ähnlich — Antwort mit Zitaten — aber der Agent-Stil unterscheidet sich.

Googles Deep Research Pro neigt dazu, vielfältigere Quellen zu ziehen als eine Einzelsuch-Alternative. Die Ausgabe ist standardmäßig strukturierter, aber weniger konversationell. Claude mit Websuche ist vorsichtiger und sichert sich sichtbarer ab. OpenAI mit Browsing ist bei gleicher Frage schneller und produziert gesprächlichere Ausgaben.

Für Recherche-Workloads, bei denen Zitationsdichte und Struktur wichtig sind, ist die Deep-Research-Familie — einschließlich Pro-Stufe — wettbewerbsfähig. Für interaktive Recherche, bei der der Nutzer die Frage während des Laufs verfeinern möchte, passen Claude oder OpenAI besser.

Das Kategorie-Bild finden Sie auf /benchmarks/intelligence und das Leaderboard auf /benchmarks/leaderboard.

Wann es das falsche Werkzeug ist

Konversationsinteraktionen. Nicht die richtige Modellform.

Hochvolumige Aufrufe. Jeder Aufruf kostet erhebliche Rechenleistung und dauert merkliche Zeit. Kein Chatbot-Werkzeug.

Alles, das keine buchstäbliche Recherche ist. Code, Debugging, Bildarbeit — falsche Familie.

Workloads, bei denen Aktualität jenseits des Index-Cutoffs wichtiger ist als Tiefe. Der Such-und-Zitier-Loop ist nur so aktuell wie der Index, aus dem er zieht.

Deployment-Hinweise

Standard-Google-Gemini-API. Die Deep-Research-Modelle teilen die breitere Gemini-Oberfläche, erfordern aber einen expliziten Modellbezeichner und akzeptieren Parameter, die spezifisch für den agentischen Loop sind.

Queue-and-Callback-Muster statt Streaming-Antworten einplanen. Der Agent produziert während eines Laufs Zwischenfortschritts-Updates, aber die endgültige Synthese kommt am Ende. Latenz im Bereich von 30 bis 90 Sekunden ist typisch für diese Pro-Stufe bei moderaten Fragen.

Regionale Verfügbarkeit folgt Googles Standard-Vertex-AI-Muster. EU-Regionen sind auf Enterprise-Verträgen verfügbar. Der Standard-Consumer-API-Zugang pinnt keine Region. Bei strikten Residenzanforderungen die regionale Vertex-AI-Dokumentation konsultieren.

Wann Sie es einsetzen sollten

Greifen Sie zu Deep Research Pro Preview (Dezember 2025), wenn:

  • Sie einen bestehenden Workload haben, der gegen diesen spezifischen Snapshot validiert ist.
  • Stabiles Agent-Loop-Verhalten über Monate für Ihren Anwendungsfall wichtig ist.
  • Eine Migration zu den neueren April-2026-Previews noch nicht budgetiert oder gerechtfertigt ist.

Wählen Sie etwas anderes, wenn:

  • Sie 2026 eine Deep-Research-Stufe neu auswählen. Die April-2026-Basis-Preview oder Max-Preview ist in der Regel der bessere Ausgangspunkt.
  • Der Workload Tiefe erfordert, die über das Pro-Niveau hinausgeht. Wechseln Sie zu Max.
  • Der Workload durch die schnellere Basis-Stufe ausreichend bedient würde. Wechseln Sie nach unten.
  • Der Anwendungsfall etwas anderes als buchstäbliche Recherche-Synthese mit Zitaten ist.

Zusammenfassung: Ein verankerbarer Pro-Tier-Snapshot von Ende 2025, der noch seinen Job macht. Für Neubauten sind die April-2026-Previews in der Regel die bessere Wahl. Für bestehende Deployments gibt es selten einen starken Qualitätsgrund für eine Migration.

Testen Sie es mit einer echten Recherchefrage unter /live-test und vergleichen es mit den neueren Preview-Stufen derselben Familie.

Letzte technische Überprüfung: 2026-05-22 — Tokonomix.ai

Deep Research Pro Preview (Dec-12-2025) — illustration 2Deep Research Pro Preview (Dec-12-2025) — illustration 3
Letzter automatisierter Test
14. Juni 2026 · 04:58 UTC · Benchmark
P50-Latenz
P95-Latenz
Fehler
1 / 6 Läufe
Zuletzt geprüft von Tokonomix-Team·24. Mai 2026