
Hinweis — zukunftsgerichtetes Profil. Deep Research Max Preview (
deep-research-max-preview-04-2026) ist der Preview-Snapshot vom April 2026. Verhalten, Fähigkeiten und Ratenlimits werden sich vor der allgemeinen Verfügbarkeit ändern. Betrachten Sie die folgenden Beobachtungen als Momentaufnahme eines sich entwickelnden Modells.
Deep Research Max Preview ist Googles oberste Stufe der Deep-Research-Familie. Ein Kontextfenster von 131.072 Token. Langformige Synthese als primäre Ausgabe. Ein agentischer Loop, der Quellen zieht, sie liest, gegenprüft und einen Bericht schreibt.
Dies ist kein Chat-Modell. Es ist ein Recherche-Agent, der eine Frage entgegennimmt, entscheidet, was er lesen will, es liest und eine strukturierte Antwort mit Zitaten produziert. Das Ergebnis sieht eher aus wie das Briefing eines Junior-Analysten als eine Chat-Antwort — und die Zeit zur Erstellung spiegelt das wider: Diese Läufe dauern Minuten, nicht Sekunden.
Was es tatsächlich tut
Übergeben Sie ihm eine Frage, für deren Recherche eine Person einen Nachmittag benötigen würde. Es verbringt mehrere Minuten damit, Quellen zu ziehen, sie zu lesen, das Wesentliche zu priorisieren und eine strukturierte Antwort zu schreiben. Die Ausgabe umfasst typischerweise:
- Eine Zusammenfassung am Anfang.
- Eine Aufgliederung der Frage in Teilfragen.
- Zitate für jede sachliche Aussage mit zitierten Passagen aus den Quellen.
- Eine Liste der verwendeten Quellen mit Hinweisen darauf, welche das meiste Gewicht hatten.
- Optionale Folgefragen, die der Nutzer als Nächstes untersuchen könnte.
Die Max-Stufe dieser Familie liest mehr, läuft länger und produziert längere Ausgaben als die Pro- und Basis-Preview-Stufen. Es ist die Option, die man wählt, wenn man Tiefe will und bereit ist, darauf zu warten.
Wo es wirklich nützlich ist
Einige Workloads, bei denen Deep Research Max gegenüber einem einfachen Chat-Modell mit Websuche wirklich punktet:
- Quellenübergreifende Synthese zu einem Thema mit widersprüchlichen Belegen. Der agentische Loop ist bei widersprüchlichen Aussagen merklich besser darin, sie aufzudecken und sichtbar zu machen.
- Langformige Berichte, bei denen die Ausgabe vertretbar sein muss. Die Zitationsdichte ist hoch, und die Zitate spiegeln den tatsächlichen Quelleninhalt wider, keine halluzinierten Referenzen.
- Investigative Fragen, bei denen die richtige Antwort das Lesen mehrerer Primärquellen erfordert, statt eine sekundäre Zusammenfassung zu liefern.
- Regulatorische oder politische Analysen, bei denen die oberflächliche Zusammenfassung deutlich von dem abweicht, was die zugrundeliegenden Dokumente tatsächlich aussagen.
Das Muster: Aufgaben, bei denen ein Mensch zehn Tabs öffnen und eine Stunde sorgfältig lesen würde, passen gut zu diesem Modell. Aufgaben, die ein Chat-Modell mit einem einzigen Such-Aufruf ausreichend behandeln würde, benötigen diese Stufe nicht.
Wann es das falsche Werkzeug ist
Alles, was wie eine Konversation klingen soll. Deep Research Max ist in keiner sinnvollen Weise interaktiv. Man sendet eine Frage, wartet und erhält einen strukturierten Bericht. Wenn der Nutzer eine Antwort in Sekunden erwartet, ist dies die falsche Wahl.
Code-Generierung, Debugging oder jede andere Aufgabe, die buchstäblich keine Recherche ist. Der agentische Loop ist um das Ziehen von Quellen und Zitation herum gebaut, nicht um das Ausführen eines Code-Interpreters oder die Verfeinerung von Ausgaben durch Dialog.
Alles, bei dem Aktualität jenseits des Index-Cutoffs wichtiger ist als Tiefe. Die Deep-Research-Familie zieht aus indizierten Web-Inhalten, und Aktualität hängt von der Indizierungslatenz ab. Bei aktuellen Nachrichten, bei denen sich die Antwort in der letzten Stunde geändert hat, passt ein anderes Werkzeug besser.
Hochvolumige Aufrufe. Dies ist kein Modell für einen Chatbot. Ein Aufruf kostet erhebliche Rechenleistung und dauert Minuten. Entsprechend planen.
Vergleich mit dem Rest der Deep-Research-Familie
Drei Preview-Snapshots in der Familie:
- Deep Research Pro Preview (Dezember 2025) — die ursprüngliche Pro-Stufe, noch verfügbar, etwas älterer Agent-Loop.
- Deep Research Preview (April 2026) — die sucherweiterte Basis-Stufe, schneller, kürzere Ausgaben, weniger Synthesetiefe.
- Deep Research Max Preview (April 2026) — die tiefste Stufe, längste Läufe, gründlichste Ausgabe.
Beim ersten Test der Familie sollte man mit dem Pro- oder Basis-April-2026-Snapshot beginnen, bevor man die Latenzkosten von Max trägt. Viele Workloads benötigen die zusätzliche Tiefe, die Max bietet, nicht.
Vergleich mit anderen recherchefokussierten Modellen
Die direktesten Alternativen außerhalb von Googles Lineup sind die suchangereicherten Modi bei OpenAIs GPT-5-Serie und Anthropics Claude-Familie mit explizitem Websuche-Tooling. Die Form der Ausgabe ist ähnlich — Synthese mit Zitaten — aber der agentische Loop unterscheidet sich.
Googles Deep-Research-Familie neigt dazu, länger zu laufen, mehr Quellen zu ziehen und detailliertere Zitate zu produzieren. OpenAIs Research-Modus ist bei gleicher Frage schneller und oft gesprächlicher im Ton. Claude mit Websuche ist das vorsichtigste der drei, mit der stärksten Ablehnungshaltung und der zuverlässigsten Zitationsgenauigkeit bei unsicheren Aussagen.
Die richtige Wahl hängt vom Workload ab. Für maximale Tiefe bei einer einzigen Frage, bei der Zeit keine Einschränkung ist, ist Deep Research Max wettbewerbsfähig. Für interaktive Recherche, bei der der Nutzer die Frage verfeinern möchte, während das Modell arbeitet, passen Claude oder OpenAI besser.
Das Kategorie-Bild für recherchefokussierte Benchmarks finden Sie auf /benchmarks/intelligence. Das laufende Leaderboard auf /benchmarks/leaderboard.
Deployment-Hinweise
Standard-Google-Gemini-API. Die Deep-Research-Modelle leben in derselben Oberfläche wie der Rest der Gemini-Familie, erfordern aber einen expliziten Modellbezeichner und akzeptieren etwas andere Parameter zu Laufzeitdauer und Tool-Use-Tiefe.
Das Latenzprofil ist ungewöhnlich genug, dass man dieses Modell nicht hinter eine synchrone Nutzerinteraktion setzen sollte. Queue-and-Callback-Muster statt Streaming-Antworten einplanen. Das Modell produziert während eines Laufs Zwischenfortschritts-Updates, aber die endgültige Synthese kommt am Ende.
Regionale Verfügbarkeit folgt Googles Standard-Vertex-AI-Muster mit EU-Regionen auf Enterprise-Verträgen. Der Standard-Consumer-API-Zugang pinnt keine Region. Bei strikten Residenzanforderungen sollte die regionale Vertex-AI-Dokumentation konsultiert werden, statt sich auf das öffentliche API-Verhalten zu verlassen.
Wann Sie es einsetzen sollten
Greifen Sie zu Deep Research Max Preview, wenn:
- Sie eine Recherchefrage haben, die eine Person einen Nachmittag gut beantworten würde.
- Die Ausgabe Zitate in ausreichender Dichte benötigt, um gegenüber externen Gutachtern vertretbar zu sein.
- Latenz in Minuten gemessen wird und das akzeptabel ist.
- Synthesetiefe wichtiger ist als Aktualität der zugrundeliegenden Quellen.
Übergehen Sie es, wenn:
- Die Frage einen interaktiven Hin-und-Her-Austausch zur Verfeinerung braucht.
- Sub-Sekunden-Latenz Teil der Anforderung ist.
- Der Anwendungsfall etwas anderes als buchstäbliche Recherche-Synthese ist.
- Eine leichtere Deep-Research-Stufe — Pro oder Basis-Preview — den Workload abdecken würde.
Zusammenfassung: Dies ist ein spezialisiertes Werkzeug für eine bestimmte Form von Arbeit. Wenn die Form passt, gehört es zu den stärksten Optionen im Feld. Wenn nicht, ist fast jedes andere Modell die bessere Wahl.
Testen Sie es mit einer echten Recherchefrage unter /live-test. Der Output-Stil ist markant genug, dass man ihn sehen sollte, bevor man sich für die Stufe entscheidet.
Letzte technische Überprüfung: 2026-05-22 — Tokonomix.ai

