Aller au contenu
Fonctionne en :USCréé en :United States
OpenAI

gpt-4o-search-preview-2025-03-11

Équipe éditoriale Tokonomix·Relu par Mes Kalkan··

GPT-4o-search-preview-2025-03-11 est une variante de la famille de modèles GPT-4o d'OpenAI qui intègre des capacités de recherche aux fonctionnalités d'un grand modèle de langage. Ce modèle est conçu pour combiner la compréhension et la génération du langage naturel avec la capacité de récupérer et d'incorporer des informations actuelles provenant de recherches web, lui permettant de fournir des réponses qui reflètent des événements et données récents au-delà de sa date limite d'entraînement. Il représente une approche expérimentale pour répondre aux limitations d'actualité des connaissances inhérentes aux modèles de langage statiques. Le modèle conserve les caractéristiques architecturales fondamentales de la série GPT-4o, y compris les capacités de compréhension multimodale, bien que sa principale caractéristique distinctive soit la fonctionnalité de recherche intégrée qui lui permet d'augmenter les réponses générées avec des informations récupérées. La taille de la fenêtre de contexte pour cette variante particulière n'a pas été spécifiée publiquement par OpenAI. Il est capable d'effectuer des tâches standard de génération de texte, notamment l'analyse, la synthèse, l'écriture créative et la résolution de problèmes techniques, avec la dimension supplémentaire de pouvoir référencer des informations contemporaines lorsque cela est approprié. Au sein de la gamme de modèles d'OpenAI, GPT-4o-search-preview-2025-03-11 occupe une position expérimentale, servant de version preview qui démontre l'intégration de la génération augmentée par récupération dans l'architecture GPT-4o. La désignation « preview » indique qu'il s'agit d'une version de développement destinée à recueillir des retours et à évaluer les performances avant un éventuel déploiement plus large. Il se situe aux côtés d'autres variantes GPT-4o qui se concentrent sur différents objectifs d'optimisation tels que la vitesse, le rapport coût-efficacité ou des capacités de raisonnement spécialisées.

GPT-4o-search-preview-2025-03-11 marque une étape importante dans l'évolution des modèles de langage en intégrant nativement des capacités de recherche web, permettant de dépasser les limites traditionnelles de fraîcheur des données.

Analyse Tokonomix, mars 2025
Section 01

Scores de qualité

Résultats d'évaluation issus des notations du modèle juge sur diverses catégories de tâches. Les scores reflètent la cohérence, la précision et le suivi des instructions.

100
Génération de code
99
Multilingue
100
Raisonnement
Section 02

Historique des tarifs

Tarifs directs du fournisseur par million de tokens, plus une estimation du coût d'une conversation typique.

💰
Tarifs API — gpt-4o-search-preview-2025-03-11
$2.50 par 1M de tokens d'entrée
$10.00 par 1M de tokens de sortie
≈ $0.0035 par conversation typique (800 tokens)
Prix entrée vs sortie (par 1M de tokens)
par 1M de tokens d'entrée$2.50
par 1M de tokens de sortie$10.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$2.50

input / 1M

— stable

$10.00

output / 1M

— stable

2026-05-242026-06-072026-06-14
Input
Output
Price change
⟳ synced weekly
Section 03

Forces & faiblesses

Basé sur les résultats de benchmarks et les retours communautaires agrégés sur des cas d'usage réels.

Forces

Recherche web intégrée nativementAccès aux informations actualiséesArchitecture GPT-4o éprouvéeRépond aux événements récentsGénération augmentée par récupérationCompréhension multimodale héritéeCombine LLM et données en temps réelApproche expérimentale innovante

Faiblesses

Statut preview non stabiliséTaille de contexte non spécifiéeBenchmarks limités disponiblesLatence potentiellement accrue par recherche
Section 04

Capacités

toolssource: litellmvisionjson modepdf inputjson schemaparallel toolsprompt cachingmax output tokens: 16384
Section 05

Questions fréquentes

La différence principale réside dans l'intégration native de capacités de recherche web, permettant au modèle de récupérer et d'incorporer des informations actuelles lors de la génération de réponses. Le GPT-4o standard s'appuie uniquement sur ses données d'entraînement.

Ce modèle expérimental offre un aperçu prometteur de l'avenir des LLM augmentés par la recherche, mais son statut de preview implique une prudence lors du déploiement en production.

Tokonomix, évaluation éditoriale
Section 06

Disponibilité

Disponibilité

Pas encore de données

Nous n'avons pas encore enregistré suffisamment d'appels API pour afficher les statistiques de disponibilité de ce modèle. Les données apparaîtront dès que le modèle reçoit du trafic en direct.

Section 07

Verdicts benchmark Tokonomix

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-592/100 · 76 runs
64 correct9 partial3 wrong84% accuracy
2026-06-14

Search-optimized variant maintains core capabilities without new additions

The gpt-4o-search-preview-2025-03-11 model represents a specialized variant of GPT-4o designed for search and retrieval tasks. This benchmark window shows stability in the model's existing capabilities, with no new features added since the previous evaluation period. The model continues to support the comprehensive toolset established earlier, including vision processing, structured output via JSON mode and JSON schema, PDF input handling, parallel tool execution, and prompt caching. These features position it well for applications requiring multimodal understanding and structured data extraction within search contexts. Users should note that this is a preview release specifically tuned for search scenarios, which may influence its behavior and performance characteristics compared to general-purpose GPT-4o variants. The stable capability profile suggests OpenAI is focusing on refinement and optimization of existing features rather than feature expansion for this specialized model. Organizations evaluating this model should consider their specific search and retrieval requirements when comparing it to other GPT-4o variants, as the search optimization may offer benefits in those particular use cases while maintaining broad compatibility with established GPT-4o capabilities.

Quality

Latency p50

Test runs

0

Stable capability profile maintained Full multimodal support retained Search-optimized specialization
Section 08

Profil complet du modèle

gpt-4o-search-preview-2025-03-11 — illustration 1
gpt-4o-search-preview-2025-03-11 : l'instantané de recherche complète de mars

gpt-4o-search-preview-2025-03-11 est l'instantané daté de mars 2025 du modèle de chat à recherche augmentée de niveau complet d'OpenAI. Le gel de l'alias continu gpt-4o-search-preview tel qu'il se présentait à cette date de sortie, verrouillé pour les déploiements en production qui épinglent un comportement de recherche spécifique.

Les réponses fondées sur la recherche comportent davantage de dimensions comportementales que le chat standard — stratégie de requête, sélection de citations, style de synthèse, seuils de déclenchement de recherche. L'instantané figé les fige toutes.

Ce que représente cet instantané

En mars 2025, l'aperçu de recherche complète avait :

  • Stabilisé le format de métadonnées de citation que les instantanés plus récents utilisent toujours.
  • Défini la structure de facturation par appel de recherche.
  • Résolu les régressions les plus perturbantes de construction de requêtes issues des versions préliminaires initiales.

Ce qu'il n'a pas, par rapport aux instantanés ultérieurs :

  • La réécriture de requête améliorée arrivée à la mi-2025 qui a réduit les appels de recherche par réponse.
  • Le classement de citations affiné qui a promu plus agressivement les sources faisant autorité.
  • Les améliorations de latence issues des modifications d'infrastructure backend au cours du T2 2025.

Pour les déploiements validés au printemps 2025, il s'agit très probablement de l'instantané contre lequel la validation a été effectuée.

Pourquoi l'épinglage daté compte davantage pour la recherche complète que pour la mini-recherche

Les deux niveaux ont les mêmes dimensions comportementales susceptibles d'évoluer entre instantanés, mais les évolutions comportementales du niveau complet sont plus visibles parce que les réponses elles-mêmes sont plus longues et plus soigneusement synthétisées.

Un changement dans la stratégie de requête au niveau complet peut signifier que le modèle émet deux requêtes de suivi là où l'instantané précédent n'en émettait qu'une, doublant la latence. Un changement dans le classement des citations peut signifier que les sources citées penchent vers les domaines de plus haute autorité et s'éloignent des sources de longue traîne contre lesquelles vos tests d'assurance qualité ont été effectués. Un changement dans le style de synthèse peut signifier que le même contenu récupéré produit une réponse qui se lit suffisamment différemment pour dérouter les utilisateurs qui ont appris à quoi ressemble votre produit.

Épingler à 2025-03-11 signifie que tout cela reste constant.

La question de la migration

Même configuration que tout épinglage d'instantané daté.

  • Maintenez l'épinglage de mars en production pendant que vous évaluez.
  • Exécutez une tranche représentative de votre mix de requêtes réel à travers les deux instantanés.
  • Comparez la qualité des citations, le nombre d'appels de recherche, la latence de bout en bout et le style de synthèse. Examinez les dimensions qui comptent pour votre produit, avec la métrique de qualité agrégée comme une entrée plutôt que le facteur décisif.
  • Migrez lorsque l'instantané plus récent gagne de manière démontrable sur les dimensions qui comptent.

L'argument pour migrer d'un épinglage stable est rarement « le nouveau est meilleur en moyenne ». L'argument est « le nouveau est meilleur sur les éléments spécifiques autour desquels mon produit est construit ».

Où il échoue

Mêmes contraintes que le reste de la ligne de recherche complète.

Charges de travail de recherche intensive. Les modèles de la ligne recherche sont spécialement conçus pour la synthèse longue durée à travers de nombreuses sources. Voir /benchmarks/methodology.

Connaissances privées de domaine. Recherche sur le web public uniquement. Construisez votre propre RAG pour les documents privés.

Questions-réponses à volume élevé. La mini-recherche est le bon niveau de coût pour un trafic à l'échelle consommateur.

Utilisation interactive critique en latence. La recherche ajoute des allers-retours. Les recherches complète et mini sont toutes deux plus lentes que le chat sans recherche.

Déploiement auto-hébergé. API OpenAI uniquement. Voir /usecases/local pour des alternatives sur site.

Quand épingler exactement cet instantané

Choisissez gpt-4o-search-preview-2025-03-11 lorsque :

  • Vous avez livré un produit fondé sur la recherche basé sur le comportement de recherche complète de mars 2025 et devez le maintenir stable.
  • Le comportement de citation et le style de synthèse faisaient partie de ce qui a passé votre évaluation du printemps 2025.
  • Une exigence de conformité épingle la version du modèle au niveau de l'instantané à des fins d'audit.
  • Un test A/B ou un protocole de recherche nécessite une référence de modèle de recherche fixe sur plusieurs mois.

Sautez-le lorsque :

  • Vous repartez de zéro — épinglez plutôt l'instantané le plus récent.
  • Les améliorations de réécriture de requête, de classement de citations ou de latence dans les instantanés ultérieurs ont gagné lors de votre évaluation.
  • La version stable finale de la ligne augmentée par recherche est disponible — c'est la bonne cible pour les nouveaux projets.

Alternatives valant la comparaison

Les instantanés de recherche complète plus récents lorsque les améliorations de mi-2025 ont gagné. La mini-recherche lorsque l'économie de volume élevé compte davantage que la qualité de synthèse. Les modèles de la ligne recherche lorsque la tâche déborde sur la synthèse de recherche longue durée. L'enquête plus large sur /usecases/content couvre les charges de travail de génération de contenu où l'ancrage de recherche aide.

Notes de déploiement

API Chat Completions standard. L'outil de recherche est invoqué automatiquement en fonction de l'invite. Les métadonnées de citation sont renvoyées dans un champ structuré aux côtés de la sortie de texte du modèle.

La facturation des jetons divise le texte entrant, le texte sortant et les frais par appel de recherche. Les frais par appel de recherche sont inchangés à travers les instantanés de recherche complète jusqu'à présent, bien que le taux auquel le modèle déclenche des recherches puisse varier entre instantanés et donc le coût effectif par conversation aussi.

Le format de métadonnées de citation est stable à travers cet instantané et les instantanés ultérieurs de 2025, ce qui maintient le code de rendu d'interface utilisateur réutilisable lors de toute migration future.

La lecture pragmatique. C'est le gel de mars 2025 de la recherche de niveau complet. Épinglez-le lorsque votre produit fondé sur la recherche a été validé contre lui et que la stabilité au niveau de l'instantané compte. Migrez lorsque votre propre évaluation dit que l'instantané plus récent est le bon choix sur les dimensions qui comptent pour votre produit. Exécutez des comparaisons au niveau requête sur /live-test avant de vous engager.

Dernière révision technique : 2026-05-22 — Tokonomix.ai

gpt-4o-search-preview-2025-03-11 — illustration 2
Dernier test automatisé
14 juin 2026 · 04:54 UTC · Benchmark
Latence P50
4883 ms
Latence P95
Erreurs
0 / 6 exécutions
Dernière revue par Équipe Tokonomix·26 mai 2026