
gpt-4o-mini-search-preview-2025-03-11 est l'instantané daté de mars 2025 du petit modèle de chat à recherche augmentée d'OpenAI. Même architecture d'outil de récupération que l'alias glissant, figée à ce point de publication afin que les déploiements en production puissent s'épingler sur un comportement connu.
Les réponses ancrées dans la recherche sont particulièrement sensibles à la dérive de version du modèle. Épingler un instantané, c'est ce qui maintient prévisibles le comportement de citation, les stratégies de requêtes et le style de synthèse, pendant qu'OpenAI continue d'itérer sur la ligne preview.
Ce que représente cet instantané
En mars 2025, la preview mini-search avait :
- Stabilisé le format des métadonnées de citation que l'alias glissant utilise toujours.
- Fixé la structure de facturation par appel de recherche.
- Résolu les régressions de construction de requêtes les plus perturbatrices des premières publications de la preview.
Ce qu'il n'a pas, par rapport aux instantanés ultérieurs :
- La réécriture de requêtes améliorée arrivée mi-2025 et qui a réduit le nombre d'appels de recherche par réponse.
- Les raffinements du classement des citations qui ont promu plus agressivement les sources faisant autorité.
- Les améliorations de latence issues des changements d'infrastructure backend au cours du T2 2025.
Pour les déploiements validés au printemps 2025, c'est très probablement l'instantané contre lequel la validation a été passée.
Pourquoi l'épinglage daté importe davantage pour les modèles de recherche
Le chat à recherche augmentée comporte plusieurs dimensions comportementales qui peuvent se déplacer entre instantanés, chacune visible dans le produit :
- Le nombre d'appels de recherche par réponse — modifie le profil de latence et le coût par requête.
- Le choix des sources à citer — affecte l'autorité perçue de la réponse.
- Le style de synthèse pour combiner le contenu récupéré et les connaissances préentraînées — affecte la lecture de la réponse.
- Le seuil à partir duquel le modèle décide de lancer une recherche plutôt que de répondre depuis son préentraînement — affecte la couverture de fraîcheur.
Un épinglage d'instantané fige tout cela en place. Rouler avec l'alias, c'est accepter que n'importe lequel de ces aspects puisse se déplacer le jour où OpenAI livre une nouvelle révision.
La question de la migration
Même forme que pour tout épinglage d'instantané daté.
- Tenez l'épinglage de mars en production pendant l'évaluation.
- Rejouez un ensemble représentatif de requêtes contre l'instantané candidat plus récent.
- Comparez sur la qualité des citations, l'efficience des appels de recherche, la latence et le style de synthèse, en parallèle de l'exactitude brute des réponses.
- Migrez lorsque le nouvel instantané l'emporte de manière démontrable sur les dimensions qui comptent pour votre produit.
L'argument pour quitter un épinglage stable est rarement « le nouveau est meilleur en moyenne ». L'argument, c'est « le nouveau est meilleur sur les choses spécifiques autour desquelles mon produit est construit ». Soyez honnête sur le cas dans lequel vous vous trouvez réellement.
Là où il décroche
Raisonnement lourd sur du contenu récupéré. Mini est le petit modèle. La preview de recherche complète est la bonne escalade lorsque la synthèse devient le goulot d'étranglement.
Connaissance privée à un domaine. L'outil de recherche indexe le contenu web public. La documentation interne nécessite un pipeline RAG distinct.
Usage interactif critique en latence. La recherche ajoute des allers-retours. Mini-search est plus rapide que la preview de recherche complète mais reste plus lent que des réponses purement générées.
Déploiement auto-hébergé. L'outil de recherche requiert l'infrastructure backend d'OpenAI. Le panorama /usecases/local couvre ce qui est disponible lorsque les contraintes on-premise s'imposent.
Quand épingler exactement cet instantané
Choisissez gpt-4o-mini-search-preview-2025-03-11 quand :
- Vous avez livré une fonctionnalité ancrée dans la recherche sur le comportement mini-search de mars 2025 et devez la garder stable.
- Le comportement de citation et la sélection des sources faisaient partie de ce qui a passé votre évaluation du printemps 2025.
- Un test A/B ou un protocole de recherche a besoin d'une référence de modèle de recherche fixe sur plusieurs mois.
Passez votre chemin quand :
- Vous démarrez à neuf — épinglez plutôt l'instantané le plus récent.
- Les améliorations de réécriture de requêtes ou de latence des instantanés ultérieurs l'ont emporté dans votre évaluation.
- La version stable définitive de la ligne à recherche augmentée est disponible — c'est la bonne cible pour les nouveaux projets.
Notes de déploiement
API Chat Completions standard. L'outil de recherche est invoqué automatiquement par le modèle en fonction du prompt ; la surface de l'API est inchangée par rapport aux modèles sans recherche, avec en plus des métadonnées de citation structurées dans la réponse.
La facturation par tokens distingue le texte en entrée, le texte en sortie et les frais par appel de recherche. Les frais par appel de recherche n'ont pas changé entre les instantanés mini-search jusqu'à présent, bien que la fréquence à laquelle le modèle déclenche des recherches puisse varier d'un instantané à l'autre, et donc le coût effectif par conversation également.
Le format des métadonnées de citation est stable entre cet instantané et les instantanés ultérieurs de 2025, ce qui permet de réutiliser le code de rendu d'interface utilisateur d'une migration à l'autre.
La lecture pragmatique. C'est le gel de mars 2025 de mini-search. Épinglez-le quand votre produit a été validé contre lui. Migrez quand votre propre évaluation dit que le nouvel instantané est le bon mouvement sur les dimensions qui comptent. Effectuez des comparaisons au niveau requête sur /live-test avant de vous engager.
Dernière revue technique : 2026-05-22 — Tokonomix.ai
