
GPT-4 est la version frontière originale de la famille GPT-4 d'OpenAI — le modèle qui, lorsqu'il est arrivé en mars 2023, est devenu le point de repère auquel chaque grand modèle de langage suivant a été comparé. Les détails d'architecture n'ont pas été communiqués à l'époque et ne le sont toujours pas. L'ensemble des capacités, le profil de coût et l'historique de déploiement sont en revanche bien documentés à travers des années d'utilisation en production.
Ce n'est plus le choix par défaut recommandé pour les nouveaux développements. Il n'est pas non plus mis à la retraite. Le bon cadrage est celui d'un entre-deux.
Pourquoi ce modèle a compté
L'arrivée de GPT-4 a redéfini ce que les équipes attendaient d'un modèle de langage déployable en production. Trois bascules précises.
Raisonnement. GPT-4 pouvait enchaîner une inférence en plusieurs étapes d'une manière que la génération 3.5 ne permettait pas. Analyse de contrats juridiques, synthèse multi-documents, génération de code original à partir de spécifications floues — tout cela est passé du statut de « démo intéressante, sortie fragile » à « déployable en production avec des couches de relecture appropriées ». L'écart qualitatif par rapport à 3.5 était de ceux que l'on ressentait dans les résultats d'évaluation dès la première heure de test.
Plurilinguisme. La couverture multi-langues a connu un saut qualitatif. La prose administrative européenne, la terminologie médicale, le langage juridique à travers plusieurs juridictions — tout cela était traité matériellement mieux que par la génération précédente. Pour les équipes entreprise européennes en particulier, c'est ce qui a permis le déploiement de fonctionnalités produit transfrontalières.
Utilisation d'outils. Le function calling a mûri jusqu'à devenir quelque chose sur quoi les équipes en production pouvaient réellement construire des boucles d'agents. La discipline de schéma n'était pas aussi stricte que celle qu'allaient livrer les générations suivantes, mais elle l'était assez pour que la première vague de frameworks d'agents puisse être bâtie autour.
Ce qui a suivi au cours de 2024 et 2025 — GPT-4 Turbo, GPT-4o, GPT-4.1, GPT-5 — n'a été que raffinements et extensions des capacités que GPT-4 a établies en premier.
Ce qui lui manque face aux modèles actuels
La fenêtre de contexte de 8 192 tokens est la limitation la plus visible. Après une année durant laquelle les contextes d'un million de tokens sont devenus la norme au niveau frontière, 8k suffit au trafic conversationnel mais à aucune charge de travail à forte densité documentaire. Le traitement de documents sur ce modèle impliquait généralement des stratégies de découpage que les modèles actuels rendent inutiles.
Pas d'entrée vision. Les variantes capables de vision sont arrivées plus tard. Le modèle GPT-4 de base est uniquement textuel.
Pas d'interface audio. Même histoire. Les capacités audio sont arrivées avec la génération 4o.
Profondeur de raisonnement. Les prompts de planification et de synthèse les plus exigeants que les modèles frontières actuels traitent avec aisance — GPT-5, Claude Opus 4.7, les variantes deep-research — sont visiblement en dehors de la zone de confort de GPT-4. Le modèle les traite, mais la qualité de sortie chute sensiblement.
Vitesse. Les améliorations de la pile d'inférence des deux dernières années ont fait passer le profil de latence des modèles plus récents bien en dessous de celui où se situe le GPT-4 original. Pour les cas d'usage interactifs, la différence se ressent immédiatement.
Pourquoi des équipes le font encore tourner
Deux raisons au-delà de l'inertie historique.
D'abord, des régimes de conformité qui ont approuvé cet identifiant spécifique. GPT-4 est le modèle qui a passé le plus de cycles d'audit en 2023 et 2024 parce qu'il était l'option frontière disponible sur cette période. Certains workflows régulés font encore tourner GPT-4 parce que le coût d'un nouvel audit sur un modèle plus récent est significatif et que la charge de travail n'a pas encore besoin de quelque chose de plus récent.
Ensuite, la stabilité d'évaluation pour les pipelines en aval. Les équipes qui ont construit des parseurs, des classifieurs ou des suites de tests étroitement calés sur le style de sortie spécifique de GPT-4 figent parfois le modèle pour préserver la stabilité, le temps de migrer l'outillage aval à leur propre rythme.
Les deux raisons ont une date de péremption. Les nouveaux cycles d'audit ciblent par défaut les modèles actuels ; les nouveaux pipelines ne sont plus construits contre GPT-4.
Chemins de migration
La bonne cible de migration dépend de la forme de la charge de travail.
Pour les charges où GPT-4 était le choix frontière et où la capacité frontière actuelle compte, GPT-4.1 ou GPT-5 sont l'évolution naturelle. Les deux apportent un contexte beaucoup plus long, un raisonnement matériellement plus solide, et un comportement de sortie structurée plus rigoureux. Le coût est plus bas, pas plus haut.
Pour les charges qui tournaient sur GPT-4 parce que rien de moins cher n'était assez bon à l'époque, gpt-4.1-mini est souvent la bonne destination. La qualité sur la plupart des prompts de production est comparable ; le profil de coût et de latence est matériellement meilleur.
Pour les charges multimodales antérieures à la génération 4o et qui contournent actuellement l'absence de vision ou d'audio via des services externes, l'étape naturelle consiste à se consolider sur GPT-4o ou GPT-4.1 avec support multimodal natif. La seule simplification architecturale vaut généralement le coût de migration.
Notes de déploiement
La surface d'API est Chat Completions, la même forme que celle qu'utilise chaque modèle OpenAI ultérieur. Streaming, function calling, sortie JSON-mode structurée lorsque le schéma est raisonnable — tout cela se comporte à peu près comme sur les modèles plus récents.
Le prompt caching n'est pas aussi développé sur GPT-4 qu'il l'est sur les modèles plus récents. Les gains d'efficacité de réutilisation qui s'autofinancent sur GPT-4.1 avec des préfixes long-contexte stables sont plus modestes ici.
La résidence régionale suit la même histoire OpenAI : l'API directe tourne sur infrastructure Azure sans épinglage de région, Azure OpenAI Service propose des déploiements régionaux sous un contrat distinct. Pour les équipes avec des exigences strictes de résidence dans l'UE, une instance Mistral ou Llama 3 hébergée chez OVH est une autre conversation ; voir /usecases/local.
Le choisir
Utilisez GPT-4 aujourd'hui quand :
- Un régime de conformité a approuvé cet identifiant spécifique et le cycle de ré-audit est en cours.
- Un pipeline aval a été ajusté assez finement au style de sortie du modèle pour que le coût de migration l'emporte sur le bénéfice de mise à niveau, et l'équipe a un plan pour y remédier.
- Un travail de comparaison historique nécessite le point de référence GPT-4 original.
Pour les nouveaux développements, visez GPT-4.1, GPT-4.1 mini ou l'un des modèles de la famille GPT-5 selon la forme de la charge de travail. La génération 4 a fixé la référence. Elle ne l'est plus.
Pour la comparaison transverse entre catégories, voir /benchmarks/leaderboard. Pour la direction générale de la gamme OpenAI, voir GPT-4.1.
Dernière revue technique : 2026-05-22 — Tokonomix.ai

