OpenAI lance GPT-5.5 : le modèle agentique qui pose la première pierre de la super app ChatGPT + Codex + Atlas
Le 23 avril 2026, OpenAI a dévoilé GPT-5.5, son premier modèle entièrement réentraîné depuis GPT-4.5. 84,9 % sur GDPval, 78,7 % sur OSWorld, 82,7 % sur Terminal-Bench 2.0 — et un prix API doublé à 5 $ / 30 $ par million de tokens. Objectif : fusionner ChatGPT, Codex et Atlas en une seule session agentique.

OpenAI n'a plus envie de vendre un assistant. Le 23 avril 2026, la société a dévoilé GPT-5.5, présenté par Sam Altman comme « le modèle le plus intelligent et le plus intuitif » de la maison, et par Greg Brockman comme « la première brique concrète de la super app ». Sous le capot, c'est le premier modèle entièrement réentraîné depuis GPT-4.5 — pas un simple post-training appliqué à GPT-5. Et les scores sont agressifs : 84,9 % sur GDPval, 78,7 % sur OSWorld-Verified, 82,7 % sur Terminal-Bench 2.0, 98,0 % sur Tau2-bench Telecom. Le tout sur un prix API doublé — 5 $ en entrée, 30 $ en sortie par million de tokens, contre 2,50 $ / 15 $ pour GPT-5.4. Le message est clair : le token moins cher n'est plus le bon champ de bataille.
Le pari super app : une seule session, plusieurs surfaces
Depuis trois mois, OpenAI prépare quelque chose qui ne ressemble plus à une API. La stratégie, nommée en interne unified desktop, fusionne dans une même session :
- ChatGPT — la conversation principale et la mémoire utilisateur
- Codex — l'environnement de développement et la couche computer use
- Atlas — le navigateur-agent qui exécute dans le DOM
GPT-5.5 est le modèle sous-jacent unique qui coud les trois. Quand l'utilisateur passe d'une tâche de recherche dans ChatGPT à un déploiement dans Codex à une navigation dans Atlas, le contexte n'est pas rechargé — il reste dans la même fenêtre mentale du modèle. Le parallèle évident est Claude Code dans le Mac que Claude Computer Use a annoncé l'automne dernier, mais avec le front-end grand public d'OpenAI derrière. C'est aussi la réponse directe à Codex Desktop, annoncé il y a trois jours avec 90 plugins et de la mémoire — GPT-5.5 est le cerveau que Codex Desktop attendait.
Les benchmarks — et ce qu'ils révèlent du positionnement
Les scores publiés par OpenAI racontent une histoire précise : on arrête de courir derrière SWE-Bench pure et on se positionne sur le travail réel.
| Benchmark | Score GPT-5.5 | Ce qui est mesuré |
|---|---|---|
| GDPval | 84,9 % | Qualité des livrables sur 44 métiers du knowledge work |
| OSWorld-Verified | 78,7 % | Exécution autonome dans de vrais environnements OS |
| Terminal-Bench 2.0 | 82,7 % | Capacité à conduire des sessions shell longues |
| SWE-Bench Pro | 58,6 % | Ingénierie logicielle sur tâches réelles |
| Tau2-bench Telecom | 98,0 % | Agents métier sans prompt tuning |
Le choix de ces benchmarks est délibéré. GDPval, OSWorld et Terminal-Bench mesurent l'agent — pas la complétion de snippets. Sur SWE-Bench Pro, 58,6 %, c'est honorable mais pas le podium. Pour rappel, Claude Opus 4.7 est publié à 87 % sur SWE-Bench, et Qwen 3.6 35B-A3B approche les 75 % sur la même épreuve. OpenAI accepte de ne plus être premier sur l'écriture de code pure et revendique la première place sur « l'ordinateur comme terrain d'action ». C'est un choix de marché : Anthropic pour les IDE, OpenAI pour l'écran.
Le prix doublé — et ce que ça dit du marché
La grosse surprise du lancement n'est pas technique. Elle est commerciale. GPT-5.5 est deux fois plus cher à l'API que GPT-5.4 :
| Modèle | Input ($/M tokens) | Output ($/M tokens) |
|---|---|---|
| GPT-5.4 | 2,50 | 15,00 |
| GPT-5.5 | 5,00 | 30,00 |
| GPT-5.5 Pro | 30,00 | 180,00 |
Dans un marché où Qwen 3.6 est open-source sous Apache 2.0 et où Gemini 2.5 Flash descend en dessous du dollar par million d'input tokens, doubler le prix est un pari. OpenAI le justifie par une efficacité de raisonnement supérieure — « moins de tokens pour une meilleure réponse » — et par la valeur créée pour les cas d'usage agentiques. Autrement dit : le prix au token devient un mauvais signal, ce qui compte c'est le prix à la tâche accomplie. C'est la même ligne éditoriale qu'Anthropic suit en refusant la valorisation à 800 milliards pour préserver sa trajectoire prix — personne n'a envie d'être Uber 2015 en 2026.
Mémoire, outils, GPT-5.5 Pro
Trois éléments sous-estimés du lancement méritent d'être listés :
La mémoire de session étendue. GPT-5.5 garde en contexte une session de plusieurs heures sans resumer agressif. C'est le prérequis pour qu'un agent de programmation ne redemande pas « dans quel fichier déjà ? » après quatre appels d'outils.
Le switch d'outils piloté par le modèle. Plutôt que de laisser l'orchestrateur appeler les outils en boucle externe, GPT-5.5 décide lui-même quand appeler l'atlas, le terminal, l'éditeur, ou le file system. L'orchestrateur devient une garde-fou, plus un routeur.
GPT-5.5 Pro — réservé aux tâches longues. Le tier Pro à 30 $ / 180 $ est positionné sur les recherches scientifiques, les rapports multi-étapes, les audits. C'est le seul modèle du line-up à pouvoir maintenir une chaîne de raisonnement de plus de douze outils sans perte de cohérence, d'après les chiffres internes d'OpenAI.
Disponibilité et déploiement
Le modèle est disponible depuis le 23 avril 2026 sur les tiers Plus, Pro, Business et Enterprise de ChatGPT. La variante Pro est réservée aux tiers Pro, Business et Enterprise. L'API est ouverte dès le jour du lancement, sans liste d'attente.
Côté infrastructure, GPT-5.5 tourne sur les clusters Nvidia que NeoCognition et d'autres sont aussi en train de remplir — la pénurie de GPU n'est toujours pas résolue, mais OpenAI a sécurisé assez de capacité pour un déploiement mondial le jour 1. C'est la seule manière de défendre un prix doublé : rendre la disponibilité un argument.
Le positionnement vs Claude, Gemini, Qwen
| Axe | GPT-5.5 | Claude Opus 4.7 | Gemini 2.5 Pro | Qwen 3.6 |
|---|---|---|---|---|
| SWE-Bench | 58,6 % (Pro) | 87 % | ~72 % | ~75 % |
| Computer Use | 78,7 % OSWorld | Bon | Project Mariner | Limité |
| Prix input | 5,00 $ | 3,00 $ | 1,25 $ | Open-source |
| Licence | Propriétaire | Propriétaire | Propriétaire | Apache 2.0 |
| Stratégie | Super app consumer | API + enterprise | Full-stack cloud | Open-weight |
OpenAI choisit d'être le modèle de la surface grand public. Claude reste le modèle des IDE. Gemini est le modèle du cloud enterprise, comme l'a confirmé Google Cloud Next 2026 avec Gemini Enterprise Agent Platform et le protocole A2A en production chez 150 organisations. Et Qwen est le modèle des équipes qui refusent de payer une API. Le paysage se segmente enfin par cas d'usage, pas par « qui a le plus gros benchmark ».
Ce que ça signifie pour les développeurs et les publishers
Pour les développeurs qui construisent des apps IA, trois conséquences :
Le prompt engineering pour l'agent devient un métier. GPT-5.5 excelle sur les tâches mal spécifiées mais s'effondre sur les orchestrations mal décrites. L'écart entre un agent qui livre et un agent qui tourne en rond se creuse.
Le prix au token cesse d'être le KPI pertinent. Les équipes produit vont tracker le « prix à la tâche accomplie », qui inclut les retries, le contexte, la mémoire. Celles qui l'ont déjà compris sont celles qui monétisent leurs apps IA avec @idlen/chat-sdk — où chaque token inutilisé par l'utilisateur ne disparaît pas, il capitalise.
L'agent devient l'unité d'abonnement. ChatGPT Pro à 200 $/mois avec GPT-5.5 Pro illimité n'est pas un prix, c'est un abonnement à la production d'un agent permanent. Lovable, Cursor et Emergent suivent déjà cette ligne. OpenAI vient de la normaliser côté grand public.
En résumé :
- OpenAI a lancé GPT-5.5 le 23 avril 2026 — premier modèle entièrement réentraîné depuis GPT-4.5.
- Benchmarks clés : 84,9 % sur GDPval, 78,7 % sur OSWorld-Verified, 82,7 % sur Terminal-Bench 2.0, 98,0 % sur Tau2-bench Telecom, 58,6 % sur SWE-Bench Pro.
- Prix API doublé : 5 $ / 30 $ par million de tokens (10 $ / 60 $ pour Pro), avec la variante GPT-5.5 Pro à 30 $ / 180 $.
- La super app fusionne ChatGPT, Codex et Atlas sous un seul modèle et une seule session.
- Disponible dès le jour 1 sur Plus, Pro, Business, Enterprise et l'API.
- Positionnement : OpenAI concède SWE-Bench à Claude et revendique la première place sur l'ordinateur comme terrain d'action.
GPT-5.5 est un pari sur la forme, pas sur le modèle. OpenAI a compris que l'intelligence brute ne gagne plus de parts de marché — c'est l'intégration dans la vie quotidienne du développeur, du knowledge worker, du chercheur qui fait la différence. La super app ChatGPT + Codex + Atlas est l'incarnation de ce pari. Reste à voir si les entreprises acceptent de payer deux fois le prix pour un modèle qui fait 58 % sur SWE-Bench quand Claude Opus 4.7 en fait 87 %. La réponse arrivera avec les chiffres de revenus du Q2 2026.
Sources :
- Introducing GPT-5.5 — OpenAI
- OpenAI releases GPT-5.5, bringing company one step closer to an AI 'super app' — TechCrunch
- OpenAI's New GPT-5.5 Powers Codex on NVIDIA Infrastructure — NVIDIA Blog
- OpenAI launches GPT-5.5, its first fully retrained base model since GPT-4.5 — The Next Web
- OpenAI unveils GPT-5.5, claims a "new class of intelligence" at double the API price — The Decoder
- GPT-5.5 Pricing: Full Breakdown — Apidog


