IA8 min de lecturePar Paul Lefizelier

OpenAI lance GPT-5.5 : le modèle agentique qui pose la première pierre de la super app ChatGPT + Codex + Atlas

Le 23 avril 2026, OpenAI a dévoilé GPT-5.5, son premier modèle entièrement réentraîné depuis GPT-4.5. 84,9 % sur GDPval, 78,7 % sur OSWorld, 82,7 % sur Terminal-Bench 2.0 — et un prix API doublé à 5 $ / 30 $ par million de tokens. Objectif : fusionner ChatGPT, Codex et Atlas en une seule session agentique.

OpenAI lance GPT-5.5 : le modèle agentique qui pose la première pierre de la super app ChatGPT + Codex + Atlas

OpenAI n'a plus envie de vendre un assistant. Le 23 avril 2026, la société a dévoilé GPT-5.5, présenté par Sam Altman comme « le modèle le plus intelligent et le plus intuitif » de la maison, et par Greg Brockman comme « la première brique concrète de la super app ». Sous le capot, c'est le premier modèle entièrement réentraîné depuis GPT-4.5 — pas un simple post-training appliqué à GPT-5. Et les scores sont agressifs : 84,9 % sur GDPval, 78,7 % sur OSWorld-Verified, 82,7 % sur Terminal-Bench 2.0, 98,0 % sur Tau2-bench Telecom. Le tout sur un prix API doublé — 5 $ en entrée, 30 $ en sortie par million de tokens, contre 2,50 $ / 15 $ pour GPT-5.4. Le message est clair : le token moins cher n'est plus le bon champ de bataille.

Le pari super app : une seule session, plusieurs surfaces

Depuis trois mois, OpenAI prépare quelque chose qui ne ressemble plus à une API. La stratégie, nommée en interne unified desktop, fusionne dans une même session :

  • ChatGPT — la conversation principale et la mémoire utilisateur
  • Codex — l'environnement de développement et la couche computer use
  • Atlas — le navigateur-agent qui exécute dans le DOM

GPT-5.5 est le modèle sous-jacent unique qui coud les trois. Quand l'utilisateur passe d'une tâche de recherche dans ChatGPT à un déploiement dans Codex à une navigation dans Atlas, le contexte n'est pas rechargé — il reste dans la même fenêtre mentale du modèle. Le parallèle évident est Claude Code dans le Mac que Claude Computer Use a annoncé l'automne dernier, mais avec le front-end grand public d'OpenAI derrière. C'est aussi la réponse directe à Codex Desktop, annoncé il y a trois jours avec 90 plugins et de la mémoire — GPT-5.5 est le cerveau que Codex Desktop attendait.

Les benchmarks — et ce qu'ils révèlent du positionnement

Les scores publiés par OpenAI racontent une histoire précise : on arrête de courir derrière SWE-Bench pure et on se positionne sur le travail réel.

BenchmarkScore GPT-5.5Ce qui est mesuré
GDPval84,9 %Qualité des livrables sur 44 métiers du knowledge work
OSWorld-Verified78,7 %Exécution autonome dans de vrais environnements OS
Terminal-Bench 2.082,7 %Capacité à conduire des sessions shell longues
SWE-Bench Pro58,6 %Ingénierie logicielle sur tâches réelles
Tau2-bench Telecom98,0 %Agents métier sans prompt tuning

Le choix de ces benchmarks est délibéré. GDPval, OSWorld et Terminal-Bench mesurent l'agent — pas la complétion de snippets. Sur SWE-Bench Pro, 58,6 %, c'est honorable mais pas le podium. Pour rappel, Claude Opus 4.7 est publié à 87 % sur SWE-Bench, et Qwen 3.6 35B-A3B approche les 75 % sur la même épreuve. OpenAI accepte de ne plus être premier sur l'écriture de code pure et revendique la première place sur « l'ordinateur comme terrain d'action ». C'est un choix de marché : Anthropic pour les IDE, OpenAI pour l'écran.

Le prix doublé — et ce que ça dit du marché

La grosse surprise du lancement n'est pas technique. Elle est commerciale. GPT-5.5 est deux fois plus cher à l'API que GPT-5.4 :

ModèleInput ($/M tokens)Output ($/M tokens)
GPT-5.42,5015,00
GPT-5.55,0030,00
GPT-5.5 Pro30,00180,00

Dans un marché où Qwen 3.6 est open-source sous Apache 2.0 et où Gemini 2.5 Flash descend en dessous du dollar par million d'input tokens, doubler le prix est un pari. OpenAI le justifie par une efficacité de raisonnement supérieure — « moins de tokens pour une meilleure réponse » — et par la valeur créée pour les cas d'usage agentiques. Autrement dit : le prix au token devient un mauvais signal, ce qui compte c'est le prix à la tâche accomplie. C'est la même ligne éditoriale qu'Anthropic suit en refusant la valorisation à 800 milliards pour préserver sa trajectoire prix — personne n'a envie d'être Uber 2015 en 2026.

Mémoire, outils, GPT-5.5 Pro

Trois éléments sous-estimés du lancement méritent d'être listés :

La mémoire de session étendue. GPT-5.5 garde en contexte une session de plusieurs heures sans resumer agressif. C'est le prérequis pour qu'un agent de programmation ne redemande pas « dans quel fichier déjà ? » après quatre appels d'outils.

Le switch d'outils piloté par le modèle. Plutôt que de laisser l'orchestrateur appeler les outils en boucle externe, GPT-5.5 décide lui-même quand appeler l'atlas, le terminal, l'éditeur, ou le file system. L'orchestrateur devient une garde-fou, plus un routeur.

GPT-5.5 Pro — réservé aux tâches longues. Le tier Pro à 30 $ / 180 $ est positionné sur les recherches scientifiques, les rapports multi-étapes, les audits. C'est le seul modèle du line-up à pouvoir maintenir une chaîne de raisonnement de plus de douze outils sans perte de cohérence, d'après les chiffres internes d'OpenAI.

Disponibilité et déploiement

Le modèle est disponible depuis le 23 avril 2026 sur les tiers Plus, Pro, Business et Enterprise de ChatGPT. La variante Pro est réservée aux tiers Pro, Business et Enterprise. L'API est ouverte dès le jour du lancement, sans liste d'attente.

Côté infrastructure, GPT-5.5 tourne sur les clusters Nvidia que NeoCognition et d'autres sont aussi en train de remplir — la pénurie de GPU n'est toujours pas résolue, mais OpenAI a sécurisé assez de capacité pour un déploiement mondial le jour 1. C'est la seule manière de défendre un prix doublé : rendre la disponibilité un argument.

Le positionnement vs Claude, Gemini, Qwen

AxeGPT-5.5Claude Opus 4.7Gemini 2.5 ProQwen 3.6
SWE-Bench58,6 % (Pro)87 %~72 %~75 %
Computer Use78,7 % OSWorldBonProject MarinerLimité
Prix input5,00 $3,00 $1,25 $Open-source
LicencePropriétairePropriétairePropriétaireApache 2.0
StratégieSuper app consumerAPI + enterpriseFull-stack cloudOpen-weight

OpenAI choisit d'être le modèle de la surface grand public. Claude reste le modèle des IDE. Gemini est le modèle du cloud enterprise, comme l'a confirmé Google Cloud Next 2026 avec Gemini Enterprise Agent Platform et le protocole A2A en production chez 150 organisations. Et Qwen est le modèle des équipes qui refusent de payer une API. Le paysage se segmente enfin par cas d'usage, pas par « qui a le plus gros benchmark ».

Ce que ça signifie pour les développeurs et les publishers

Pour les développeurs qui construisent des apps IA, trois conséquences :

Le prompt engineering pour l'agent devient un métier. GPT-5.5 excelle sur les tâches mal spécifiées mais s'effondre sur les orchestrations mal décrites. L'écart entre un agent qui livre et un agent qui tourne en rond se creuse.

Le prix au token cesse d'être le KPI pertinent. Les équipes produit vont tracker le « prix à la tâche accomplie », qui inclut les retries, le contexte, la mémoire. Celles qui l'ont déjà compris sont celles qui monétisent leurs apps IA avec @idlen/chat-sdk — où chaque token inutilisé par l'utilisateur ne disparaît pas, il capitalise.

L'agent devient l'unité d'abonnement. ChatGPT Pro à 200 $/mois avec GPT-5.5 Pro illimité n'est pas un prix, c'est un abonnement à la production d'un agent permanent. Lovable, Cursor et Emergent suivent déjà cette ligne. OpenAI vient de la normaliser côté grand public.


En résumé :

  • OpenAI a lancé GPT-5.5 le 23 avril 2026 — premier modèle entièrement réentraîné depuis GPT-4.5.
  • Benchmarks clés : 84,9 % sur GDPval, 78,7 % sur OSWorld-Verified, 82,7 % sur Terminal-Bench 2.0, 98,0 % sur Tau2-bench Telecom, 58,6 % sur SWE-Bench Pro.
  • Prix API doublé : 5 $ / 30 $ par million de tokens (10 $ / 60 $ pour Pro), avec la variante GPT-5.5 Pro à 30 $ / 180 $.
  • La super app fusionne ChatGPT, Codex et Atlas sous un seul modèle et une seule session.
  • Disponible dès le jour 1 sur Plus, Pro, Business, Enterprise et l'API.
  • Positionnement : OpenAI concède SWE-Bench à Claude et revendique la première place sur l'ordinateur comme terrain d'action.

GPT-5.5 est un pari sur la forme, pas sur le modèle. OpenAI a compris que l'intelligence brute ne gagne plus de parts de marché — c'est l'intégration dans la vie quotidienne du développeur, du knowledge worker, du chercheur qui fait la différence. La super app ChatGPT + Codex + Atlas est l'incarnation de ce pari. Reste à voir si les entreprises acceptent de payer deux fois le prix pour un modèle qui fait 58 % sur SWE-Bench quand Claude Opus 4.7 en fait 87 %. La réponse arrivera avec les chiffres de revenus du Q2 2026.

Sources :

#openai #gpt-5-5 #chatgpt #codex #atlas-browser #super-app #agentic-ai #agent #computer-use #gpt-5