IA6 min de lecturePar Paul Lefizelier

Pentagone : 100 000 agents IA vibe-codés en cinq semaines sur GenAI.mil avec Gemini 3.1 Pro

Plus de 103 000 agents IA bâtis et 1,1 million de sessions enregistrées sur GenAI.mil depuis l'arrivée d'Agent Designer. Le Pentagone industrialise le vibe coding avec Google Gemini 3.1 Pro. Le ministère de la Défense américain devient l'un des plus gros utilisateurs au monde de l'agentique low-code.

Pentagone : 100 000 agents IA vibe-codés en cinq semaines sur GenAI.mil avec Gemini 3.1 Pro

Le 28 avril 2026, lors du Box Federal Summit, le Pentagone a confirmé un chiffre que peu d'entreprises privées peuvent égaler : plus de 103 000 agents IA construits et 1,1 million de sessions agent enregistrées sur GenAI.mil, sa plateforme générative interne — en moins de cinq semaines après l'arrivée d'Agent Designer de Google. Officiers, analystes et civils du Department of Defense vibe-codent en masse pour automatiser leurs workflows, du tri de documents au reporting opérationnel.

GenAI.mil, la plateforme qui change la donne

Lancée le 9 décembre 2025, GenAI.mil a accumulé 500 000 utilisateurs en une semaine et 1 million d'utilisateurs en un mois, sans latence, sans downtime. C'est l'une des adoptions enterprise les plus rapides jamais observées sur une plateforme IA, publique ou privée.

L'architecture est mixte : modèles d'Anthropic, OpenAI, Meta et désormais Google Gemini 3.1 Pro, intégrés derrière un broker maison. Les utilisateurs accèdent au tout via une interface unique. Et depuis l'ajout d'Agent Designer au catalogue, le pic d'usage a basculé vers la création d'agents.

Le « vibe coding » entre dans le DoD

Le mécanisme est exactement celui que les développeurs grand public connaissent bien depuis Lovable, Bolt et Cursor. Un officier ouvre Agent Designer, décrit en langage naturel ce qu'il veut accomplir (« crée un agent qui compile chaque matin les rapports de patrouille des dernières 24h en un brief format SITREP »), et l'outil génère l'agent en autonomie.

Pas de syntaxe, pas de SDK à apprendre, pas de tickets soumis à une équipe IT centrale. C'est l'incarnation enterprise de ce que Cursor 3 et son interface agents parallèle ont popularisé chez les développeurs civils — appliqué à un public de non-coders au sein du gouvernement.

Métrique GenAI.milValeur
Lancement9 décembre 2025
Utilisateurs (J+30)1 000 000+
Agents construits103 000+
Sessions agent1,1 million+
Modèle phareGoogle Gemini 3.1 Pro

Pourquoi Google Gemini 3.1 Pro a remporté la timeline

Gemini 3.1 Pro a été ajouté à GenAI.mil 8 semaines après son arrivée commerciale en février 2026. Selon le Pentagon AI Chief, l'objectif est explicite : éviter la dépendance à un fournisseur unique. La phrase prononcée publiquement — « relying on a single model is never a good thing » — est une critique à peine voilée du contrat exclusif que le DoD avait précédemment commencé à concentrer sur Anthropic, avant la crise Trump-Anthropic et la réconciliation Pentagone-Dario Amodei.

Google a en parallèle obtenu une extension de contrat pour déployer Gemini sur réseaux classifiés, élargissant le périmètre à « tout objectif gouvernemental légitime ». C'est un changement majeur — Google avait, pendant des années, refusé certains contrats DoD sous pression interne (épisode Project Maven).

Pourquoi 103 000 agents ne sont pas un fluke

À première vue, le chiffre paraît gonflé : la moyenne secteur privé pour des plateformes agentiques internes plafonne à quelques milliers d'agents par an, pas 100 000 en cinq semaines. Trois raisons expliquent l'envolée du DoD :

1. Une base d'utilisateurs colossale et hétérogène

Le DoD compte 2,9 millions de personnes entre militaires actifs, réservistes et civils. Chaque branche, chaque base, chaque escadrille a des workflows spécifiques. Un seul agent ne couvre qu'un cas d'usage très local — donc il faut multiplier les agents par site.

2. Un cadre déjà sécurisé

Les utilisateurs n'ont pas à se demander si l'outil est conforme : GenAI.mil est déjà accrédité sur les bons niveaux de sécurité. Cela élimine le frein principal à l'expérimentation IA en entreprise (la peur de violer une compliance).

3. Une culture d'efficacité opérationnelle

Les militaires sont entraînés à automatiser, standardiser, documenter. Le matching avec une plateforme low-code de génération d'agents est presque parfait. Là où une PME civile hésite, un sergent crée immédiatement l'agent qui élimine son tedium hebdomadaire.

Les implications pour le secteur privé

Cette adoption a trois conséquences majeures pour les éditeurs de logiciels et les startups IA :

A. Les agents low-code ne sont plus un gadget

Tant que Pentagon, Anthropic, Cursor et Lovable racontent la même histoire, c'est qu'on est entré dans la phase où n'importe quel knowledge worker peut produire son propre agent. Le rôle des éditeurs SaaS classiques se réduit ; le rôle des plateformes broker (qui orchestrent, sécurisent, monitor) explose.

B. La défense devient un marché tier 1 pour l'IA

Avec Shield AI à 2 Md$ valorisation et Scout AI qui vient de lever 100 M$ en série A pour les modèles IA dédiés à la guerre sans pilote, on assiste à une convergence : les budgets DoD se déplacent du hardware vers le software-as-a-service. L'opportunité est massive — et politiquement sensible.

C. Google reprend la main, partiellement

Pendant 18 mois, Google a paru décrocher du leadership IA face à OpenAI et Anthropic. Le contrat GenAI.mil élargi, combiné à l'investissement 40 Md$ dans Anthropic et au retour en force de Gemini Enterprise au Cloud Next 2026, trace une stratégie cohérente : Google est le plombier de l'agentique enterprise.

Les zones d'ombre

Le chiffre brut de 103 000 agents masque des questions ouvertes :

  1. Combien d'agents sont vraiment utilisés régulièrement ? Beaucoup peuvent avoir été créés en test puis abandonnés. La métrique-clé, ce sont les agent runs récurrents, pas le nombre d'agents construits.
  2. Quel est le taux d'erreur ? Un agent qui hallucine sur un brief de routine, c'est embêtant. Un agent qui hallucine sur un targeting opérationnel, c'est catastrophique. Le DoD n'a pas publié de métrique de fiabilité.
  3. Les implications éthiques. Vibe-coder un agent qui résume des rapports de patrouille est anodin. Vibe-coder un agent qui priorise des cibles ou interprète des images de drone l'est beaucoup moins. La frontière est floue.
  4. Le vendor lock-in inverse. En diversifiant ses modèles (Anthropic, OpenAI, Meta, Google), le DoD réduit le lock-in fournisseur — mais il crée un lock-in sur sa propre couche broker, qui devient infrastructure critique.

Conclusion : la plus grande expérimentation agentique du monde tourne au DoD

Aucune entreprise privée n'a réussi à mobiliser 1 million d'utilisateurs et 100 000 agents en cinq semaines. Le Pentagone vient de le faire. Que vous trouviez ça inspirant ou inquiétant, c'est la plus grande expérimentation agentique au monde, et son issue déterminera comment les agents low-code seront adoptés (ou régulés) dans le reste de la société.

Pour les développeurs et fondateurs qui veulent capter cette vague, notre guide créer une app en 24h, de l'idée au déploiement reste le point d'entrée le plus simple, et notre analyse vibe coding pour founders non techniques montre comment les non-coders construisent maintenant aussi vite que les coders.


L'adoption massive de l'agentique au DoD prouve une thèse simple : quand vous donnez à des non-développeurs un outil pour automatiser leur travail, ils en construisent plus que ce que vous pensiez possible. Le même phénomène est en train de se produire dans la finance avec Rogo et son agent Felix qui vient de lever 160 M$.

#pentagone #dod #genai-mil #vibe-coding #google-gemini #agent-designer #low-code #defense-ai