Anthropic vient de frapper un grand coup. Le 29 mai 2026, l’éditeur de Claude a lancé Claude Opus 4.8, son nouveau modèle phare qui se place pour la première fois devant ChatGPT et Gemini sur la quasi-totalité des benchmarks de référence. Après plusieurs mois de domination d’OpenAI avec GPT-5 puis GPT-5.5, le rapport de force bascule à nouveau.
Pour les utilisateurs Claude Pro et Claude Enterprise, l’accès à Opus 4.8 est immédiat. Les développeurs via l’API y accèdent aussi dès aujourd’hui. On décrypte ce qui rend ce nouveau modèle différent et ce qui le place en tête.
Opus 4.8 écrase les benchmarks 2026
Les chiffres parlent d’eux-mêmes. Sur les principaux benchmarks publics, Opus 4.8 prend la tête face à GPT-5.5, Gemini Ultra 3 et DeepSeek V4 sur des marges parfois importantes.
- OSWorld-V (autonomie sur tâches Windows et Linux) : 82,3 % vs 75 % pour GPT-5.5
- SWE-bench Verified (résolution de bugs réels) : 84,7 % vs 79,2 % pour GPT-5.5
- HumanEval+ (génération de code) : 96,2 % vs 94,8 % pour GPT-5.5
- MMMU (raisonnement multimodal) : 89,1 % vs 88,4 % pour Gemini Ultra 3
- GPQA Diamond (sciences avancées) : 73,5 % vs 71 % pour GPT-5.5
Les progrès les plus visibles concernent l’autonomie sur tâches longues. Opus 4.8 enchîne plus de 30 étapes successives sans perdre le fil, là où Opus 4.7 décrochait souvent vers la 20ᵉ étape. Pour les agents IA et les workflows automatisés, c’est un bond important.
Une fenêtre de contexte qui passe à 2 millions de tokens
Anthropic double la mise sur le contexte. Opus 4.8 gère désormais 2 millions de tokens en contexte natif, soit l’équivalent d’environ 1 500 pages de texte ou de 150 000 lignes de code. Opus 4.7 plafonnait à 1 million de tokens, ce qui était déjà une référence du marché.
L’enjeu pour les développeurs et entreprises est concret : on peut désormais charger un repository complet, une base de connaissances entière ou plusieurs rapports financiers d’un coup. La compréhension de cross-références entre documents devient quasi-instantanée.
Pour rappel, GPT-5.5 plafonne à 1,5 million de tokens et Gemini Ultra 3 propose 1 million. Anthropic prend donc une longueur d’avance technique nette sur ce point.
Ce que change Opus 4.8 dans la vraie vie
Pour les utilisateurs Claude Pro
Les abonnés Pro (20 €/mois) ont accès à Opus 4.8 avec une limite de 50 messages par fenêtre de 5 heures. La rapidité de réponse a aussi été améliorée : Anthropic annonce une laténce réduite de 18 % par rapport à Opus 4.7 sur les requêtes standards.
Pour les développeurs via API
L’API Opus 4.8 est facturée 18 $ par million de tokens en entrée et 90 $ par million en sortie. C’est 15 % plus cher qu’Opus 4.7 mais les gains de performance et la fenêtre de contexte doublée justifient l’écart pour les usages exigeants.
Pour les utilisateurs gratuits
Pas d’accès direct à Opus 4.8 dans la version gratuite. Anthropic maintient Claude Haiku 4.7 comme modèle par défaut pour les comptes Free, avec un quota quotidien limité. C’est la même stratégie que OpenAI avec GPT-5.5 Instant sur le free de ChatGPT.
Pourquoi Opus 4.8 fait trembler OpenAI
Au-delà des benchmarks, Opus 4.8 confirme une tendance lourde de fond : Anthropic a résolu son problème d’échelle. Après le méga-deal signé avec SpaceX pour booster la puissance de calcul (voir notre article sur le deal Anthropic SpaceX), l’entreprise dispose désormais d’une infrastructure qui rivalise avec celle de Microsoft Azure pour OpenAI.
Le timing est aussi politique. Après avoir perdu le contrat du Pentagone face à Google (voir le dossier Pentagone Google contre Anthropic), Anthropic devait frapper fort pour reprendre la main sur le terrain de la recherche pure. C’est fait.
Pour les entreprises, le choix d’un LLM par défaut devient à nouveau stratégique. Claude Opus 4.8 prend les performances, GPT-5.5 garde l’écosystème et l’intégration Microsoft 365, Gemini Ultra 3 reste imbattable sur l’intégration Google Workspace. La concurrence n’a jamais été aussi serrée.
Faut-il basculer sur Claude Opus 4.8 dès maintenant ?
Pour les power users IA et les développeurs, la réponse est nuancée. Si on travaille sur des tâches longues, du code complexe ou des analyses multi-documents, Opus 4.8 mérite l’essai immédiat. Pour des usages plus simples (mails, synthèses, brainstorming), GPT-5.5 et Gemini Ultra 3 restent très compétitifs avec un meilleur rapport coût-efficacité.
Le vrai gagnant de cette mise à jour, c’est l’utilisateur final. La pression concurrentielle entre Anthropic, OpenAI et Google pousse les performances vers le haut sans inflation prix significative. La prochaine étape attendue : Claude Mythos, le modèle encore plus puissant qu’Anthropic teste actuellement en interne.

