Anthropic a récemment introduit Claude Opus 4.7, un modèle d’intelligence artificielle conçu pour améliorer la gestion des tâches de programmation complexes. Ce système analyse minutieusement les instructions et développe des mécanismes internes pour vérifier ses résultats avant de les présenter au programmeur.
Testé sur des plateformes standardisées, Opus 4.7 a surpassé la version précédente, obtenant un score de 64,3 % en écriture autonome de code sur le module SWE-bench Pro. Sur SWE-bench Verified, l’efficacité a atteint 87,6 %, rivalisant avec les meilleures solutions du marché.
Améliorations en vision par ordinateur et analyse financière
Opus 4.7 bénéficie également d’une mise à jour en vision par ordinateur, capable d’interpréter des images jusqu’à 2 576 pixels, soit 6,6 mégapixels. Cette capacité accrue permet une analyse précise des diagrammes et captures d’écran complexes.
Le modèle excelle aussi dans l’analyse des données économiques et juridiques, comme le montrent les évaluations GDPVal-AA. Sa mémoire basée sur le système de fichiers lui permet de conserver des notes importantes lors de sessions prolongées, préservant le contexte initial du projet.
Sécurité accrue grâce à Project Glasswing
Aligné avec l’initiative Project Glasswing, Opus 4.7 intègre des filtres automatiques de sécurité pour bloquer instantanément les requêtes à risque. Bien que moins performant que le futur modèle Mythos, Opus 4.7 sert de terrain d’essai pour ces nouveaux mécanismes de protection.
L’interface inclut désormais le mode « xhigh », optimisant la latence et la profondeur du raisonnement AI. La commande « /ultrareview » permet une révision approfondie pour identifier les problèmes architecturaux et de conception du code.
Considérations financières et gestion des ressources
D’un point de vue financier, Anthropic maintient sa structure tarifaire : 5 dollars pour un million de tokens introduits et 15 dollars pour la même quantité générée. Cependant, le nouveau module génère jusqu’à 35 % de tokens supplémentaires pour les mêmes données, influençant potentiellement les budgets d’exploitation.
