Cursor 3 : on a testé l'IDE qui remplace le développeur par des agents
Agents parallèles, Design Mode, modèle maison à 90 % moins cher que Claude : ce qui change vraiment dans Cursor 3.
Cursor a lancé sa version 3 le 2 avril 2026. Nom de code interne : Glass. Et le nom est bien choisi, parce que cette mise à jour casse tout ce qu'on connaissait de l'outil. On ne parle plus d'un éditeur de code avec de l'IA dedans. On parle d'une interface où vous déléguez des tâches à des agents autonomes — et vous supervisez.
Pour un développeur freelance, un CTO de PME ou un fondateur technique, la question est directe : est-ce que Cursor 3 vaut le coup à 20 $/mois ? On a passé trois semaines dessus. Voici ce qu'on en retire.
L'Agents Window : le cœur du changement
Jusqu'ici, Cursor fonctionnait comme un VS Code dopé à l'IA. Vous codiez, l'IA complétait, suggérait, parfois refactorisait. Cursor 3 renverse le rapport : vous ne codez plus en premier. Vous assignez.
La nouvelle Agents Window s'affiche à côté de l'éditeur classique. C'est un panneau dédié où chaque agent tourne dans son propre onglet. Vous pouvez en lancer plusieurs simultanément — un qui refactorise un module, un autre qui écrit les tests, un troisième qui met à jour la doc — et suivre la progression de chacun dans une vue unifiée.
Les agents peuvent tourner sur quatre environnements distincts :
- En local sur votre machine
- Dans un worktree Git isolé (commande
/worktree), pour que les modifications n'interfèrent pas entre elles - Sur une machine distante via SSH
- Dans le cloud, sur des VMs Ubuntu dédiées
La commande /best-of-n lance la même tâche en parallèle sur plusieurs modèles. Vous comparez les résultats et gardez le meilleur. En pratique, c'est redoutablement efficace pour les refactors complexes où le premier jet n'est jamais parfait.
Le détail qui compte pour les freelances mobiles : un agent démarré en local peut être poussé dans le cloud pour continuer à tourner pendant que vous fermez le laptop. Et inversement, un agent cloud peut être rapatrié en local pour du test final. Ce va-et-vient fonctionne dans les deux sens, et c'est fluide.
Design Mode : pointer au lieu de décrire
C'est la feature qui a fait le plus de bruit sur les réseaux — et c'est justifié. Le Design Mode permet d'annoter directement des éléments d'interface dans le navigateur pour donner des instructions visuelles à l'agent.
Concrètement : vous ouvrez votre app dans le navigateur intégré, vous cliquez sur un bouton, un formulaire ou un bloc de texte, et vous dites à l'agent « change la couleur de fond » ou « ajoute un spinner ici ». L'agent sait exactement quel composant cibler dans le code. Fini les descriptions approximatives du type « le troisième bouton dans la sidebar, tu sais, celui en bleu ».
Pour un freelance qui livre des interfaces clients, le gain de temps est concret. Le client pointe, vous corrigez (ou l'agent corrige). Un cycle de feedback qui prenait 15 minutes de contexte passe à 30 secondes.
Composer 2 : le modèle maison qui bouscule les prix
Cursor ne se contente plus d'intégrer les modèles des autres. Avec Composer 2, l'équipe d'Anysphere a entraîné son propre modèle de code. Les chiffres sont parlants :
- 61,3 sur CursorBench-3 (vs 44,2 pour Composer 1.5 — soit +38,7 %)
- 73,7 sur SWE-bench Multilingual (300 tâches, 9 langages)
- 61,7 sur Terminal-Bench 2.0
En comparaison, Claude Opus 4.6 score 58,0 sur CursorBench, et GPT-5.4 mène à 75,1 sur Terminal-Bench. Composer 2 se place donc entre les deux titans — devant Anthropic, derrière OpenAI.
Mais c'est côté prix que Composer 2 frappe fort. Le modèle Standard coûte 0,50 $ par million de tokens en entrée et 2,50 $ en sortie. Comparé à Opus 4.6, c'est 90 % moins cher. Un agent qui génère 10 millions de tokens de sortie par mois revient à 25 $ sur Composer 2, contre environ 150 $ sur un modèle frontier équivalent.
En termes de vitesse : 200+ tokens par seconde en sortie, avec un time-to-first-token de 150 ms. C'est environ 3 fois plus rapide que Claude Opus 4.7 via API pour un niveau de qualité comparable en coding.
Bien sûr, Cursor continue de proposer les modèles tiers — Claude, GPT, Gemini — dans son interface. Mais avec Composer 2, la plupart des tâches de code quotidiennes n'ont plus besoin d'un modèle à 15 $/M tokens.
Tarifs : ce que vous payez vraiment
Cursor a migré vers un système de crédits mensuels depuis juin 2025. Chaque plan inclut un pool de crédits (en dollars) qui se consomme selon les modèles utilisés.
| Plan | Prix | Crédits/mois | Public cible |
|---|---|---|---|
| Hobby | Gratuit | 2 000 complétions + 50 requêtes lentes | Découverte |
| Pro | 20 $/mois | 20 $ de crédits + agents cloud + Auto illimité | Dev solo, freelance |
| Pro+ | 60 $/mois | 3× les crédits du Pro | Usage intensif |
| Ultra | 200 $/mois | 20× le Pro + accès prioritaire | Power users |
| Teams | 40 $/utilisateur/mois | Équivalent Pro + admin centralisé | Équipes techniques |
Le plan Pro à 20 $/mois est le sweet spot. Il inclut désormais les agents cloud, l'accès aux modèles frontier et le mode Auto illimité. Pour un freelance qui facture 400 € la journée, le ROI est atteint dès la première heure gagnée dans le mois. Et avec Composer 2 en modèle par défaut, le pool de 20 $ de crédits tient plus longtemps qu'avec Claude ou GPT seuls.
Le plan Teams à 40 $/utilisateur ajoute la facturation centralisée, les règles partagées et les contrôles admin — le strict nécessaire pour une PME de 5 à 50 développeurs qui veut cadrer l'usage.
Les commandes qui changent le quotidien
Au-delà de l'interface, Cursor 3 introduit des commandes slash qui méritent d'être connues :
/worktree— crée un worktree Git séparé. L'agent travaille dans un bac à sable. Les diffs sont propres à la review, pas de conflits croisés entre agents./best-of-n— lance la même tâche sur N modèles en parallèle. Vous comparez, vous choisissez./debug— l'agent génère des hypothèses, ajoute des logs, analyse le runtime et propose un fix ciblé. Sur un bug de production intermittent, ça vaut de l'or.
La mise à jour 3.2 du 24 avril a ajouté les subagents asynchrones, une expérience worktrees améliorée et le support des workspaces multi-root pour les changements cross-repos. Pour les architectures microservices, c'est un vrai déblocage.
Autre ajout notable : les canvases interactifs. L'agent peut générer des tableaux de bord, des diagrammes ou des graphiques directement dans l'IDE — utile pour du prototypage rapide ou pour visualiser des données sans quitter Cursor.
Les limites qu'il faut connaître
Après trois semaines d'usage intensif, quelques points de friction persistent.
D'abord, la courbe d'apprentissage. L'interface est plus dense qu'avant. L'Agents Window, le panneau chat classique, les tabs, le Design Mode — il faut comprendre quand utiliser quoi. Les premiers jours, on se cherche.
Ensuite, la qualité reste variable selon la tâche. Composer 2 excelle sur le refactoring, les tests et le code structuré. Sur du code métier très spécifique ou du debugging de race conditions, les modèles frontier (GPT-5.4 notamment) gardent l'avantage. La commande /best-of-n compense en partie, mais elle consomme plus de crédits.
Enfin, les agents cloud sont limités à Ubuntu. Si votre stack nécessite macOS ou Windows pour le build, vous restez en local. C'est un frein pour les développeurs iOS ou les projets .NET lourds.
Un point souvent cité dans les retours développeurs : la formulation des prompts demande de l'expérimentation. Savoir quel modèle choisir et comment structurer sa demande n'est pas immédiat. Comptez une bonne semaine avant d'être vraiment productif avec le système d'agents.
Verdict : qui devrait passer à Cursor 3 ?
Cursor 3 n'est pas une mise à jour cosmétique. C'est un changement de paradigme : vous passez de « coder avec de l'aide IA » à « diriger des agents qui codent ». Si vous êtes développeur solo ou CTO d'une petite équipe, le plan Pro à 20 $/mois avec Composer 2 offre un rapport performance/prix qu'aucun concurrent n'atteint aujourd'hui.
Pour les fondateurs non-techniques qui utilisent des outils no-code comme [[link:lovable-ai-app-builder-test-complet-pme-freelance-2026|Lovable]], Cursor 3 reste un cran au-dessus en complexité. Ce n'est pas un app builder, c'est un IDE professionnel — il faut savoir lire du code, même si on n'en écrit plus autant.
Pour les équipes qui utilisent déjà [[link:claude-connecteur-microsoft-365-gratuit-vs-copilot|Claude]] ou GitHub Copilot, Cursor 3 ne remplace pas ces outils — il les englobe. Vous pouvez utiliser Claude Opus ou GPT-5.4 depuis Cursor, tout en bénéficiant de l'orchestration multi-agents et du Design Mode par-dessus. C'est la couche de pilotage qui manquait.
Notre recommandation : essayez le plan Hobby gratuit pendant une semaine. Si vous lancez plus de 3 agents dans la journée, passez au Pro sans hésiter. Si vous restez sur du chat classique question-réponse, Cursor 2 suffisait — et la v3 aussi, puisque l'éditeur classique n'a pas disparu.