Cursor 3 : on a testé l'IDE qui remplace le développeur par des agents

Agents parallèles, Design Mode, modèle maison à 90 % moins cher que Claude : ce qui change vraiment dans Cursor 3.

Interface de Cursor 3 montrant plusieurs agents IA travaillant en parallèle dans l'Agents Window

Cursor a lancé sa version 3 le 2 avril 2026. Nom de code interne : Glass. Et le nom est bien choisi, parce que cette mise à jour casse tout ce qu'on connaissait de l'outil. On ne parle plus d'un éditeur de code avec de l'IA dedans. On parle d'une interface où vous déléguez des tâches à des agents autonomes — et vous supervisez.

Pour un développeur freelance, un CTO de PME ou un fondateur technique, la question est directe : est-ce que Cursor 3 vaut le coup à 20 $/mois ? On a passé trois semaines dessus. Voici ce qu'on en retire.

L'Agents Window : le cœur du changement

Jusqu'ici, Cursor fonctionnait comme un VS Code dopé à l'IA. Vous codiez, l'IA complétait, suggérait, parfois refactorisait. Cursor 3 renverse le rapport : vous ne codez plus en premier. Vous assignez.

La nouvelle Agents Window s'affiche à côté de l'éditeur classique. C'est un panneau dédié où chaque agent tourne dans son propre onglet. Vous pouvez en lancer plusieurs simultanément — un qui refactorise un module, un autre qui écrit les tests, un troisième qui met à jour la doc — et suivre la progression de chacun dans une vue unifiée.

Les agents peuvent tourner sur quatre environnements distincts :

  • En local sur votre machine
  • Dans un worktree Git isolé (commande /worktree), pour que les modifications n'interfèrent pas entre elles
  • Sur une machine distante via SSH
  • Dans le cloud, sur des VMs Ubuntu dédiées

La commande /best-of-n lance la même tâche en parallèle sur plusieurs modèles. Vous comparez les résultats et gardez le meilleur. En pratique, c'est redoutablement efficace pour les refactors complexes où le premier jet n'est jamais parfait.

Le détail qui compte pour les freelances mobiles : un agent démarré en local peut être poussé dans le cloud pour continuer à tourner pendant que vous fermez le laptop. Et inversement, un agent cloud peut être rapatrié en local pour du test final. Ce va-et-vient fonctionne dans les deux sens, et c'est fluide.

Design Mode : pointer au lieu de décrire

C'est la feature qui a fait le plus de bruit sur les réseaux — et c'est justifié. Le Design Mode permet d'annoter directement des éléments d'interface dans le navigateur pour donner des instructions visuelles à l'agent.

Concrètement : vous ouvrez votre app dans le navigateur intégré, vous cliquez sur un bouton, un formulaire ou un bloc de texte, et vous dites à l'agent « change la couleur de fond » ou « ajoute un spinner ici ». L'agent sait exactement quel composant cibler dans le code. Fini les descriptions approximatives du type « le troisième bouton dans la sidebar, tu sais, celui en bleu ».

Pour un freelance qui livre des interfaces clients, le gain de temps est concret. Le client pointe, vous corrigez (ou l'agent corrige). Un cycle de feedback qui prenait 15 minutes de contexte passe à 30 secondes.

Composer 2 : le modèle maison qui bouscule les prix

Cursor ne se contente plus d'intégrer les modèles des autres. Avec Composer 2, l'équipe d'Anysphere a entraîné son propre modèle de code. Les chiffres sont parlants :

  • 61,3 sur CursorBench-3 (vs 44,2 pour Composer 1.5 — soit +38,7 %)
  • 73,7 sur SWE-bench Multilingual (300 tâches, 9 langages)
  • 61,7 sur Terminal-Bench 2.0

En comparaison, Claude Opus 4.6 score 58,0 sur CursorBench, et GPT-5.4 mène à 75,1 sur Terminal-Bench. Composer 2 se place donc entre les deux titans — devant Anthropic, derrière OpenAI.

Mais c'est côté prix que Composer 2 frappe fort. Le modèle Standard coûte 0,50 $ par million de tokens en entrée et 2,50 $ en sortie. Comparé à Opus 4.6, c'est 90 % moins cher. Un agent qui génère 10 millions de tokens de sortie par mois revient à 25 $ sur Composer 2, contre environ 150 $ sur un modèle frontier équivalent.

En termes de vitesse : 200+ tokens par seconde en sortie, avec un time-to-first-token de 150 ms. C'est environ 3 fois plus rapide que Claude Opus 4.7 via API pour un niveau de qualité comparable en coding.

Bien sûr, Cursor continue de proposer les modèles tiers — Claude, GPT, Gemini — dans son interface. Mais avec Composer 2, la plupart des tâches de code quotidiennes n'ont plus besoin d'un modèle à 15 $/M tokens.

Tarifs : ce que vous payez vraiment

Cursor a migré vers un système de crédits mensuels depuis juin 2025. Chaque plan inclut un pool de crédits (en dollars) qui se consomme selon les modèles utilisés.

PlanPrixCrédits/moisPublic cible
HobbyGratuit2 000 complétions + 50 requêtes lentesDécouverte
Pro20 $/mois20 $ de crédits + agents cloud + Auto illimitéDev solo, freelance
Pro+60 $/mois3× les crédits du ProUsage intensif
Ultra200 $/mois20× le Pro + accès prioritairePower users
Teams40 $/utilisateur/moisÉquivalent Pro + admin centraliséÉquipes techniques

Le plan Pro à 20 $/mois est le sweet spot. Il inclut désormais les agents cloud, l'accès aux modèles frontier et le mode Auto illimité. Pour un freelance qui facture 400 € la journée, le ROI est atteint dès la première heure gagnée dans le mois. Et avec Composer 2 en modèle par défaut, le pool de 20 $ de crédits tient plus longtemps qu'avec Claude ou GPT seuls.

Le plan Teams à 40 $/utilisateur ajoute la facturation centralisée, les règles partagées et les contrôles admin — le strict nécessaire pour une PME de 5 à 50 développeurs qui veut cadrer l'usage.

Les commandes qui changent le quotidien

Au-delà de l'interface, Cursor 3 introduit des commandes slash qui méritent d'être connues :

  • /worktree — crée un worktree Git séparé. L'agent travaille dans un bac à sable. Les diffs sont propres à la review, pas de conflits croisés entre agents.
  • /best-of-n — lance la même tâche sur N modèles en parallèle. Vous comparez, vous choisissez.
  • /debug — l'agent génère des hypothèses, ajoute des logs, analyse le runtime et propose un fix ciblé. Sur un bug de production intermittent, ça vaut de l'or.

La mise à jour 3.2 du 24 avril a ajouté les subagents asynchrones, une expérience worktrees améliorée et le support des workspaces multi-root pour les changements cross-repos. Pour les architectures microservices, c'est un vrai déblocage.

Autre ajout notable : les canvases interactifs. L'agent peut générer des tableaux de bord, des diagrammes ou des graphiques directement dans l'IDE — utile pour du prototypage rapide ou pour visualiser des données sans quitter Cursor.

Les limites qu'il faut connaître

Après trois semaines d'usage intensif, quelques points de friction persistent.

D'abord, la courbe d'apprentissage. L'interface est plus dense qu'avant. L'Agents Window, le panneau chat classique, les tabs, le Design Mode — il faut comprendre quand utiliser quoi. Les premiers jours, on se cherche.

Ensuite, la qualité reste variable selon la tâche. Composer 2 excelle sur le refactoring, les tests et le code structuré. Sur du code métier très spécifique ou du debugging de race conditions, les modèles frontier (GPT-5.4 notamment) gardent l'avantage. La commande /best-of-n compense en partie, mais elle consomme plus de crédits.

Enfin, les agents cloud sont limités à Ubuntu. Si votre stack nécessite macOS ou Windows pour le build, vous restez en local. C'est un frein pour les développeurs iOS ou les projets .NET lourds.

Un point souvent cité dans les retours développeurs : la formulation des prompts demande de l'expérimentation. Savoir quel modèle choisir et comment structurer sa demande n'est pas immédiat. Comptez une bonne semaine avant d'être vraiment productif avec le système d'agents.

Verdict : qui devrait passer à Cursor 3 ?

Cursor 3 n'est pas une mise à jour cosmétique. C'est un changement de paradigme : vous passez de « coder avec de l'aide IA » à « diriger des agents qui codent ». Si vous êtes développeur solo ou CTO d'une petite équipe, le plan Pro à 20 $/mois avec Composer 2 offre un rapport performance/prix qu'aucun concurrent n'atteint aujourd'hui.

Pour les fondateurs non-techniques qui utilisent des outils no-code comme [[link:lovable-ai-app-builder-test-complet-pme-freelance-2026|Lovable]], Cursor 3 reste un cran au-dessus en complexité. Ce n'est pas un app builder, c'est un IDE professionnel — il faut savoir lire du code, même si on n'en écrit plus autant.

Pour les équipes qui utilisent déjà [[link:claude-connecteur-microsoft-365-gratuit-vs-copilot|Claude]] ou GitHub Copilot, Cursor 3 ne remplace pas ces outils — il les englobe. Vous pouvez utiliser Claude Opus ou GPT-5.4 depuis Cursor, tout en bénéficiant de l'orchestration multi-agents et du Design Mode par-dessus. C'est la couche de pilotage qui manquait.

Notre recommandation : essayez le plan Hobby gratuit pendant une semaine. Si vous lancez plus de 3 agents dans la journée, passez au Pro sans hésiter. Si vous restez sur du chat classique question-réponse, Cursor 2 suffisait — et la v3 aussi, puisque l'éditeur classique n'a pas disparu.

FAQ

Cursor 3 est-il gratuit ?
Oui, le plan Hobby est gratuit avec 2 000 complétions et 50 requêtes lentes par mois. C'est suffisant pour tester l'outil, mais pas pour un usage professionnel quotidien. Le plan Pro à 20 $/mois (environ 18,50 €) débloque les agents cloud, les modèles frontier et le mode Auto illimité.
Cursor 3 peut-il remplacer GitHub Copilot ?
Pour la complétion de code simple, les deux se valent. Mais Cursor 3 va beaucoup plus loin avec les agents parallèles, le Design Mode et le modèle Composer 2 intégré. Si vous cherchez un simple assistant de complétion, Copilot suffit. Si vous voulez déléguer des tâches entières à des agents autonomes, Cursor 3 est dans une autre catégorie.
Faut-il savoir coder pour utiliser Cursor 3 ?
Oui. Cursor 3 reste un IDE professionnel basé sur VS Code. Même si les agents écrivent le code, vous devez pouvoir lire, comprendre et valider ce qu'ils produisent. Pour les non-développeurs, des outils comme Lovable ou Bolt.new sont plus adaptés.
Composer 2 est-il meilleur que Claude Opus 4.6 pour coder ?
Sur CursorBench-3, Composer 2 (61,3) devance Claude Opus 4.6 (58,0). En revanche, GPT-5.4 reste devant sur Terminal-Bench 2.0. L'avantage principal de Composer 2 est son coût : 90 % moins cher par token. Pour le code quotidien, Composer 2 offre le meilleur ratio qualité/prix. Pour les tâches de raisonnement complexe, Claude ou GPT restent pertinents.
Les agents cloud Cursor sont-ils sécurisés pour du code propriétaire ?
Les agents cloud tournent sur des VMs Ubuntu isolées. Cursor propose un plan Teams avec contrôles admin et règles partagées pour les entreprises. Pour les PME soumises à des contraintes réglementaires strictes, le mode local ou SSH vers vos propres serveurs reste l'option la plus sûre.
Partager