ChatGPT Images 2.0 : créez vos visuels pro en 5 prompts

Le guide pas à pas pour produire photos produit, posts réseaux sociaux et slides sans graphiste

Écran de ChatGPT affichant un prompt de génération d'image marketing avec le résultat visuel à côté

Depuis le 21 avril, ChatGPT embarque GPT-image-2, le nouveau moteur de génération d'images d'OpenAI. Résolution native 2K, rendu de texte fiable à plus de 95 %, jusqu'à huit images par prompt : sur le papier, c'est un outil de production, plus un gadget. Nous avons passé trois jours à le tester sur des cas concrets de PME et de freelances. Voici cinq prompts qui fonctionnent — et les pièges à éviter.

Si vous avez lu notre article ChatGPT Images 2.0 : vos visuels marketing en 30 secondes, vous connaissez les grandes lignes. Ici, on passe à la pratique.

Ce qu'il faut savoir avant de commencer

GPT-image-2 fonctionne directement dans ChatGPT. Pas d'API à configurer, pas d'extension à installer. Vous tapez un prompt, vous récupérez une image. Mais quelques règles changent la qualité du résultat du tout au tout.

La structure d'un prompt qui marche

Oubliez les prompts d'une ligne. Un prompt efficace pour GPT-image-2 comporte cinq couches, dans cet ordre :

  1. Style ou medium de référence — « photographie de studio », « flat design vectoriel », « illustration aquarelle »
  2. Sujet détaillé — couleurs, matériaux, dimensions, texte exact à afficher
  3. Cadrage et composition — angle de prise de vue, règle des tiers, marges
  4. Éclairage et colorimétrie — type de lumière, température, dominante
  5. Contraintes négatives — ce que vous ne voulez pas (ombres dures, arrière-plan chargé, texte supplémentaire)

Ce n'est pas de la magie. C'est de la direction artistique condensée en texte. Plus vous êtes précis sur ces cinq points, moins vous perdez de temps en itérations.

Accès et limites concrètes

GPT-image-2 est accessible à tous les abonnés ChatGPT Plus (20 $/mois), Pro et Business. Les utilisateurs gratuits disposent d'environ deux images par jour — autant dire que c'est inutilisable en production. Sur Plus, comptez environ 50 images par tranche de 3 heures, soit 180 à 200 par jour. Largement suffisant pour une journée de création intensive.

Côté API (ouverture prévue début mai 2026), le coût tourne entre 0,04 $ et 0,35 $ par image selon la résolution et la complexité du prompt. En batch, OpenAI propose une réduction de 50 %.

Prompt 1 — Photo produit e-commerce sur fond blanc

C'est le cas d'usage qui fait économiser le plus d'argent immédiatement. Un shooting studio pour un catalogue e-commerce coûte entre 15 € et 50 € par photo. Avec GPT-image-2, le coût tombe à zéro (hors abonnement) et le résultat est souvent publiable tel quel.

[[terminal:Photographie de studio professionnelle d'une paire de baskets blanches minimalistes, posée sur un fond blanc pur (#FFFFFF). Éclairage softbox principal à 45° à gauche, lumière de remplissage douce à droite, rim light subtile à 210° pour détacher le produit du fond. Angle de prise de vue à 30° pour montrer la profondeur et le volume. Mise au point nette sur l'intégralité du produit, texture du cuir visible. Format carré 1:1, résolution maximale. Pas d'ombre portée dure, pas de reflet parasite, pas d'élément décoratif.]]

Trois détails qui changent tout dans ce prompt :

  • Les angles d'éclairage en degrés — GPT-image-2 respecte la géométrie lumineuse si vous la spécifiez. « Éclairage doux » seul donne des résultats aléatoires.
  • Le code couleur hexadécimal du fond — #FFFFFF force un blanc pur, utile pour un détourage propre sur Shopify ou Amazon.
  • Le format explicite — Le modèle gère les ratios de 1:3 à 3:1. Précisez 1:1 pour un carrousel Instagram, 4:5 pour un feed, 16:9 pour une bannière.

Si vous avez déjà une photo de votre produit, même médiocre, vous pouvez la joindre au prompt. GPT-image-2 supporte le mode image-vers-image : il reprend les formes et proportions de votre original pour générer une version studio.

Prompt 2 — Post LinkedIn à charte graphique imposée

Créer un visuel LinkedIn qui respecte votre charte sans ouvrir Canva, c'est possible. Mais il faut nourrir le modèle avec vos contraintes de marque.

[[terminal:Visuel carré 1080x1080 px pour un post LinkedIn. Style flat design corporate, épuré. Fond bleu marine (#1B2A4A). En haut à gauche, un pictogramme blanc de graphique en barres ascendant. Au centre, le texte « +34 % de leads en 90 jours » en police sans-serif grasse, blanc (#FFFFFF), corps 72 pt. En bas, une ligne de texte plus petite : « Étude de cas — Cabinet Durand & Associés » en gris clair (#B0B8C4), corps 24 pt. Aucun dégradé, aucun élément 3D, aucune photo. Marges intérieures de 80 px.]]

Le texte sur l'image, c'était le talon d'Achille de DALL-E 3. Avec GPT-image-2, la précision dépasse 95 % sur les caractères latins. On a testé des accents (é, è, ê), des chiffres avec le signe %, des tirets cadratins : tout passe. En revanche, au-delà de 40 caractères sur une même ligne, des coquilles apparaissent. Gardez vos textes courts.

Astuce : demandez plusieurs variantes en une seule requête. « Génère 4 variantes de ce visuel avec des palettes différentes : bleu marine, vert forêt (#2D5F2D), bordeaux (#6B1D2A) et anthracite (#333333). » GPT-image-2 peut produire jusqu'à 8 images distinctes par prompt. Idéal pour un A/B test visuel sur vos réseaux.

Prompt 3 — Bannière email promotionnelle

Les bannières email sont un format ingrat : 600 px de large, peu de hauteur, obligation d'être lisible sur mobile. Voici un prompt calibré pour ce format.

[[terminal:Bannière email horizontale, ratio 3:1 (600x200 px). Fond dégradé subtil du blanc (#FFFFFF) à gauche vers un beige chaud (#F5E6D3) à droite. À gauche, une illustration minimaliste d'un colis ouvert avec des confettis. Au centre-droit, le texte « -20 % sur votre première commande » en police serif élégante, noir (#1A1A1A), bien lisible à 14 pt effectif. Sous le texte, un bouton arrondi orange (#E8734A) avec le texte « J'en profite » en blanc. Style éditorial premium, pas de clip-art, pas de stock photo.]]

Deux mises en garde sur ce cas d'usage. D'abord, l'image générée ne sera pas un email HTML cliquable — c'est une image statique. Vous devrez l'intégrer dans votre outil d'emailing (Brevo, Mailchimp, [[link:systeme-io|Systeme.io]]) comme un visuel classique. Ensuite, vérifiez systématiquement le texte dans l'image finale. Même avec 95 % de fiabilité, les 5 % restants tombent toujours au pire moment — sur le nom de votre marque ou le montant de la promotion.

Prompt 4 — Slide de pitch deck

Les slides de pitch sont un terrain fertile pour GPT-image-2. Pas pour remplacer PowerPoint, mais pour générer les visuels de fond, les schémas conceptuels et les illustrations que vous collez ensuite dans vos présentations.

[[terminal:Slide de présentation professionnelle au format 16:9. Titre en haut à gauche : « Opportunité de marché » en police sans-serif noire, grasse, 48 pt. Au centre, un diagramme TAM/SAM/SOM avec trois cercles concentriques : le plus grand en bleu clair (#D6E4F0) annoté « TAM : 8,2 Md€ », le moyen en bleu (#4A90D9) annoté « SAM : 1,4 Md€ », le plus petit en bleu foncé (#1B4F8A) annoté « SOM : 340 M€ ». Fond blanc. En bas à droite, la source « Source : étude interne, avril 2026 » en gris, 12 pt. Style Series A, propre, sans fioritures.]]

Le résultat impressionne les investisseurs qui ne regardent pas de trop près. Mais soyons honnêtes : les proportions des cercles concentriques ne sont pas toujours mathématiquement exactes. Le diagramme sera visuellement cohérent, pas rigoureusement à l'échelle. Pour un pitch early-stage, ça passe. Pour un rapport financier, restez sur Excel + PowerPoint.

Ce qui fonctionne particulièrement bien : les slides à illustration conceptuelle. « Un entonnoir de conversion en 4 étapes avec des icônes minimalistes », « une timeline horizontale de 2024 à 2027 avec 5 jalons », « un schéma en hub-and-spoke montrant 6 intégrations autour d'un produit central ». Sur ces formats, GPT-image-2 bat Canva en vitesse et rivalise en qualité.

Prompt 5 — Déclinaison de charte graphique

Vous avez une identité visuelle et vous voulez la décliner sur plusieurs supports sans briefer un graphiste à chaque fois. Voici la méthode.

Commencez par un prompt de cadrage qui définit votre charte :

[[terminal:Tu es un directeur artistique. Voici ma charte graphique : couleur primaire bleu nuit (#0A1628), couleur secondaire corail (#FF6B5A), couleur neutre gris perle (#F2F0ED). Police titres : sans-serif géométrique grasse. Police corps : sans-serif légère. Style général : minimaliste, aéré, premium. Logo : le mot « Aélio » en bleu nuit, avec un accent stylisé sur le « é » en corail. Retiens ces éléments pour toutes les images que je vais te demander.]]

Ensuite, chaque prompt suivant dans la même conversation héritera de ce contexte. « Génère une couverture d'ebook au format portrait avec le titre 'Guide pratique du recrutement IA' », « Crée un header de site web 1920x400 avec le slogan 'Recrutez mieux, plus vite' », « Fais un avatar rond pour nos réseaux sociaux avec les initiales AE ». La cohérence entre les visuels sera nettement meilleure que si vous partiez de zéro à chaque prompt.

La limite : GPT-image-2 ne sait pas reproduire un logo existant avec précision. Si vous collez votre logo dans le chat, il en reproduira une approximation, pas une copie pixel-perfect. Pour un logo complexe (dégradés, symbole détaillé), superposez-le en post-production dans Figma ou même dans Google Slides. Ne comptez pas sur le modèle pour ça.

Les erreurs qui font perdre du temps

Après trois jours de tests intensifs, voici les quatre pièges les plus fréquents :

  • Vouloir tout dans un seul prompt. Un visuel avec un logo, un QR code, trois blocs de texte et une photo produit ? Trop ambitieux. Séparez la photo produit du texte, assemblez ensuite.
  • Oublier le format. Sans ratio explicite, GPT-image-2 choisit un format par défaut qui ne correspond jamais à votre besoin. Précisez toujours : 1:1, 4:5, 16:9, 3:1.
  • Utiliser des termes vagues. « Joli », « moderne », « professionnel » ne veulent rien dire pour un modèle. Donnez des références concrètes : « style Apple.com 2026 », « flat design à la Stripe », « photographie lifestyle Airbnb ».
  • Ne pas vérifier le texte. Même à 95 % de fiabilité, un accent manquant ou une lettre inversée arrive. Zoomez systématiquement sur chaque mot avant de publier.

Verdict : pour qui, pour quoi

GPT-image-2 ne remplace pas un directeur artistique senior sur un projet de rebranding. Il ne produit pas de fichiers vectoriels (SVG, AI). Il ne gère pas les logos complexes. Et il génère parfois des visuels « presque parfaits » — ce qui est plus dangereux qu'un résultat clairement raté, parce qu'on laisse passer la coquille.

En revanche, pour un indépendant qui publie trois posts LinkedIn par semaine, une PME qui renouvelle ses bannières email chaque mois, ou un fondateur qui prépare un pitch deck ce week-end, c'est un gain de temps massif. On parle de visuels qui prenaient 2 heures sur [[link:chatgpt|Canva]] ou coûtaient 50 € sur Fiverr, produits en 30 secondes pour le prix d'un abonnement déjà amorti par ailleurs.

Le meilleur conseil : utilisez GPT-image-2 pour le premier jet, puis peaufinez dans un outil de mise en page. La combinaison IA + retouche humaine de 5 minutes bat les deux extrêmes — tout-IA ou tout-manuel.

FAQ

ChatGPT Images 2.0 est-il inclus dans l'abonnement ChatGPT Plus à 20 $/mois ?
Oui. GPT-image-2 est accessible à tous les abonnés Plus, Pro, Business et Enterprise. Les utilisateurs gratuits ont un quota limité à environ 2 images par jour, ce qui est insuffisant pour un usage professionnel.
Combien d'images peut-on générer par jour avec ChatGPT Plus ?
Environ 50 images par tranche de 3 heures, soit 180 à 200 par jour au maximum. Le quota se renouvelle de façon glissante. En pratique, même une journée de création intensive dépasse rarement ce plafond.
Le texte généré dans les images est-il fiable ?
GPT-image-2 affiche une fiabilité supérieure à 95 % sur les caractères latins, y compris les accents français. Mais au-delà de 40 caractères par ligne, les erreurs deviennent fréquentes. Vérifiez toujours le texte avant publication.
Peut-on utiliser les images générées à des fins commerciales ?
Oui. Selon les conditions d'utilisation d'OpenAI, les images générées par ChatGPT vous appartiennent et peuvent être utilisées à des fins commerciales, y compris pour la revente, la publicité et les supports marketing.
GPT-image-2 peut-il reproduire mon logo existant ?
Non, pas fidèlement. Si vous uploadez votre logo, le modèle en produira une approximation, pas une copie exacte. Pour intégrer votre logo, générez le visuel sans logo puis superposez-le en post-production dans Figma, Canva ou Google Slides.
Partager