DeepSeek V4 est-il vraiment gratuit ?

Les poids du modèle sont publiés sous licence MIT : téléchargement, modification et déploiement en self-hosting sont gratuits. En revanche, si vous passez par l'API hébergée par DeepSeek, vous payez à l'usage : 0,14 $/M tokens en entrée pour V4-Flash, 1,74 $ pour V4-Pro. Le self-hosting implique aussi un coût d'infrastructure (serveurs GPU).

Peut-on utiliser DeepSeek V4 en conformité avec le RGPD ?

Via l'API officielle, les données transitent par des serveurs en Chine — ce qui pose un problème de transfert hors UE. La solution conforme : déployer le modèle en self-hosting sur des serveurs européens (OVH, Scaleway, AWS eu-west). La licence MIT le permet sans restriction.

DeepSeek V4 remplace-t-il ChatGPT ou Claude pour une PME ?

Pour des tâches de code, d'analyse documentaire et de traitement en volume, V4-Pro offre des performances comparables à un septième du prix. Pour les workflows « agentiques » (enchaînement d'actions autonomes dans des outils), GPT-5.5 et Claude Opus gardent l'avantage. Le choix dépend de votre cas d'usage principal.

Quelle est la différence entre V4-Flash et V4-Pro ?

V4-Flash est le modèle compact (284 Md paramètres, 13 Md actifs) conçu pour les tâches rapides à haut volume : classification, résumé, tri. V4-Pro est le modèle flagship (1 600 Md paramètres, 49 Md actifs) pour les tâches complexes : code, raisonnement, analyse longue. Les deux ont un contexte d'1 million de tokens.

Le lien avec Huawei pose-t-il un risque pour les entreprises européennes ?

En pratique, non. Le modèle tourne sur n'importe quel GPU compatible (Nvidia, AMD). L'optimisation Huawei Ascend concerne surtout le marché chinois. Le risque réputationnel ne se pose que si vous achetez spécifiquement du matériel Huawei pour le faire tourner — ce qui ne sera le cas de quasiment aucune PME européenne.

DeepSeek V4 : open source, 7x moins cher que GPT-5.5

Le 24 avril 2026, pendant qu'OpenAI faisait la promo de GPT-5.5, DeepSeek a lâché ses deux nouveaux modèles V4 — Flash et Pro — sous licence MIT. Traduction : n'importe quelle entreprise peut les télécharger, les modifier, les héberger en interne, sans payer un centime de licence. Le timing n'est pas un hasard.

Pour un dirigeant de PME ou un freelance technique, la question est directe : faut-il s'intéresser à un modèle chinois open source quand on a déjà ChatGPT ou Claude ? La réponse courte : oui, et voici pourquoi.

Les chiffres qui comptent : benchmarks et tarifs face à face

Commençons par ce qui tranche. D'après VentureBeat, DeepSeek V4-Pro affiche 80,6 % sur SWE-bench Verified, le benchmark de référence pour la résolution autonome de bugs logiciels. Claude Opus 4.6 est à 80,8 %. L'écart tient dans l'épaisseur du trait.

Sur le code compétitif, V4-Pro prend même l'avantage : 93,5 % sur LiveCodeBench contre 88,8 % pour Claude, et un rating Codeforces de 3 206 — niveau grand maître. Sur Terminal-Bench 2.0, c'est 67,9 % contre 65,4 %.

Côté tarifs API, le tableau parle de lui-même :

Modèle	Input ($/M tokens)	Output ($/M tokens)
DeepSeek V4-Flash	0,14	0,28
DeepSeek V4-Pro	1,74	3,48
Claude Opus 4.7	5,00	25,00
GPT-5.5	5,00	30,00

V4-Pro coûte environ un septième du prix de GPT-5.5 en sortie. V4-Flash ? Moins d'un centième de Claude Opus. Avec le cache activé (réduction de 80 à 90 % sur les prompts répétés), l'écart se creuse encore : V4-Pro revient à un dixième de GPT-5.5 sur des workflows récurrents.

Nous avions détaillé la hausse de tarif d'OpenAI dans GPT-5.5 : le prix par token double, faut-il passer à la caisse ? L'arrivée de DeepSeek V4 change la donne de ce calcul.

1 600 milliards de paramètres sous le capot

V4-Pro, c'est 1 600 milliards de paramètres au total, mais seulement 49 milliards actifs par token grâce à l'architecture Mixture-of-Experts (MoE). V4-Flash suit le même principe en plus compact : 284 milliards totaux, 13 milliards actifs. Les deux modèles ont été pré-entraînés sur 33 et 32 trillions de tokens respectivement.

L'innovation clé s'appelle Compressed Sparse Attention (CSA), combinée à une Heavily Compressed Attention (HCA). Résultat concret, selon Fortune : sur une fenêtre d'un million de tokens, V4-Pro ne consomme que 27 % du calcul d'inférence et 10 % du cache KV que nécessitait V3.2 pour la même tâche. Moins de compute, moins de mémoire, moins de facture cloud.

Les deux modèles acceptent un contexte d'un million de tokens et peuvent générer jusqu'à 384 000 tokens en sortie — largement de quoi traiter un document de 500 pages ou un codebase complet en une seule passe.

Licence MIT : ce que ça signifie concrètement pour une PME

La licence MIT, c'est trois libertés qui changent tout pour une structure qui veut garder le contrôle :

Self-hosting — Vous téléchargez les poids, vous déployez sur votre propre serveur ou chez un hébergeur européen. Vos données ne sortent jamais vers un tiers. Pour une PME soumise au RGPD ou manipulant des données clients sensibles, c'est un argument de poids.
Fine-tuning libre — Vous pouvez entraîner le modèle sur vos propres documents métier (contrats, fiches produit, historique SAV) sans payer de surcoût de licence. Le résultat vous appartient.
Aucune dépendance fournisseur — Pas de risque qu'un changement de pricing ou de conditions vous coupe l'herbe sous le pied du jour au lendemain. Le code est là, publié, versionné.

Bien sûr, le self-hosting a un coût : il faut du matériel (ou du cloud) capable de faire tourner un modèle de cette taille. Pour V4-Flash et ses 13 milliards de paramètres actifs, un serveur avec un ou deux GPU A100 suffit pour de l'inférence. V4-Pro demande une infrastructure plus musclée. Mais l'option existe, et elle est gratuite côté licence.

Le facteur Huawei : signal géopolitique et risque réputationnel

DeepSeek V4 est le premier modèle de la firme explicitement optimisé pour les puces Huawei Ascend 950. Huawei a confirmé que ses supernodes Ascend supporteraient V4 nativement. Jensen Huang, patron de Nvidia, a qualifié cette avancée de « désastre » — ce qui en dit long sur l'enjeu.

Pour l'écosystème, la conséquence est double. D'un côté, DeepSeek prouve que l'IA de pointe peut tourner sans GPU Nvidia, ce qui desserre l'étau des sanctions américaines sur les exportations de puces. De l'autre, une entreprise européenne qui déploierait V4 sur des puces Huawei pourrait s'attirer des questions de conformité, selon son secteur et ses clients.

En pratique, la plupart des PME françaises utiliseront V4 via l'API DeepSeek (hébergée en Chine) ou en self-hosting sur des GPU Nvidia classiques. Le support Huawei est surtout un signal adressé au marché chinois et aux pays non-alignés. Mais il mérite d'être mentionné : il redessine la carte de la souveraineté numérique.

Où V4 excelle — et où il décroche

Soyons précis. V4-Pro brille sur le code (SWE-bench, LiveCodeBench, Codeforces) et sur les tâches de raisonnement structuré. Pour un développeur freelance ou une équipe tech de PME qui automatise des revues de code, du refactoring ou de la génération de scripts, c'est un outil crédible à un prix imbattable.

Là où V4 décroche, TechCrunch le note clairement : les tâches « agentiques » — celles où le modèle doit enchaîner des actions autonomes, naviguer dans des outils, prendre des décisions séquentielles. Sur ce terrain, GPT-5.5 et Claude Opus 4.7 gardent une avance mesurable. DeepSeek le reconnaît d'ailleurs et positionne V4 comme compatible avec des frameworks agents externes, dont Claude Code d'Anthropic.

Cas d'usage concrets pour une PME

V4-Flash (0,14 $/M tokens en entrée) convient pour le tri d'emails, la classification de tickets support, le résumé de documents — tous les workflows à haut volume et faible complexité. À ce tarif, traiter 10 000 emails de 500 mots revient à quelques centimes.

V4-Pro (1,74 $/M tokens en entrée) cible les tâches exigeantes : analyse de contrats longs, génération de code, extraction de données structurées depuis des PDF de 200 pages. Le million de tokens de contexte permet de charger un dossier complet sans découpage.

Ce que ça change dans le paysage : la pression sur les prix ne fait que commencer

Chaque sortie de DeepSeek a eu le même effet : forcer les concurrents à baisser leurs prix ou à justifier leur premium. Après DeepSeek R1 début 2025, OpenAI avait lancé GPT-4o mini. Après V3, Google avait revu les tarifs de Gemini Flash à la baisse.

Avec V4, la pression monte d'un cran. Un modèle qui frôle le state-of-the-art en codage pour un septième du prix, c'est difficile à ignorer — même pour une entreprise fidèle à l'écosystème OpenAI ou Anthropic. MIT Technology Review identifie trois raisons pour lesquelles V4 compte : la parité de performance sur le code, le prix, et la preuve que l'IA frontière peut fonctionner sans Nvidia.

Pour les PME, c'est une bonne nouvelle quoi qu'il arrive. Soit vous passez à DeepSeek et vous divisez votre facture IA par 7. Soit vous restez chez OpenAI ou Anthropic, et la concurrence de DeepSeek pousse ces derniers à baisser leurs tarifs — ce qui finira par arriver.

[[callout:À retenir : même si vous n'utilisez jamais DeepSeek directement, son existence fait baisser le prix de l'IA que vous utilisez déjà.]]

Notre avis : qui devrait regarder V4, et qui peut attendre

Foncez si vous avez une équipe technique capable de brancher une API ou de déployer un modèle en self-hosting, et que votre cas d'usage principal est le code, l'analyse documentaire ou le traitement de données à volume. Le rapport qualité-prix est actuellement sans équivalent.

Attendez si vous avez besoin d'un assistant IA « agentique » capable de naviguer seul dans vos outils (CRM, ERP, navigateur). Sur ce créneau, [[link:claude-ai|Claude]] et [[link:chatgpt|ChatGPT]] restent devant, et la différence se sent dans les workflows complexes.

Méfiez-vous si la localisation des données est critique pour votre activité. L'API DeepSeek est hébergée en Chine. Le self-hosting en Europe est possible grâce à la licence MIT, mais demande des compétences d'infra. Pour un cabinet d'avocats ou un acteur de santé, ce point n'est pas négociable.

DeepSeek V4 n'est pas le meilleur modèle du monde. Il est le meilleur modèle du monde pour son prix. Et dans une logique d'entreprise, c'est souvent ce qui compte.

DeepSeek V4 : l'IA open source qui coûte 7 fois moins cher que GPT-5.5

Les chiffres qui comptent : benchmarks et tarifs face à face

1 600 milliards de paramètres sous le capot

Licence MIT : ce que ça signifie concrètement pour une PME

Le facteur Huawei : signal géopolitique et risque réputationnel

Où V4 excelle — et où il décroche

Cas d'usage concrets pour une PME

Ce que ça change dans le paysage : la pression sur les prix ne fait que commencer

Notre avis : qui devrait regarder V4, et qui peut attendre

FAQ

Les chiffres qui comptent : benchmarks et tarifs face à face

1 600 milliards de paramètres sous le capot

Licence MIT : ce que ça signifie concrètement pour une PME

Le facteur Huawei : signal géopolitique et risque réputationnel

Où V4 excelle — et où il décroche

Cas d'usage concrets pour une PME

Ce que ça change dans le paysage : la pression sur les prix ne fait que commencer

Notre avis : qui devrait regarder V4, et qui peut attendre

FAQ

Mistral AI : de 20 à 400 M$ de revenus en un an, ce que ça change pour vous

Anthropic Managed Agents : vos agents IA en prod pour 0,08 $/h

GPT-5.5 : le prix par token double, faut-il passer à la caisse ?