Confiance et sécurité14 juin 2026·11 min de lecture

7 erreurs de confidentialité des données qui font fuiter discrètement les données de votre entreprise via les agents IA (et comment les éviter)

Les sept erreurs de configuration et d'architecture qui font fuiter discrètement les données de l'entreprise via les agents IA, chacune avec son correctif précis, illustrées par de vrais incidents de 2025 et 2026.

Faits clés

La plupart des fuites de données via les agents IA ne viennent pas du modèle qui mémorise vos données. Elles viennent d'erreurs de configuration et d'architecture : des comptes grand public qui s'entraînent sur vos saisies, des permissions trop larges héritées par un agent, des agents exposés au public branchés sur des systèmes internes, et la triade fatale (données privées, contenu non fiable et une voie d'envoi externe) que l'injection de prompt exploite, comme dans EchoLeak (CVE-2025-32711) contre Microsoft 365 Copilot. Les correctifs sont des conditions d'entreprise sans entraînement et avec une rétention courte, un cadrage au moindre privilège qui hérite des permissions de l'utilisateur, l'isolation des données confidentielles des agents publics, et la rupture d'une jambe de la triade. Ce sont des décisions d'architecture prises avant le lancement, pas une checklist remise après coup.

Mahmoud Zalt

Fondateur et architecte IA · Sista AI

7 erreurs de confidentialité des données qui font fuiter discrètement les données de votre entreprise via les agents IA (et comment les éviter)

La plupart des fuites de données via les agents IA ne viennent pas du modèle qui mémorise secrètement votre entreprise. Elles viennent d'erreurs de configuration et d'architecture que vous pouvez nommer et corriger. Les principales : faire tourner un agent sur un compte grand public dont les réglages par défaut s'entraînent sur vos saisies, laisser un agent hériter des permissions trop larges d'une personne, brancher un agent exposé au public sur des systèmes internes, et laisser la « triade fatale » intacte (données privées, contenu non fiable et une voie d'envoi externe) pour qu'une seule injection de prompt puisse lire vos données et les expédier dehors. C'est exactement ce dernier schéma qui a permis à EchoLeak (CVE-2025-32711) d'exposer des données sensibles via Microsoft 365 Copilot à partir d'un e-mail conçu sur mesure, sans le moindre clic de l'utilisateur. Les correctifs n'ont rien d'exotique, et presque tous sont des décisions prises avant le lancement de l'agent, pas une checklist qu'on vous remet après qu'une fuite a eu lieu.

Voici la liste que nous parcourons avant d'installer un agent que nous avons construit dans la stack d'une autre entreprise, rédigée pour qu'un dirigeant non technique puisse repérer les mêmes erreurs dans sa propre configuration ou chez un prestataire. Si vous préférez que nous tenions cette ligne là où elle doit l'être pour vous, voyez comment nous assurons la gouvernance et la maîtrise des risques de l'IA responsable. Tout ce qui suit est à vous, dans un cas comme dans l'autre.

D'abord, une distinction que presque tous les articles sur le sujet brouillent, parce que se tromper là-dessus est l'erreur zéro. Il existe deux façons complètement différentes pour les données de fuir via un agent, et elles ont des correctifs complètement différents :

Le traitement des données par le fournisseur. Le fournisseur du modèle stocke-t-il ou s'entraîne-t-il sur vos saisies ? C'est un contrat que vous signez et un niveau de compte que vous choisissez. Cela se résout avec des conditions et de la configuration.
L'exfiltration à l'exécution. L'agent peut-il être trompé, au moment où il s'exécute, pour envoyer vos données là où elles ne devraient pas aller ? Cela se résout avec de l'architecture, pas avec un contrat.

Les chiffres des enquêtes montrent que les acheteurs ressentent cela même quand ils ne savent pas le nommer. Dans l'étude de Cloudera menée auprès de près de 1 500 responsables informatiques seniors dans 14 pays, 96 % prévoient d'étendre l'usage des agents IA au cours de l'année à venir, et pourtant 53 % (plus de la moitié) désignent la confidentialité des données comme leur principal obstacle à l'adoption. Les sept erreurs ci-dessous sont là où cette peur devient une vraie fuite, et là où vit le correctif.

Erreur 1 : faire tourner des agents de production sur des comptes grand public

C'est l'erreur la moins chère à commettre et la plus facile à corriger. Quelqu'un branche un flux de travail sur un compte ChatGPT personnel ou Gemini grand public parce qu'il est déjà là, et voilà que les données de votre entreprise sont régies par des conditions grand public qui n'ont jamais été pensées pour elles.

L'écart entre les offres grand public et entreprise est net. Côté entreprise, le schéma est constant d'un fournisseur à l'autre : aucun entraînement sur vos données par défaut, une fenêtre de rétention courte pour la surveillance des abus, et des options plus solides sur demande. L'API d'OpenAI conserve les données 30 jours pour la surveillance des abus puis les supprime, et ne s'entraîne pas dessus par défaut. Depuis le 14 septembre 2025, Anthropic a ramené la rétention des journaux d'API de 30 jours à 7 jours, et les entrées et sorties de l'API ne servent jamais à l'entraînement. Le Vertex AI de Google (l'offre entreprise) est configurable sans usage pour l'entraînement. Côté grand public, les réglages par défaut s'inversent : ChatGPT grand public stocke les conversations indéfiniment tant que vous ne les supprimez pas, et la rétention de Gemini grand public peut aller jusqu'à 36 mois et servir à améliorer les produits.

Le correctif : placez chaque agent de production sur une API d'entreprise ou un compte professionnel, jamais sur un identifiant personnel. La technologie est identique. Les conditions ne le sont pas, et les conditions sont toute la différence entre des données qui restent régies et des données qui deviennent discrètement du matériel d'entraînement.

Erreur 2 : les permissions trop larges héritées par l'agent

La fuite à l'exécution la plus courante n'a rien d'astucieux. On confie à un agent l'accès d'un employé, ou pire, une clé d'administrateur, si bien qu'il peut techniquement voir tout ce que cette personne peut voir. Puis on lui pose une question, ou on le trompe pour qu'il en traite une, qui dépasse de loin son rôle.

Le Cloud Adoption Framework de Microsoft énonce la règle clairement : « Accordez aux agents l'accès uniquement aux sources de données précises requises par leur fonction. Ne fournissez pas un accès large à toutes les données de l'organisation. » Un agent de support n'a pas besoin de votre système de paie. Un agent de planification n'a pas besoin de la base de données clients. Quand un agent agit au nom d'une personne, il doit hériter des permissions de cette personne en transmettant son identité de manière sécurisée, de sorte qu'un agent de support montre à un employé son propre dossier RH uniquement, pas celui de tout le monde.

Le correctif : donnez à chaque agent sa propre identité, cadrée au moindre privilège, et faites-lui hériter des permissions de l'utilisateur qui agit plutôt que de porter en permanence un sur-ensemble. Le test est simple. Si l'agent est trompé demain, le dommage est borné par l'ensemble restreint qu'on lui a accordé, pas par tout ce qu'un seul compte sur-permissionné pourrait atteindre.

Erreur 3 : les agents exposés au public branchés sur des données internes

Un chatbot sur votre site web et un agent qui rédige des rapports internes sont deux mondes de sécurité différents, et la fuite arrive à l'instant où quelqu'un les laisse partager un backend. Un agent public prend des saisies de n'importe qui sur internet. Si ce même agent peut aussi interroger des données internes de l'entreprise, vous avez construit une porte du web public droit vers vos systèmes privés.

Le framework de Microsoft trace ici la ligne la plus stricte : « Les agents exposés au public ne doivent pas accéder aux données internes de l'entreprise. » Gardez le confidentiel et le public séparés par une frontière physique ou logique (leur exemple utilise des groupes de gestion « corp » et « online » distincts). L'idée est que la frontière soit structurelle, pas l'espoir que le prompt tiendra.

Le correctif : posez une vraie frontière entre les agents qui prennent des saisies publiques non fiables et les agents qui touchent à des données confidentielles. Si un seul agent doit réellement faire les deux, c'est la conception la plus risquée que vous puissiez choisir, et elle a besoin des contrôles qui rompent la triade décrits dans les erreurs suivantes, pas seulement d'un prompt système soigné.

Erreur 4 : ignorer la triade fatale

C'est l'erreur qui transforme les trois premières en une véritable exfiltration. Simon Willison, l'expert indépendant qui a inventé le terme « injection de prompt », a nommé la « triade fatale » des agents IA : trois conditions qui, réunies, permettent à une seule instruction injectée de voler vos données.

Les trois jambes	Ce que cela signifie	Exemple
Accès à des données privées	L'agent peut lire des informations sensibles	Boîte de réception, CRM, documents internes
Exposition à du contenu non fiable	Il traite du texte qu'il n'a pas rédigé	Un e-mail entrant, une page web, un fichier
Communication externe	Il peut envoyer des données vers l'extérieur	Une réponse, un appel d'API, une URL récupérée

Quand les trois sont présentes, un attaquant cache une instruction à l'intérieur du contenu non fiable. Le modèle, selon les mots de Willison, « suivra volontiers toute instruction qui parvient au modèle, qu'elle vienne de son opérateur ou d'une autre source ». Il lit vos données privées et les envoie dehors, et rien dans le prompt ne lui a dit de se méfier de l'e-mail.

La part brutale, et la raison pour laquelle c'est de l'architecture et non un problème d'ingénierie de prompt : « nous ne savons toujours pas comment empêcher cela de façon fiable à 100 %. » Des exploits documentés ont touché Microsoft 365 Copilot, le serveur MCP de GitHub et GitLab Duo. En une seule semaine de janvier 2026, des vulnérabilités d'injection de prompt indirecte ont été divulguées dans quatre outils de productivité IA, toutes selon le même schéma de triade.

Le correctif : rompez une jambe. Refusez la voie d'envoi externe pour que les données volées n'aient nulle part où aller, ou ne laissez jamais un agent qui lit du contenu non fiable détenir aussi un accès aux données privées dans le même contexte. Vous n'avez pas besoin de remporter le combat impossible qui consiste à attraper chaque injection. Vous avez besoin de vous assurer que même une injection réussie n'a aucune sortie.

Erreur 5 : considérer EchoLeak comme le problème de quelqu'un d'autre

Il vaut la peine de nommer un incident réel, car « la triade fatale » sonne abstrait jusqu'à ce qu'on la voie exécutée. EchoLeak (CVE-2025-32711) était une attaque sans clic sur Microsoft 365 Copilot. Un attaquant a envoyé un e-mail conçu sur mesure. Copilot, en faisant son travail normal, a traité cet e-mail (contenu non fiable), avait accès aux données internes de l'utilisateur (données privées), et avait un moyen d'envoyer des informations dehors (communication externe). L'instruction cachée a accompli l'exposition de données sensibles sans aucune interaction de l'utilisateur. Personne n'a cliqué sur quoi que ce soit.

L'erreur ici est de supposer qu'une fuite nécessite un employé négligent. EchoLeak n'en exigeait aucun. La défense qui comptait n'était pas « former le personnel à repérer le hameçonnage », car il n'y avait rien à repérer pour un humain. La défense était architecturale : un agent qui ne peut pas à la fois lire un contenu contrôlé par l'attaquant et exfiltrer ne peut pas être retourné contre vous de cette façon.

Le correctif : partez du principe que le sans-clic est le modèle de menace, pas l'exception. Si votre agent lit quoi que ce soit qu'un tiers peut influencer (e-mails, contenu web, fichiers téléversés, tickets) et qu'il peut aussi envoyer des données dehors, vous avez un trou en forme d'EchoLeak jusqu'à ce que vous fermiez l'une de ces deux capacités ou que vous verrouilliez fermement la voie d'envoi.

Erreur 6 : aucune frontière de résidence ou de rétention des données

Certaines fuites ne sont pas des exfiltrations spectaculaires, ce sont des dérives lentes. Les données finissent stockées dans une région que vous n'avez jamais acceptée, ou restent dans des journaux plus longtemps que votre politique ne l'autorise, simplement parce que personne n'a posé la frontière. Le framework de Microsoft cite cela comme gouvernance de base : identifier l'emplacement de chaque source de données, de l'exécution de l'agent et du stockage des sorties, garder les données dans des régions ou sur site qui correspondent à votre politique de résidence, et les garder chiffrées au repos.

La bonne nouvelle rassurante, que presque aucun article n'énonce clairement, c'est à quel point vous pouvez tout verrouiller. Le schéma d'entreprise chez tous les fournisseurs, c'est : aucun entraînement par défaut, plus une fenêtre de rétention courte, plus des garanties plus solides sur demande. Anthropic propose aux entreprises éligibles un accord de Zéro Rétention de Données (ZDR), au titre duquel les entrées et sorties ne sont pas stockées au-delà de ce qui est nécessaire pour filtrer les abus. OpenAI propose le ZDR via un accord négocié et la résidence des données. Les deux vous laissent choisir où vivent les données. Auto-héberger un modèle ouvert (par exemple avec Ollama) garde les données entièrement locales, avec zéro rétention par des tiers.

Le correctif : décidez et documentez la frontière avant le lancement. Quelle région détient les données, combien de temps vivent les journaux, avez-vous besoin du ZDR, et la récupération sensible doit-elle s'exécuter dans votre propre VPC ou sur site. Le ZDR ne concerne généralement que l'API et est négocié, et il ne couvre pas automatiquement chaque produit à moins que vous ne l'ajoutiez, donc le détail compte.

Erreur 7 : traiter la confidentialité comme une checklist qu'on délègue

La dernière erreur est structurelle. La plupart des recommandations, y compris l'excellent framework de Microsoft, supposent que vous construirez et gouvernerez l'agent vous-même, et vous remettent donc une pile de 3 000 mots d'identités Entra, d'étiquettes Purview et de groupes de gestion. C'est la bonne réponse pour une grande équipe informatique. Pour la plupart des entreprises, c'est une checklist que personne n'a le temps ou la compétence spécialisée d'appliquer pleinement, alors elle est livrée à moitié, et les manques sont exactement là où les données fuient.

L'erreur est de traiter les contrôles comme de la documentation plutôt que comme une architecture dont quelqu'un est responsable de bout en bout. Une checklist qui liste « isoler les données confidentielles » et « restreindre les intégrations externes aux serveurs MCP de confiance » ne vaut que ce que vaut la personne qui la câble, qui valide chaque communication externe, et qui met en place le plan d'incident pour désactiver vite un agent quand quelque chose tourne mal.

Le correctif : assurez-vous qu'une partie est réellement responsable de la frontière, pas seulement du document. Soit vous construisez la capacité interne pour mettre en œuvre et maintenir toute la pile, soit vous avez un opérateur qui élimine ces modes de défaillance par conception et les exploite, avec une frontière publiée que vous pouvez désigner. Le mauvais entre-deux, c'est une liste de contrôles et personne de responsable de leur tenue.

Comment s'alignent les sept erreurs et leurs correctifs

Voici les sept réunies au même endroit, triées selon que le correctif est un contrat que vous signez ou une architecture que vous construisez. Ce partage est le moyen le plus rapide de savoir quelle équipe est responsable de chacune.

#	Erreur	Correctif	Type
1	Comptes grand public en production	API d'entreprise ou compte professionnel, sans entraînement	Contrat
2	Permissions héritées trop larges	Identité au moindre privilège, hériter de l'accès de l'utilisateur	Architecture
3	Agents publics touchant aux données internes	Frontière stricte entre public et confidentiel	Architecture
4	Ignorer la triade fatale	Rompre une jambe : pas de contenu non fiable plus données privées plus voie d'envoi	Architecture
5	Supposer qu'une fuite exige un clic négligent	Concevoir pour le sans-clic ; verrouiller la voie d'exfiltration	Architecture
6	Aucune frontière de résidence ou de rétention	Fixer la région, régler la rétention, signer le ZDR, masquer à la frontière	Contrat
7	La confidentialité comme checklist déléguée	Un seul responsable de la tenue de la frontière	Responsabilité

Remarquez que seules deux des sept se résolvent par un contrat. Les cinq autres relèvent de l'architecture et de la responsabilité, qui est la partie qu'un PDF de bonnes pratiques ne peut pas faire à votre place. C'est aussi la raison honnête pour laquelle les sources faisant autorité laissent un manque : elles vous disent quoi construire, pas qui le construira correctement à l'intérieur de vos systèmes précis.

Ce qui, en réalité, ne sort jamais, quand la frontière est bien construite

Il est facile de lire sept erreurs et de conclure que les agents IA sont un champ de mines pour la confidentialité. Ils ne le sont pas, quand la ligne est tracée délibérément. Sur des conditions d'entreprise, vos saisies ne sont pas des données d'entraînement, et la rétention se compte en jours, pas pour toujours (7 pour l'API d'Anthropic, 30 pour OpenAI, supprimées ensuite). Avec le ZDR, elles ne sont pas stockées au-delà du filtrage des abus. Avec la résidence des données fixée, elles restent dans votre région. Avec une récupération en VPC ou sur site, les données sensibles ne sortent jamais de votre périmètre. Avec le masquage à la frontière, les champs qui ne devraient jamais voyager sont retirés avant tout envoi. Avec un cadrage au moindre privilège qui hérite des permissions de l'utilisateur, l'agent ne peut jamais atteindre que ce que la personne qui agit pouvait déjà atteindre.

C'est une frontière précise et défendable, et pouvoir l'énoncer clairement est tout l'enjeu. Le danger n'a jamais été le modèle absorbant discrètement votre entreprise. Ce sont les sept erreurs de configuration et d'architecture ci-dessus, dont chacune est évitable avant que le premier agent ne soit mis en service.

C'est le travail que nous accomplissons à l'intérieur des stacks d'autres entreprises : choisir les conditions, cadrer les identités, isoler le public du confidentiel, rompre la triade, et être responsable de la frontière pour qu'elle tienne. Si vous voulez que ces erreurs soient éliminées de vos agents par conception avant qu'ils ne touchent quoi que ce soit de réel, réservez une consultation gratuite ci-dessous et nous cartographierons votre frontière ensemble.

Propulsé par Sistava.com

Vous voulez qu'on le construise pour vous ?

Nous concevons, construisons et exploitons les agents IA au sein de votre entreprise, avec ces erreurs de confidentialité éliminées par conception avant le lancement. Réservez une consultation gratuite.

Réservez votre consultation gratuite

Questions fréquentes

01Utiliser un agent IA signifie-t-il que les données de mon entreprise servent à entraîner le modèle ?+

Pas sur une API ou un compte d'entreprise. Avec les offres professionnelles d'OpenAI, d'Anthropic et de Google Vertex AI, vos prompts et vos sorties ne servent pas à entraîner les modèles du fournisseur par défaut, et la rétention est brève (l'API d'Anthropic supprime automatiquement après 7 jours, OpenAI après 30). La fuite se produit sur les offres grand public, où les réglages par défaut peuvent s'entraîner sur vos données. L'erreur, c'est donc le type de compte, pas la technologie.

02Qu'est-ce que la triade fatale dans les agents IA ?+

C'est un terme inventé par Simon Willison pour les trois conditions qui, réunies, permettent à une seule instruction injectée de transformer un agent en outil d'exfiltration de données : l'accès à des données privées, l'exposition à du contenu non fiable, et la capacité à communiquer vers l'extérieur. Quand les trois sont présentes, une injection de prompt peut lire vos données et les envoyer dehors. Le seul correctif fiable est architectural, supprimer l'une des trois jambes, car l'injection de prompt ne peut pas être empêchée à 100 %.

03Comment EchoLeak (CVE-2025-32711) a-t-il réellement fait fuiter des données ?+

EchoLeak était une attaque sans clic sur Microsoft 365 Copilot où un e-mail conçu sur mesure déclenchait l'exposition de données sensibles, sans aucune interaction de l'utilisateur. L'e-mail portait une instruction cachée, Copilot avait accès à des données internes et à une voie d'envoi externe, la triade fatale était donc complète. C'est l'exemple type qui montre pourquoi un accès d'agent trop large plus une route d'exfiltration sont le vrai risque pour la confidentialité, pas l'entraînement du modèle.

04Comment empêcher un agent IA d'accéder à des données auxquelles il ne devrait pas accéder ?+

Donnez à l'agent sa propre identité cadrée au moindre privilège, en n'accordant l'accès qu'aux sources de données précises que sa fonction exige, jamais un accès large à toutes les données de l'organisation. Quand il agit pour un utilisateur, il doit hériter des permissions de cet utilisateur afin de ne voir que ce que cette personne est autorisée à voir. Les agents exposés au public doivent être totalement isolés des données internes de l'entreprise, avec une frontière physique ou logique entre les deux.

05Un prestataire qui exploite mes agents IA peut-il voir les données de mon entreprise ?+

Cela dépend de la frontière qu'il construit, alors demandez-lui de la montrer. Un opérateur responsable fonctionne sur des conditions d'entreprise sans entraînement et avec une rétention courte, peut signer un accord de Zéro Rétention de Données, fixe votre région de résidence des données, récupère depuis vos systèmes avec un cadrage au moindre privilège, et masque les champs sensibles à la frontière. Si un prestataire ne peut pas vous dire exactement ce qui sort de chez vous et ce qui n'en sort jamais, c'est déjà la réponse.

Insights associés

Confiance et sécurité

Les agents IA et vos données en 2026 : ce qui sort vraiment de vos murs et ce qui n'en sort jamais

Un inventaire en langage clair de ce qu'il advient de vos données lorsque vous déployez des agents IA : le contrat fournisseur que vous signez, le chemin d'exfiltration que vous construisez, et où se situe la limite.

Lire l'article

Confiance et sécurité

Comment empêcher votre agent IA de commettre une action nuisible (des garde-fous qui fonctionnent vraiment en 2026)

Empêchez votre agent IA de nuire grâce à des garde-fous en couches : les filtres de contenu échouent sur les entrées de confiance, donc l'isolation au moindre privilège et un point de contrôle humain sur l'irréversible sont ce qui le contient.

Lire l'article

Vous voulez qu'on le construise pour vous ?

Réservez votre consultation gratuite Tous les insights

7 erreurs de confidentialité des données qui font fuiter discrètement les données de votre entreprise via les agents IA (et comment les éviter)

Erreur 1 : faire tourner des agents de production sur des comptes grand public

Erreur 2 : les permissions trop larges héritées par l'agent

Erreur 3 : les agents exposés au public branchés sur des données internes

Erreur 4 : ignorer la triade fatale

Erreur 5 : considérer EchoLeak comme le problème de quelqu'un d'autre

Erreur 6 : aucune frontière de résidence ou de rétention des données

Erreur 7 : traiter la confidentialité comme une checklist qu'on délègue

Comment s'alignent les sept erreurs et leurs correctifs

Ce qui, en réalité, ne sort jamais, quand la frontière est bien construite

Vous voulez qu'on le construise pour vous ?

Questions fréquentes

Insights associés

Les agents IA et vos données en 2026 : ce qui sort vraiment de vos murs et ce qui n'en sort jamais

Comment empêcher votre agent IA de commettre une action nuisible (des garde-fous qui fonctionnent vraiment en 2026)

Vous voulez qu'on le construise pour vous ?

Innovations

Ressources

Entreprise