Confianza y seguridad14 de junio de 2026·11 min de lectura

7 errores de privacidad de datos con agentes de IA que filtran en silencio los datos de tu empresa (y cómo evitarlos)

Los siete errores de configuración y arquitectura que filtran en silencio los datos de la empresa a través de agentes de IA, cada uno con su solución específica, basados en incidentes reales de 2025 y 2026.

Datos clave

La mayoría de las fugas de datos de los agentes de IA no se deben a que el modelo memorice tus datos. Provienen de errores de configuración y arquitectura: cuentas de nivel de consumidor que entrenan con tus entradas, permisos demasiado amplios que un agente hereda, agentes de cara al público conectados a sistemas internos, y la tríada letal (datos privados, contenido no confiable y una vía de envío externa) que explota la inyección de prompts, como ocurrió en EchoLeak (CVE-2025-32711) contra Microsoft 365 Copilot. Las soluciones son condiciones de empresa sin entrenamiento y con retención corta, un alcance de mínimo privilegio que hereda los permisos del usuario, aislar los datos confidenciales de los agentes públicos y romper una pata de la tríada. Estas son decisiones de arquitectura que se toman antes del lanzamiento, no una lista de comprobación que se entrega después.

Mahmoud Zalt

Fundador y arquitecto de IA · Sista AI

7 errores de privacidad de datos con agentes de IA que filtran en silencio los datos de tu empresa (y cómo evitarlos)

La mayoría de las fugas de datos de los agentes de IA no se deben a que el modelo memorice tu empresa en secreto. Provienen de errores de configuración y arquitectura que puedes nombrar y corregir. Los grandes: operar sobre una cuenta de nivel de consumidor cuyos ajustes predeterminados entrenan con tus entradas, dejar que un agente herede los amplios permisos de una persona, conectar un agente de cara al público a sistemas internos y dejar intacta la "tríada letal" (datos privados, contenido no confiable y una vía de envío externa) para que una sola inyección de prompt pueda leer tus datos y enviarlos por correo. Ese último patrón es exactamente cómo EchoLeak (CVE-2025-32711) expuso datos sensibles a través de Microsoft 365 Copilot a partir de un correo electrónico manipulado, sin que el usuario hiciera clic. Las soluciones no son exóticas, y casi todas son decisiones que se toman antes de que el agente se lance, no una lista de comprobación que se te entrega después de que algo se filtra.

Esta es la lista que repasamos antes de poner un agente que hemos construido dentro del stack de otra empresa, escrita para que un propietario no técnico pueda detectar los mismos errores en su propia configuración o en la de un proveedor. Si prefieres que mantengamos esta línea donde debe estar para ti, mira cómo gestionamos la gobernanza y el riesgo de la IA responsable. Todo lo que sigue es tuyo para usarlo de cualquier manera.

Primero, una distinción que casi todos los artículos sobre este tema difuminan, porque equivocarse en ella es el error cero. Hay dos formas completamente distintas en que los datos salen a través de un agente, y tienen soluciones completamente distintas:

Manejo de datos por parte del proveedor. ¿El proveedor del modelo almacena o entrena con tus entradas? Esto es un contrato que firmas y un nivel de cuenta que eliges. Se resuelve con condiciones y configuración.
Exfiltración en tiempo de ejecución. ¿Se puede engañar al agente, en el momento en que se ejecuta, para que envíe tus datos a un lugar al que no deberían ir? Esto se resuelve con arquitectura, no con un contrato.

Las cifras de las encuestas indican que los compradores lo perciben aunque no sepan nombrarlo. En la investigación de Cloudera con casi 1.500 líderes de TI sénior de 14 países, el 96% planea ampliar el uso de agentes de IA durante el próximo año, y sin embargo el 53% (más de la mitad) señala la privacidad de los datos como su principal obstáculo de adopción. Los siete errores que siguen son donde ese miedo se convierte en una fuga real, y donde vive la solución.

Error 1: ejecutar agentes de producción en cuentas de nivel de consumidor

Este es el error más barato de cometer y el más fácil de corregir. Alguien conecta un flujo de trabajo a una cuenta personal de ChatGPT o a una cuenta de consumidor de Gemini porque ya está ahí, y ahora los datos de tu negocio se rigen por condiciones de consumidor que nunca se pensaron para ellos.

La brecha entre los niveles de consumidor y de empresa es marcada. En el lado empresarial, el patrón es coherente entre proveedores: sin entrenamiento con tus datos de forma predeterminada, una ventana de retención corta para la monitorización de abusos y opciones más estrictas bajo petición. La API de OpenAI retiene los datos durante 30 días para la monitorización de abusos y luego los elimina, y no entrena con ellos de forma predeterminada. A partir del 14 de septiembre de 2025, Anthropic recortó la retención de registros de la API de 30 días a 7 días, y las entradas y salidas de la API nunca se usan para entrenamiento. La Vertex AI de Google (el nivel de empresa) es configurable sin uso para entrenamiento. En el lado del consumidor los ajustes predeterminados se invierten: el ChatGPT de consumidor almacena las conversaciones de forma indefinida a menos que las elimines, y la retención del Gemini de consumidor llega hasta 36 meses y puede usarse para mejorar productos.

La solución: pon cada agente de producción sobre una API de empresa o una cuenta de negocio, nunca un inicio de sesión personal. La tecnología es idéntica. Las condiciones no lo son, y las condiciones son toda la diferencia entre datos que permanecen gobernados y datos que en silencio se convierten en material de entrenamiento.

Error 2: permisos demasiado amplios que el agente hereda

La fuga en tiempo de ejecución más común no es astuta. A un agente se le entrega el acceso de un empleado, o peor, una clave de administrador, así que técnicamente puede ver todo lo que esa persona puede ver. Luego se le hace una pregunta, o se le engaña para que llegue a una, que va mucho más allá de su trabajo.

El Cloud Adoption Framework de Microsoft enuncia la regla con claridad: "Concede a los agentes acceso solo a las fuentes de datos específicas que requiere su función. No proporciones acceso amplio a todos los datos de la organización." Un agente de soporte no necesita tu sistema de nóminas. Un agente de programación de citas no necesita la base de datos de clientes. Cuando un agente actúa en nombre de una persona, debe heredar los permisos de esa persona pasando su identidad de forma segura, de modo que un agente de mesa de ayuda muestre a un empleado solo su propio registro de RR. HH., no el de todos.

La solución: dale a cada agente su propia identidad, con un alcance de mínimo privilegio, y haz que herede los permisos del usuario que actúa en lugar de cargar con un superconjunto permanente. La prueba es sencilla. Si mañana se engaña al agente, el daño queda limitado por el conjunto estrecho que se le concedió, no por todo lo que una sola cuenta con permisos excesivos podría alcanzar.

Error 3: agentes de cara al público conectados a datos internos

Un chatbot en tu sitio web y un agente que redacta informes internos son dos mundos de seguridad distintos, y la fuga ocurre en el momento en que alguien les deja compartir un backend. Un agente público recibe entradas de cualquiera en internet. Si ese mismo agente también puede consultar datos internos del negocio, has construido una puerta desde la web pública directamente hacia tus sistemas privados.

El framework de Microsoft traza aquí la línea más dura: "Los agentes de cara al público no deben acceder a datos internos del negocio." Mantén lo confidencial y lo público separados por una frontera física o lógica (su ejemplo usa grupos de gestión "corp" y "online" separados). El punto es que la frontera es estructural, no la esperanza de que el prompt aguante.

La solución: pon una frontera real entre los agentes que reciben entradas públicas no confiables y los agentes que tocan datos confidenciales. Si un único agente realmente debe hacer ambas cosas, ese es el diseño de mayor riesgo que puedes elegir, y necesita los controles que rompen la tríada de los errores siguientes, no solo un prompt de sistema cuidadoso.

Error 4: ignorar la tríada letal

Este es el error que convierte los tres primeros en una exfiltración real. Simon Willison, el experto independiente que acuñó el término "inyección de prompts", nombró la "tríada letal" para los agentes de IA: tres condiciones que, combinadas, permiten que una sola instrucción inyectada robe tus datos.

Las tres patas	Qué significa	Ejemplo
Acceso a datos privados	El agente puede leer información sensible	Bandeja de entrada, CRM, documentos internos
Exposición a contenido no confiable	Procesa texto que no escribió	Un correo entrante, una página web, un archivo
Comunicación externa	Puede enviar datos hacia fuera	Una respuesta, una llamada a una API, una URL solicitada

Cuando las tres están presentes, un atacante esconde una instrucción dentro del contenido no confiable. El modelo, en palabras de Willison, "seguirá con gusto cualquier instrucción que le llegue, provenga o no de su operador o de alguna otra fuente." Lee tus datos privados y los envía fuera, y nada en el prompt le dijo que no confiara en el correo.

La parte cruda, y la razón por la que esto es arquitectura y no un problema de ingeniería de prompts: "todavía no sabemos cómo prevenir esto de forma 100% fiable." Se han documentado exploits que afectaron a Microsoft 365 Copilot, al servidor MCP de GitHub y a GitLab Duo. En una semana de enero de 2026, se revelaron vulnerabilidades de inyección indirecta de prompts en cuatro herramientas de productividad con IA, todas con el mismo patrón de la tríada.

La solución: rompe una pata. Niega la vía de envío externa para que los datos robados no tengan adónde ir, o nunca dejes que un agente que lee contenido no confiable también tenga acceso a datos privados en el mismo contexto. No necesitas ganar la batalla imposible de atrapar cada inyección. Necesitas asegurarte de que incluso una inyección exitosa no tenga ninguna ruta de salida.

Error 5: tratar EchoLeak como un problema ajeno

Vale la pena nombrar un incidente real, porque "la tríada letal" suena abstracta hasta que la ves ejecutada. EchoLeak (CVE-2025-32711) fue un ataque sin clics sobre Microsoft 365 Copilot. Un atacante envió un correo electrónico manipulado. Copilot, haciendo su trabajo normal, procesó ese correo (contenido no confiable), tenía acceso a los datos internos del usuario (datos privados) y tenía una forma de enviar información fuera (comunicación externa). La instrucción oculta completó la exposición de datos sensibles sin ninguna interacción del usuario. Nadie hizo clic en nada.

El error aquí es asumir que una fuga requiere un empleado descuidado. EchoLeak no requirió ninguno. La defensa que importaba no era "capacitar al personal para detectar phishing", porque no había nada que un humano pudiera detectar. La defensa era arquitectónica: un agente que no puede a la vez leer contenido controlado por un atacante y exfiltrar no puede ser usado en tu contra de esta manera.

La solución: asume que el ataque sin clics es el modelo de amenaza, no la excepción. Si tu agente lee cualquier cosa que un externo pueda influir (correo, contenido web, archivos subidos, tickets) y también puede enviar datos fuera, tienes un agujero con forma de EchoLeak hasta que cierres una de esas dos capacidades o blindes la vía de envío.

Error 6: ninguna frontera de residencia o retención de datos

Algunas fugas no son exfiltraciones dramáticas, son una deriva lenta. Los datos terminan almacenados en una región que nunca acordaste, o quedan en registros más tiempo del que permite tu política, simplemente porque nadie fijó la frontera. El framework de Microsoft lo enumera como gobernanza central: identifica la ubicación de cada fuente de datos, tiempo de ejecución del agente y almacenamiento de salida, mantén los datos en regiones o en local que coincidan con tu política de residencia, y mantenlos cifrados en reposo.

La noticia tranquilizadora, que casi ningún artículo expone con claridad, es cuánto puedes fijar. El patrón empresarial entre proveedores es sin entrenamiento de forma predeterminada, más una ventana de retención corta, más garantías más fuertes bajo petición. Anthropic ofrece a las empresas que cumplen los requisitos un acuerdo de Retención Cero de Datos (ZDR), bajo el cual las entradas y salidas no se almacenan más allá de lo necesario para detectar abusos. OpenAI ofrece ZDR mediante un acuerdo negociado y residencia de datos. Ambos te permiten elegir dónde viven los datos. Autoalojar un modelo abierto (por ejemplo, con Ollama) mantiene los datos totalmente locales con retención cero por parte de terceros.

La solución: decide y documenta la frontera antes del lanzamiento. Qué región alberga los datos, cuánto viven los registros, si necesitas ZDR, y si la recuperación de datos sensibles debería ejecutarse en tu propia VPC o en local. El ZDR suele ser solo para API y negociado, y no cubre automáticamente cada producto a menos que lo añadas, así que el detalle importa.

Error 7: tratar la privacidad como una lista de comprobación que entregas

El último error es estructural. La mayoría de las guías, incluido el excelente framework de Microsoft, asumen que construirás y gobernarás el agente tú mismo, así que te entregan una pila de 3.000 palabras de identidades de Entra, etiquetas de Purview y grupos de gestión. Esa es la respuesta correcta para un gran equipo de TI. Para la mayoría de las empresas es una lista de comprobación que nadie tiene el tiempo ni la habilidad especializada para implementar por completo, así que se entrega a medias, y los huecos son exactamente donde se filtran los datos.

El error es tratar los controles como documentación en lugar de como una arquitectura de la que alguien es dueño de principio a fin. Una lista de comprobación que enumera "aislar datos confidenciales" y "restringir las integraciones externas a servidores MCP confiables" solo es tan buena como la persona que lo conecta todo, valida cada comunicación externa y levanta el plan de incidentes para desactivar un agente rápido cuando algo sale mal.

La solución: asegúrate de que una parte realmente sea dueña de la frontera, no solo del documento. O bien construyes la capacidad interna para implementar y mantener el stack completo, o tienes a un operador que diseñe estos modos de fallo para dejarlos fuera y los opere, con una frontera publicada que puedas señalar. El término medio equivocado es una lista de controles y nadie responsable de que se sostengan.

Cómo encajan los siete errores y soluciones

Aquí están los siete en un solo lugar, ordenados según si la solución es un contrato que firmas o una arquitectura que construyes. Esa división es la forma más rápida de saber qué equipo es dueño de cada uno.

#	Error	Solución	Tipo
1	Cuentas de nivel de consumidor en producción	API de empresa o cuenta de negocio, sin entrenamiento	Contrato
2	Permisos heredados demasiado amplios	Identidad de mínimo privilegio, heredar el acceso del usuario	Arquitectura
3	Agentes públicos que tocan datos internos	Frontera dura entre lo público y lo confidencial	Arquitectura
4	Ignorar la tríada letal	Romper una pata: nada de contenido no confiable más datos privados más vía de envío	Arquitectura
5	Asumir que una fuga necesita un clic descuidado	Diseñar para sin clics; blindar la ruta de exfiltración	Arquitectura
6	Sin frontera de residencia o retención	Fijar región, establecer retención, firmar ZDR, redactar en la frontera	Contrato
7	Privacidad como lista de comprobación entregada	Un único dueño responsable de que la frontera se sostenga	Propiedad

Fíjate en que solo dos de los siete se resuelven con un contrato. Los otros cinco son arquitectura y propiedad, que es la parte que un PDF de buenas prácticas no puede hacer por ti. Es también la razón honesta por la que las fuentes autorizadas dejan un hueco: te dicen qué construir, no quién lo construirá correctamente dentro de tus sistemas específicos.

Qué nunca sale realmente, cuando la frontera está bien construida

Es fácil leer siete errores y concluir que los agentes de IA son un campo minado de privacidad. No lo son, cuando la línea se traza deliberadamente. Bajo condiciones de empresa, tus entradas no son datos de entrenamiento, y la retención es de días, no para siempre (7 para la API de Anthropic, 30 para OpenAI, eliminados después). Con ZDR, no se almacenan más allá de la detección de abusos. Con la residencia de datos fijada, permanecen en tu región. Con recuperación en VPC o en local, los datos sensibles nunca salen de tu perímetro en absoluto. Con redacción en la frontera, los campos que nunca deberían viajar se eliminan antes de enviar nada. Con un alcance de mínimo privilegio que hereda los permisos del usuario, el agente solo puede alcanzar lo que la persona que actúa ya podía alcanzar.

Esa es una frontera específica y defendible, y poder enunciarla con claridad es todo el objetivo. El peligro nunca fue que el modelo absorbiera tu empresa en silencio. Son los siete errores de configuración y arquitectura anteriores, cada uno de los cuales se puede prevenir antes de que el primer agente entre en funcionamiento.

Este es el trabajo que hacemos dentro de los stacks de otras empresas: elegir las condiciones, dar alcance a las identidades, aislar lo público de lo confidencial, romper la tríada y ser dueños de la frontera para que se sostenga. Si quieres que estos errores queden diseñados fuera de tus agentes antes de que toquen nada real, reserva una consulta gratuita abajo y trazaremos tu frontera juntos.

Con la tecnología de Sistava.com

¿Quieres que lo construyamos por ti?

Planificamos, construimos y operamos los agentes de IA dentro de tu empresa, con estos errores de privacidad de datos diseñados para quedar fuera antes del lanzamiento. Reserva una consulta gratuita.

Reserva tu consulta gratuita

Preguntas frecuentes

01¿Usar un agente de IA significa que los datos de mi empresa se usan para entrenar el modelo?+

No en una API o cuenta de empresa. Con los niveles de empresa de OpenAI, Anthropic y Google Vertex AI, tus prompts y resultados no se usan para entrenar los modelos del proveedor de forma predeterminada, y la retención es breve (la API de Anthropic los elimina automáticamente tras 7 días, la de OpenAI tras 30). La fuga ocurre en los niveles de consumidor, donde los ajustes predeterminados pueden entrenar con tus datos, así que el error es el tipo de cuenta, no la tecnología.

02¿Qué es la tríada letal en los agentes de IA?+

Es un término acuñado por Simon Willison para las tres condiciones que, combinadas, permiten que una sola instrucción inyectada convierta a un agente en una herramienta de exfiltración de datos: acceso a datos privados, exposición a contenido no confiable y la capacidad de comunicarse externamente. Cuando las tres están presentes, una inyección de prompt puede leer tus datos y enviarlos fuera. La única solución fiable es arquitectónica, eliminar una de las tres patas, porque la inyección de prompts no se puede prevenir al 100%.

03¿Cómo filtró datos realmente EchoLeak (CVE-2025-32711)?+

EchoLeak fue un ataque sin clics sobre Microsoft 365 Copilot en el que un correo electrónico manipulado provocó la exposición de datos sensibles sin ninguna interacción del usuario. El correo llevaba una instrucción oculta, Copilot tenía acceso a datos internos y una vía de envío externa, así que la tríada letal estaba completa. Es el ejemplo de manual de por qué el acceso demasiado amplio de un agente más una ruta de exfiltración es el verdadero riesgo de privacidad, no el entrenamiento del modelo.

04¿Cómo evito que un agente de IA acceda a datos a los que no debería?+

Dale al agente su propia identidad con un alcance de mínimo privilegio, concediendo acceso solo a las fuentes de datos específicas que requiere su función, nunca un acceso amplio a todos los datos de la organización. Cuando actúa en nombre de un usuario, debe heredar los permisos de ese usuario para que solo vea lo que esa persona tiene permitido ver. Los agentes de cara al público deben estar aislados por completo de los datos internos del negocio, con una frontera física o lógica entre ambos.

05¿Puede un proveedor que opera mis agentes de IA ver los datos de mi empresa?+

Eso depende de la frontera que construya, así que pídele que te la muestre. Un operador responsable opera bajo condiciones de empresa sin entrenamiento y con retención corta, puede firmar un acuerdo de Retención Cero de Datos, fija tu región de residencia de datos, recupera información de tus sistemas con un alcance de mínimo privilegio y redacta los campos sensibles en la frontera. Si un proveedor no puede decirte exactamente qué sale de tu edificio y qué nunca lo hace, esa es la respuesta.

Insights relacionados

Confianza y seguridad

Los agentes de IA y tus datos en 2026: qué sale realmente de tu empresa y qué no sale nunca

Un inventario en lenguaje claro de lo que hacen tus datos cuando despliegas agentes de IA: el contrato con el proveedor que firmas, la vía de exfiltración que construyes y dónde está la línea.

Leer artículo

Confianza y seguridad

Cómo evitar que tu agente de IA haga algo dañino (barreras de protección que de verdad funcionan en 2026)

Evita que tu agente de IA cause daño con barreras por capas: los filtros de contenido fallan con la entrada de confianza, así que el aislamiento de mínimo privilegio y una validación humana sobre lo irreversible son lo que lo contiene.

Leer artículo

¿Quieres que lo construyamos por ti?

Reserva tu consulta gratuita Todos los insights

7 errores de privacidad de datos con agentes de IA que filtran en silencio los datos de tu empresa (y cómo evitarlos)

Error 1: ejecutar agentes de producción en cuentas de nivel de consumidor

Error 2: permisos demasiado amplios que el agente hereda

Error 3: agentes de cara al público conectados a datos internos

Error 4: ignorar la tríada letal

Error 5: tratar EchoLeak como un problema ajeno

Error 6: ninguna frontera de residencia o retención de datos

Error 7: tratar la privacidad como una lista de comprobación que entregas

Cómo encajan los siete errores y soluciones

Qué nunca sale realmente, cuando la frontera está bien construida

¿Quieres que lo construyamos por ti?

Preguntas frecuentes

Insights relacionados

Los agentes de IA y tus datos en 2026: qué sale realmente de tu empresa y qué no sale nunca

Cómo evitar que tu agente de IA haga algo dañino (barreras de protección que de verdad funcionan en 2026)

¿Quieres que lo construyamos por ti?

Innovaciones

Recursos

Empresa