Confiança e Segurança14 de junho de 2026·11 min de leitura

7 Erros de Privacidade de Dados em Agentes de IA Que Vazam Silenciosamente os Dados da Sua Empresa (e Como Evitá-los)

Os sete erros de configuração e arquitetura que vazam silenciosamente os dados da empresa através de agentes de IA, cada um com a correção específica, fundamentados em incidentes reais de 2025 e 2026.

Factos Essenciais

A maioria dos vazamentos de dados em agentes de IA não vem do modelo memorizar os seus dados. Vem de erros de configuração e arquitetura: contas de nível de consumidor que treinam com os seus inputs, permissões demasiado amplas que um agente herda, agentes voltados para o público ligados a sistemas internos, e a tríade letal (dados privados, conteúdo não confiável e um caminho de envio externo) que a injeção de prompt explora, como aconteceu no EchoLeak (CVE-2025-32711) contra o Microsoft 365 Copilot. As correções são termos empresariais sem treino e com retenção curta, escopo de privilégio mínimo que herda as permissões do utilizador, isolar dados confidenciais de agentes públicos, e quebrar uma das pernas da tríade. Estas são decisões de arquitetura tomadas antes do lançamento, não uma checklist entregue depois.

Mahmoud Zalt

Fundador e Arquiteto de IA · Sista AI

7 Erros de Privacidade de Dados em Agentes de IA Que Vazam Silenciosamente os Dados da Sua Empresa (e Como Evitá-los)

A maioria dos vazamentos de dados em agentes de IA não vem do modelo a memorizar secretamente a sua empresa. Vem de erros de configuração e arquitetura que pode nomear e corrigir. Os principais: operar numa conta de nível de consumidor cujos padrões treinam com os seus inputs, deixar um agente herdar as permissões amplas de uma pessoa, ligar um agente voltado para o público a sistemas internos, e deixar a "tríade letal" intacta (dados privados, conteúdo não confiável e um caminho de envio externo) para que uma única injeção de prompt consiga ler os seus dados e enviá-los por correio para fora. Esse último padrão é exatamente como o EchoLeak (CVE-2025-32711) expôs dados sensíveis através do Microsoft 365 Copilot a partir de um email forjado, sem qualquer clique do utilizador. As correções não são exóticas, e quase todas são decisões tomadas antes do agente ser lançado, não uma checklist entregue a si depois de algo vazar.

Esta é a lista que percorremos antes de colocar um agente que construímos dentro da stack de outra empresa, escrita para que um proprietário não técnico consiga detetar os mesmos erros na sua própria configuração ou na de um fornecedor. Se preferir que sejamos nós a manter esta linha onde deve estar para si, veja como gerimos governança e risco de IA responsável. Tudo o que está abaixo é seu para usar de qualquer forma.

Primeiro, uma distinção que quase todos os artigos sobre este tema confundem, porque errá-la é o erro zero. Há duas formas completamente diferentes de os dados saírem através de um agente, e têm correções completamente diferentes:

Tratamento de dados pelo fornecedor. O fornecedor do modelo armazena ou treina com os seus inputs? Isto é um contrato que assina e um nível de conta que escolhe. Resolve-se com termos e configuração.
Exfiltração em tempo de execução. O agente pode ser enganado, no momento em que corre, para enviar os seus dados para algum lugar que não deveria? Isto resolve-se com arquitetura, não com um contrato.

Os números das sondagens dizem que os compradores sentem isto mesmo quando não conseguem nomeá-lo. Na investigação da Cloudera com quase 1.500 líderes seniores de TI em 14 países, 96% planeiam expandir o uso de agentes de IA no próximo ano, mas 53% (mais de metade) apontam a privacidade de dados como o seu principal obstáculo à adoção. Os sete erros abaixo são onde esse receio se torna um vazamento real, e onde vive a correção.

Erro 1: operar agentes de produção em contas de nível de consumidor

Este é o erro mais barato de cometer e o mais fácil de corrigir. Alguém liga um fluxo de trabalho a uma conta pessoal do ChatGPT ou a uma conta de consumidor do Gemini porque já está disponível, e agora os dados do seu negócio são regidos por termos de consumidor que nunca foram pensados para eles.

A diferença entre os níveis de consumidor e empresarial é nítida. No lado empresarial, o padrão é consistente entre fornecedores: sem treino com os seus dados por defeito, uma janela de retenção curta para monitorização de abuso, e opções mais fortes a pedido. A API da OpenAI retém dados durante 30 dias para monitorização de abuso e depois apaga-os, e não treina com eles por defeito. A partir de 14 de setembro de 2025, a Anthropic reduziu a retenção de registos da API de 30 dias para 7 dias, e os inputs e outputs da API nunca são usados para treino. O Vertex AI da Google (o nível empresarial) é configurável sem uso para treino. No lado do consumidor, os padrões invertem-se: o ChatGPT de consumidor armazena conversas indefinidamente a menos que as apague, e a retenção do Gemini de consumidor chega aos 36 meses e pode ser usada para melhorar produtos.

A correção: coloque cada agente de produção numa API empresarial ou conta de negócios, nunca num login pessoal. A tecnologia é idêntica. Os termos não são, e os termos são toda a diferença entre dados que permanecem regidos e dados que silenciosamente se tornam material de treino.

Erro 2: permissões demasiado amplas que o agente herda

O vazamento em tempo de execução mais comum não é engenhoso. A um agente é dado o acesso de um funcionário, ou pior, uma chave de administrador, para que tecnicamente possa ver tudo o que essa pessoa pode ver. Depois é-lhe feita uma pergunta, ou é enganado para uma, que vai muito além da sua função.

O Cloud Adoption Framework da Microsoft enuncia a regra com clareza: "Conceda aos agentes acesso apenas às fontes de dados específicas exigidas pela sua função. Não forneça acesso amplo a todos os dados da organização." Um agente de suporte não precisa do seu sistema de folha de pagamentos. Um agente de agendamento não precisa da base de dados de clientes. Quando um agente age em nome de uma pessoa, deve herdar as permissões dessa pessoa passando a sua identidade de forma segura, para que um agente de helpdesk mostre a um funcionário apenas o seu próprio registo de RH, não o de toda a gente.

A correção: dê a cada agente a sua própria identidade, com escopo de privilégio mínimo, e faça-o herdar as permissões do utilizador que age em vez de carregar um superconjunto permanente. O teste é simples. Se o agente for enganado amanhã, o dano fica limitado pelo conjunto restrito que lhe foi concedido, não por tudo o que uma conta com permissões excessivas poderia alcançar.

Erro 3: agentes voltados para o público ligados a dados internos

Um chatbot no seu site e um agente que redige relatórios internos são dois mundos de segurança diferentes, e o vazamento acontece no momento em que alguém os deixa partilhar um backend. Um agente público recebe input de qualquer pessoa na internet. Se esse mesmo agente também conseguir consultar dados internos do negócio, construiu uma porta da web pública diretamente para os seus sistemas privados.

O framework da Microsoft traça aqui a linha mais dura: "Os agentes voltados para o público não devem aceder a dados internos do negócio." Mantenha o confidencial e o público separados por uma fronteira física ou lógica (o exemplo deles usa grupos de gestão "corp" e "online" separados). A questão é que a fronteira é estrutural, não uma esperança de que o prompt aguente.

A correção: coloque uma fronteira real entre agentes que recebem input público não confiável e agentes que tocam dados confidenciais. Se um único agente tiver genuinamente de fazer ambos, esse é o design de maior risco que pode escolher, e precisa dos controlos que quebram a tríade nos erros seguintes, não apenas de um prompt de sistema cuidadoso.

Erro 4: ignorar a tríade letal

Este é o erro que transforma os três primeiros numa exfiltração real. Simon Willison, o especialista independente que criou o termo "injeção de prompt", nomeou a "tríade letal" para agentes de IA: três condições que, quando combinadas, permitem que uma única instrução injetada roube os seus dados.

As três pernas	O que significa	Exemplo
Acesso a dados privados	O agente pode ler informação sensível	Caixa de entrada, CRM, documentos internos
Exposição a conteúdo não confiável	Processa texto que não foi ele a escrever	Um email recebido, uma página web, um ficheiro
Comunicação externa	Pode enviar dados para fora	Uma resposta, uma chamada de API, um URL obtido

Quando as três estão presentes, um atacante esconde uma instrução dentro do conteúdo não confiável. O modelo, nas palavras de Willison, "seguirá alegremente quaisquer instruções que cheguem ao modelo, quer venham do seu operador ou de alguma outra fonte." Ele lê os seus dados privados e envia-os para fora, e nada no prompt lhe disse para não confiar no email.

A parte crua, e a razão por que isto é arquitetura e não um problema de engenharia de prompts: "ainda não sabemos como evitar isto a 100% de forma fiável." Exploits documentados atingiram o Microsoft 365 Copilot, o servidor MCP do GitHub e o GitLab Duo. Numa semana de janeiro de 2026, foram divulgadas vulnerabilidades de injeção indireta de prompt em quatro ferramentas de produtividade de IA, todas o mesmo padrão da tríade.

A correção: quebre uma perna. Negue o caminho de envio externo para que os dados roubados não tenham para onde ir, ou nunca deixe um agente que lê conteúdo não confiável ter também acesso a dados privados no mesmo contexto. Não precisa de vencer a luta impossível de apanhar todas as injeções. Precisa de garantir que mesmo uma injeção bem-sucedida não tem rota de saída.

Erro 5: tratar o EchoLeak como problema dos outros

Vale a pena nomear um incidente real, porque "a tríade letal" soa abstrato até a ver executada. O EchoLeak (CVE-2025-32711) foi um ataque zero-click ao Microsoft 365 Copilot. Um atacante enviou um email forjado. O Copilot, a fazer o seu trabalho normal, processou esse email (conteúdo não confiável), tinha acesso aos dados internos do utilizador (dados privados), e tinha forma de enviar informação para fora (comunicação externa). A instrução oculta completou a exposição de dados sensíveis sem qualquer interação do utilizador. Ninguém clicou em nada.

O erro aqui é assumir que um vazamento exige um funcionário descuidado. O EchoLeak não exigiu nenhum. A defesa que importava não era "formar os funcionários para detetar phishing", porque não havia nada para um humano detetar. A defesa era arquitetural: um agente que não consegue simultaneamente ler conteúdo controlado pelo atacante e exfiltrar não pode ser virado contra si desta forma.

A correção: assuma que o zero-click é o modelo de ameaça, não a exceção. Se o seu agente lê qualquer coisa que um agente externo possa influenciar (email, conteúdo web, ficheiros carregados, tickets) e também consegue enviar dados para fora, tem um buraco com a forma do EchoLeak até fechar uma dessas duas capacidades ou cercar rigidamente o caminho de envio.

Erro 6: nenhuma fronteira de residência ou retenção de dados

Alguns vazamentos não são exfiltrações dramáticas, são deriva lenta. Os dados acabam armazenados numa região que nunca aceitou, ou em registos por mais tempo do que a sua política permite, simplesmente porque ninguém definiu a fronteira. O framework da Microsoft lista isto como governança central: identificar a localização de cada fonte de dados, runtime de agente e armazenamento de output, manter os dados em regiões ou on-prem que correspondam à sua política de residência, e mantê-los encriptados em repouso.

A notícia tranquilizadora, que quase nenhum artigo declara com clareza, é o quanto pode fixar. O padrão empresarial entre fornecedores é sem treino por defeito, mais uma janela de retenção curta, mais garantias mais fortes a pedido. A Anthropic oferece a empresas qualificadas um acordo de Retenção Zero de Dados (ZDR), sob o qual os inputs e outputs não são armazenados além do necessário para rastrear abuso. A OpenAI oferece ZDR através de um acordo negociado e residência de dados. Ambos permitem escolher onde os dados ficam. Auto-hospedar um modelo aberto (por exemplo com Ollama) mantém os dados totalmente locais com retenção zero por terceiros.

A correção: decida e documente a fronteira antes do lançamento. Que região guarda os dados, quanto tempo vivem os registos, se precisa de ZDR, e se a recuperação sensível deve correr na sua própria VPC ou on-prem. O ZDR é normalmente apenas para API e negociado, e não cobre automaticamente todos os produtos a menos que o adicione, por isso o detalhe importa.

Erro 7: tratar a privacidade como uma checklist que se entrega

O último erro é estrutural. A maioria das orientações, incluindo o excelente framework da Microsoft, assume que vai construir e governar o agente sozinho, por isso entrega-lhe uma pilha de 3.000 palavras de identidades Entra, etiquetas Purview e grupos de gestão. Essa é a resposta certa para uma grande equipa de TI. Para a maioria dos negócios é uma checklist que ninguém tem o tempo ou a competência especializada para implementar na totalidade, por isso fica entregue a meio, e as lacunas são exatamente onde os dados vazam.

O erro é tratar os controlos como documentação em vez de como uma arquitetura que alguém possui de ponta a ponta. Uma checklist que lista "isolar dados confidenciais" e "restringir integrações externas a servidores MCP confiáveis" só é tão boa quanto a pessoa que a liga, valida cada comunicação externa, e monta o plano de incidentes para desativar um agente rapidamente quando algo corre mal.

A correção: garanta que uma parte possui de facto a fronteira, não apenas o documento. Ou constrói a capacidade interna para implementar e manter a stack completa, ou tem um operador a desenhar a arquitetura destes modos de falha e a operá-los, com uma fronteira publicada para a qual possa apontar. O meio-termo errado é uma lista de controlos e ninguém responsável por que eles aguentem.

Como os sete erros e correções se alinham

Aqui estão os sete num só lugar, ordenados por se a correção é um contrato que assina ou uma arquitetura que constrói. Essa divisão é a forma mais rápida de saber qual equipa possui cada um.

#	Erro	Correção	Tipo
1	Contas de nível de consumidor em produção	API empresarial ou conta de negócios, sem treino	Contrato
2	Permissões herdadas demasiado amplas	Identidade de privilégio mínimo, herdar o acesso do utilizador	Arquitetura
3	Agentes públicos a tocar dados internos	Fronteira dura entre público e confidencial	Arquitetura
4	Ignorar a tríade letal	Quebrar uma perna: sem conteúdo não confiável mais dados privados mais caminho de envio	Arquitetura
5	Assumir que um vazamento precisa de um clique descuidado	Desenhar para zero-click; cercar o caminho de exfiltração	Arquitetura
6	Nenhuma fronteira de residência ou retenção	Fixar região, definir retenção, assinar ZDR, ocultar na fronteira	Contrato
7	Privacidade como checklist entregue	Um dono responsável por a fronteira aguentar	Propriedade

Repare que apenas dois dos sete são resolvidos por um contrato. Os outros cinco são arquitetura e propriedade, que é a parte que um PDF de melhores práticas não pode fazer por si. É também a razão honesta por que as fontes autoritativas deixam uma lacuna: dizem-lhe o que construir, não quem o vai construir corretamente dentro dos seus sistemas específicos.

O que de facto nunca sai, quando a fronteira é bem construída

É fácil ler sete erros e concluir que os agentes de IA são um campo minado de privacidade. Não são, quando a linha é traçada deliberadamente. Com termos empresariais, os seus inputs não são dados de treino, e a retenção é de dias, não para sempre (7 para a API da Anthropic, 30 para a OpenAI, apagados depois). Com ZDR, não são armazenados além do rastreio de abuso. Com a residência de dados fixada, ficam na sua região. Com recuperação em VPC ou on-prem, os dados sensíveis nunca saem do seu perímetro. Com ocultação na fronteira, os campos que nunca deveriam viajar são removidos antes de qualquer coisa ser enviada. Com escopo de privilégio mínimo que herda as permissões do utilizador, o agente só consegue alcançar aquilo que a pessoa que age já podia alcançar.

Essa é uma fronteira específica e defensável, e ser capaz de a enunciar com clareza é a questão toda. O perigo nunca foi o modelo a absorver silenciosamente a sua empresa. São os sete erros de configuração e arquitetura acima, cada um deles evitável antes do primeiro agente entrar em funcionamento.

Este é o trabalho que fazemos dentro das stacks de outras empresas: escolher os termos, definir o escopo das identidades, isolar o público do confidencial, quebrar a tríade, e possuir a fronteira para que aguente. Se quer estes erros eliminados pela arquitetura dos seus agentes antes de tocarem em algo real, marque uma consulta gratuita abaixo e mapearemos a sua fronteira em conjunto.

Desenvolvido por Sistava.com

Quer isto construído para si?

Nós planeamos, construímos e operamos os agentes de IA dentro do seu negócio, com estes erros de privacidade de dados eliminados pela arquitetura antes do lançamento. Marque uma consulta gratuita.

Marque a sua consulta gratuita

Perguntas Frequentes

01Usar um agente de IA significa que os dados da minha empresa são usados para treinar o modelo?+

Não numa API ou conta empresarial. Com os níveis empresariais da OpenAI, Anthropic e Google Vertex AI, os seus prompts e outputs não são usados por defeito para treinar os modelos do fornecedor, e a retenção é breve (a API da Anthropic apaga automaticamente após 7 dias, a OpenAI após 30). O vazamento acontece nos níveis de consumidor, onde os padrões podem treinar com os seus dados, por isso o erro é o tipo de conta, não a tecnologia.

02O que é a tríade letal em agentes de IA?+

É um termo criado por Simon Willison para as três condições que, quando combinadas, permitem que uma única instrução injetada transforme um agente numa ferramenta de exfiltração de dados: acesso a dados privados, exposição a conteúdo não confiável e a capacidade de comunicar externamente. Quando as três estão presentes, uma injeção de prompt pode ler os seus dados e enviá-los para fora. A única correção fiável é arquitetural, remover uma das três pernas, porque a injeção de prompt não pode ser 100% evitada.

03Como é que o EchoLeak (CVE-2025-32711) vazou dados de facto?+

O EchoLeak foi um ataque zero-click ao Microsoft 365 Copilot em que um email forjado desencadeou a exposição de dados sensíveis sem qualquer interação do utilizador. O email continha uma instrução oculta, o Copilot tinha acesso a dados internos e um caminho de envio externo, por isso a tríade letal estava completa. É o exemplo de manual de por que o acesso demasiado amplo de um agente mais uma rota de exfiltração é o verdadeiro risco de privacidade, não o treino do modelo.

04Como impeço um agente de IA de aceder a dados a que não devia?+

Dê ao agente a sua própria identidade com escopo de privilégio mínimo, concedendo acesso apenas às fontes de dados específicas que a sua função exige, nunca acesso amplo a todos os dados da organização. Quando age em nome de um utilizador, deve herdar as permissões desse utilizador para que veja apenas o que essa pessoa está autorizada a ver. Os agentes voltados para o público devem estar totalmente isolados dos dados internos do negócio, com uma fronteira física ou lógica entre os dois.

05Um fornecedor que opera os meus agentes de IA consegue ver os dados da minha empresa?+

Isso depende da fronteira que ele constrói, por isso peça-lhe para a mostrar. Um operador responsável trabalha com termos empresariais sem treino e com retenção curta, pode assinar um acordo de Retenção Zero de Dados, fixa a região de residência dos seus dados, recupera dados dos seus sistemas com escopo de privilégio mínimo, e oculta campos sensíveis na fronteira. Se um fornecedor não conseguir dizer-lhe exatamente o que sai do seu edifício e o que nunca sai, essa é a resposta.

Insights Relacionados

Confiança e Segurança

Agentes de IA e os Seus Dados em 2026: O Que Realmente Sai do Seu Edifício e o Que Nunca Sai

Um inventário em linguagem clara sobre o que acontece aos seus dados quando implementa agentes de IA: o contrato com o fornecedor que assina, o caminho de exfiltração que constrói e onde fica a linha divisória.

Ler artigo

Confiança e Segurança

Como Impedir que o Seu Agente de IA Faça Algo Prejudicial (Salvaguardas que Funcionam de Verdade em 2026)

Impeça o seu agente de IA de causar danos com salvaguardas em camadas: os filtros de conteúdo falham com entradas confiáveis, por isso o isolamento de privilégio mínimo e um controlo humano sobre o irreversível são o que o contém.

Ler artigo

Quer isto construído para si?

Marque a sua consulta gratuita Todos os Insights

7 Erros de Privacidade de Dados em Agentes de IA Que Vazam Silenciosamente os Dados da Sua Empresa (e Como Evitá-los)

Erro 1: operar agentes de produção em contas de nível de consumidor

Erro 2: permissões demasiado amplas que o agente herda

Erro 3: agentes voltados para o público ligados a dados internos

Erro 4: ignorar a tríade letal

Erro 5: tratar o EchoLeak como problema dos outros

Erro 6: nenhuma fronteira de residência ou retenção de dados

Erro 7: tratar a privacidade como uma checklist que se entrega

Como os sete erros e correções se alinham

O que de facto nunca sai, quando a fronteira é bem construída

Quer isto construído para si?

Perguntas Frequentes

Insights Relacionados

Agentes de IA e os Seus Dados em 2026: O Que Realmente Sai do Seu Edifício e o Que Nunca Sai

Como Impedir que o Seu Agente de IA Faça Algo Prejudicial (Salvaguardas que Funcionam de Verdade em 2026)

Quer isto construído para si?

Inovações

Recursos

Empresa