Доверие и безопасность14 июня 2026 г.·11 мин чтения

7 ошибок конфиденциальности данных ИИ-агентов, которые незаметно сливают данные вашей компании (и как их избежать)

Семь ошибок конфигурации и архитектуры, которые незаметно сливают данные компании через ИИ-агентов, и для каждой из них конкретное решение, основанное на реальных инцидентах 2025 и 2026 годов.

Ключевые факты

Большинство утечек данных через ИИ-агентов происходит не из-за того, что модель запоминает ваши данные. Они вызваны ошибками конфигурации и архитектуры: аккаунты потребительского уровня, которые обучаются на ваших вводных данных, избыточные права, которые наследует агент, публичные агенты, подключённые к внутренним системам, и смертельная триада (приватные данные, недоверенный контент и внешний канал отправки), которую эксплуатирует инъекция промпта, как это произошло в EchoLeak (CVE-2025-32711) против Microsoft 365 Copilot. Решения: корпоративные условия без обучения и с коротким сроком хранения, минимально необходимые права, наследующие разрешения пользователя, изоляция конфиденциальных данных от публичных агентов и разрыв одного звена триады. Это архитектурные решения, принятые до запуска, а не чек-лист, переданный вам после.

Mahmoud Zalt

Основатель и AI-архитектор · Sista AI

7 ошибок конфиденциальности данных ИИ-агентов, которые незаметно сливают данные вашей компании (и как их избежать)

Большинство утечек данных через ИИ-агентов происходит не из-за того, что модель тайком запоминает вашу компанию. Они вызваны ошибками конфигурации и архитектуры, которые вы можете назвать и исправить. Главные из них: работа на аккаунте потребительского уровня, чьи настройки по умолчанию обучаются на ваших вводных данных, передача агенту широких прав одного человека, подключение публичного агента к внутренним системам и сохранение «смертельной триады» нетронутой (приватные данные, недоверенный контент и внешний канал отправки), так что одна инъекция промпта может прочитать ваши данные и отправить их наружу. Именно по этому последнему сценарию EchoLeak (CVE-2025-32711) раскрыл чувствительные данные через Microsoft 365 Copilot из специально составленного письма, без единого клика пользователя. Решения не экзотичны, и почти все они являются решениями, принятыми до запуска агента, а не чек-листом, переданным вам после того, как что-то утекло.

Это список, который мы прорабатываем, прежде чем поместить построенного нами агента внутрь стека другой компании, написанный так, чтобы нетехнический владелец мог распознать те же ошибки в своей собственной системе или у подрядчика. Если вы предпочтёте, чтобы мы держали эту линию там, где она должна быть для вас, посмотрите, как мы выстраиваем ответственное управление ИИ и рисками. Всё, что ниже, в любом случае ваше для использования.

Сначала разграничение, которое размывает почти каждая статья на эту тему, потому что ошибиться здесь значит совершить ошибку номер ноль. Есть два совершенно разных способа, которыми данные утекают через агента, и у них совершенно разные решения:

Обработка данных провайдером. Хранит ли провайдер модели ваши вводные данные или обучается на них? Это контракт, который вы подписываете, и уровень аккаунта, который вы выбираете. Решается условиями и конфигурацией.
Эксфильтрация во время выполнения. Можно ли обмануть агента в момент его работы, чтобы он отправил ваши данные туда, куда не должен? Это решается архитектурой, а не контрактом.

Цифры опросов говорят, что покупатели чувствуют это, даже если не могут назвать. В исследовании Cloudera, охватившем почти 1500 старших ИТ-руководителей в 14 странах, 96% планируют расширить использование ИИ-агентов в течение следующего года, и при этом 53% (более половины) называют конфиденциальность данных главным препятствием для внедрения. Семь ошибок ниже это место, где этот страх становится реальной утечкой, и где живёт решение.

Ошибка 1: запуск рабочих агентов на аккаунтах потребительского уровня

Это самая дешёвая ошибка и самая лёгкая для исправления. Кто-то подключает рабочий процесс к личному ChatGPT или потребительскому аккаунту Gemini, потому что он уже под рукой, и теперь данными вашего бизнеса управляют потребительские условия, которые никогда для них не предназначались.

Разрыв между потребительским и корпоративным уровнями резкий. На корпоративной стороне паттерн одинаков у всех провайдеров: никакого обучения на ваших данных по умолчанию, короткое окно хранения для мониторинга злоупотреблений и более строгие опции по запросу. API OpenAI хранит данные 30 дней для мониторинга злоупотреблений, а затем удаляет их и по умолчанию на них не обучается. С 14 сентября 2025 года Anthropic сократил срок хранения логов API с 30 дней до 7, а вводные и выходные данные API никогда не используются для обучения. Vertex AI от Google (корпоративный уровень) настраивается без использования данных для обучения. На потребительской стороне настройки по умолчанию переворачиваются: потребительский ChatGPT хранит разговоры бессрочно, пока вы их не удалите, а срок хранения у потребительского Gemini достигает 36 месяцев, и данные могут использоваться для улучшения продуктов.

Решение: поместите каждого рабочего агента на корпоративный API или бизнес-аккаунт, а не на личный логин. Технология идентична. Условия нет, и именно условия составляют всю разницу между данными, которые остаются под управлением, и данными, которые незаметно становятся обучающим материалом.

Ошибка 2: избыточные права, которые наследует агент

Самая распространённая утечка во время выполнения не хитра. Агенту передают доступ одного сотрудника, или, хуже того, ключ администратора, так что технически он может видеть всё, что видит этот человек. Затем ему задают вопрос, или обманом подводят к вопросу, который выходит далеко за пределы его работы.

Cloud Adoption Framework от Microsoft формулирует правило прямо: «Предоставляйте агентам доступ только к тем конкретным источникам данных, которые требуются для их функции. Не давайте широкий доступ ко всем данным организации». Агенту поддержки не нужна ваша система начисления зарплаты. Агенту планирования не нужна база данных клиентов. Когда агент действует от имени человека, он должен наследовать разрешения этого человека, безопасно передавая его идентичность, чтобы агент службы поддержки показывал сотруднику только его собственную запись в кадрах, а не всех подряд.

Решение: дайте каждому агенту собственную идентичность с минимально необходимыми правами и заставьте его наследовать разрешения действующего пользователя, а не носить постоянный супернабор. Тест прост. Если завтра агента обманут, ущерб будет ограничен узким набором, который ему предоставили, а не всем, до чего мог дотянуться один аккаунт с избыточными правами.

Ошибка 3: публичные агенты, подключённые к внутренним данным

Чат-бот на вашем сайте и агент, который составляет внутренние отчёты, это два разных мира безопасности, и утечка происходит в тот момент, когда кто-то позволяет им разделить общий бэкенд. Публичный агент принимает ввод от кого угодно в интернете. Если этот же агент может также запрашивать внутренние бизнес-данные, вы построили дверь из публичного веба прямо в свои приватные системы.

Фреймворк Microsoft проводит здесь самую жёсткую черту: «Публичные агенты не должны иметь доступ к внутренним бизнес-данным». Держите конфиденциальное и публичное разделёнными физической или логической границей (в их примере используются отдельные группы управления «corp» и «online»). Суть в том, что граница структурна, а не надежда на то, что промпт устоит.

Решение: поставьте реальную границу между агентами, которые принимают недоверенный публичный ввод, и агентами, которые касаются конфиденциальных данных. Если один агент действительно должен делать и то, и другое, это самый рискованный дизайн, который вы можете выбрать, и ему нужны меры, разрывающие триаду, из следующих ошибок, а не просто аккуратный системный промпт.

Ошибка 4: игнорирование смертельной триады

Это ошибка, которая превращает первые три в настоящую эксфильтрацию. Саймон Уиллисон, независимый эксперт, придумавший термин «инъекция промпта», назвал «смертельную триаду» для ИИ-агентов: три условия, которые, будучи объединёнными, позволяют одной внедрённой инструкции украсть ваши данные.

Три звена	Что это означает	Пример
Доступ к приватным данным	Агент может читать чувствительную информацию	Почтовый ящик, CRM, внутренние документы
Контакт с недоверенным контентом	Он обрабатывает текст, который не сам написал	Входящее письмо, веб-страница, файл
Внешняя связь	Он может отправлять данные наружу	Ответ, вызов API, загруженный URL

Когда присутствуют все три, злоумышленник прячет инструкцию внутри недоверенного контента. Модель, по словам Уиллисона, «с радостью выполнит любые инструкции, которые до неё доходят, независимо от того, пришли они от её оператора или из какого-то другого источника». Она читает ваши приватные данные и отправляет их наружу, и ничто в промпте не говорило ей не доверять письму.

Жёсткая часть и причина, по которой это архитектура, а не проблема инженерии промптов: «мы по-прежнему не знаем, как предотвратить это на 100% надёжно». Задокументированные эксплойты затронули Microsoft 365 Copilot, MCP-сервер GitHub и GitLab Duo. За одну неделю в январе 2026 года уязвимости непрямой инъекции промпта были раскрыты в четырёх инструментах продуктивности на ИИ, все по одному и тому же паттерну триады.

Решение: разорвите одно звено. Запретите внешний канал отправки, чтобы украденным данным некуда было деться, или никогда не позволяйте агенту, который читает недоверенный контент, одновременно иметь доступ к приватным данным в том же контексте. Вам не нужно выигрывать невыигрываемую битву по перехвату каждой инъекции. Вам нужно убедиться, что даже успешная инъекция не имеет пути наружу.

Ошибка 5: отношение к EchoLeak как к чужой проблеме

Стоит назвать один реальный инцидент, потому что «смертельная триада» звучит абстрактно, пока вы не увидите её в действии. EchoLeak (CVE-2025-32711) была атакой без кликов (zero-click) на Microsoft 365 Copilot. Злоумышленник отправил специально составленное письмо. Copilot, выполняя свою обычную работу, обработал это письмо (недоверенный контент), имел доступ к внутренним данным пользователя (приватные данные) и располагал способом отправить информацию наружу (внешняя связь). Скрытая инструкция завершила раскрытие чувствительных данных вообще без какого-либо взаимодействия пользователя. Никто ничего не нажимал.

Ошибка здесь в предположении, что утечка требует невнимательного сотрудника. EchoLeak не требовал никакого. Защита, которая имела значение, была не «обучите персонал распознавать фишинг», потому что человеку нечего было распознавать. Защита была архитектурной: агент, который не может одновременно читать контент, контролируемый злоумышленником, и эксфильтровать данные, не может быть обращён против вас таким образом.

Решение: считайте, что атака без кликов это модель угрозы, а не исключение. Если ваш агент читает что-либо, на что может повлиять посторонний (письмо, веб-контент, загруженные файлы, тикеты), и он также может отправлять данные наружу, у вас есть дыра в форме EchoLeak, пока вы не закроете одну из этих двух возможностей или жёстко не оградите канал отправки.

Ошибка 6: отсутствие границы по размещению или хранению данных

Некоторые утечки это не драматичные эксфильтрации, это медленный дрейф. Данные оказываются хранимыми в регионе, на который вы никогда не соглашались, или лежат в логах дольше, чем позволяет ваша политика, просто потому что никто не установил границу. Фреймворк Microsoft перечисляет это как базовое управление: определите расположение каждого источника данных, среды выполнения агента и хранилища результатов, держите данные в регионах или локально (on-prem), которые соответствуют вашей политике размещения, и держите их зашифрованными при хранении.

Обнадёживающая новость, которую почти ни одна статья не формулирует прямо, это то, насколько многое можно зафиксировать. Корпоративный паттерн у всех провайдеров это отсутствие обучения по умолчанию плюс короткое окно хранения плюс более строгие гарантии по запросу. Anthropic предлагает подходящим предприятиям соглашение о нулевом хранении данных (Zero Data Retention, ZDR), по которому вводные и выходные данные не хранятся дольше, чем нужно для проверки на злоупотребления. OpenAI предлагает ZDR через согласованное соглашение и размещение данных. Оба позволяют вам выбирать, где живут данные. Самостоятельный хостинг открытой модели (например, с Ollama) держит данные полностью локально с нулевым хранением у третьих сторон.

Решение: определите и задокументируйте границу до запуска. Какой регион хранит данные, как долго живут логи, нужен ли вам ZDR и должно ли извлечение чувствительных данных выполняться в вашей собственной VPC или локально (on-prem). ZDR обычно доступен только для API и согласуется, и он не покрывает автоматически каждый продукт, если вы его не добавите, поэтому детали важны.

Ошибка 7: отношение к приватности как к чек-листу, который вы передаёте

Последняя ошибка структурна. Большинство руководств, включая превосходный фреймворк Microsoft, предполагает, что вы сами построите агента и будете им управлять, поэтому вам вручают стопку из 3000 слов про идентичности Entra, метки Purview и группы управления. Это правильный ответ для большой ИТ-команды. Для большинства бизнесов это чек-лист, у которого ни у кого нет времени или специализированного навыка, чтобы полностью его реализовать, поэтому он отгружается наполовину, и пробелы это ровно те места, где данные утекают.

Ошибка в отношении к мерам контроля как к документации, а не как к архитектуре, за которую кто-то отвечает от начала до конца. Чек-лист, который перечисляет «изолируйте конфиденциальные данные» и «ограничьте внешние интеграции доверенными MCP-серверами», хорош лишь настолько, насколько хорош человек, который это подключает, проверяет каждую внешнюю связь и поднимает план реагирования на инциденты, чтобы быстро отключить агента, когда что-то идёт не так.

Решение: убедитесь, что одна сторона действительно владеет границей, а не только документом. Либо вы строите внутреннюю способность реализовывать и поддерживать весь стек, либо у вас есть оператор, который проектирует эти сценарии отказа как невозможные и обслуживает их, с опубликованной границей, на которую вы можете указать. Неправильная золотая середина это список мер контроля и никого, кто отвечает за то, чтобы они держались.

Как выстраиваются семь ошибок и решений

Вот все семь в одном месте, отсортированные по тому, является ли решение контрактом, который вы подписываете, или архитектурой, которую вы строите. Это разделение самый быстрый способ понять, какая команда владеет каждым из них.

№	Ошибка	Решение	Тип
1	Аккаунты потребительского уровня в продакшене	Корпоративный API или бизнес-аккаунт, без обучения	Контракт
2	Избыточные унаследованные права	Идентичность с минимальными правами, наследует доступ пользователя	Архитектура
3	Публичные агенты, касающиеся внутренних данных	Жёсткая граница между публичным и конфиденциальным	Архитектура
4	Игнорирование смертельной триады	Разорвать одно звено: не сочетать недоверенный контент, приватные данные и канал отправки	Архитектура
5	Предположение, что утечке нужен невнимательный клик	Проектировать под атаку без кликов, оградить путь эксфильтрации	Архитектура
6	Отсутствие границы по размещению или хранению	Зафиксировать регион, задать хранение, подписать ZDR, маскировать на границе	Контракт
7	Приватность как переданный чек-лист	Один владелец, отвечающий за то, чтобы граница держалась	Ответственность

Обратите внимание, что только две из семи решаются контрактом. Остальные пять это архитектура и ответственность, та часть, которую PDF с лучшими практиками не может сделать за вас. Это также честная причина, по которой авторитетные источники оставляют пробел: они говорят вам, что строить, а не кто построит это правильно внутри ваших конкретных систем.

Что на самом деле никогда не покидает периметр, когда граница выстроена правильно

Легко прочитать семь ошибок и заключить, что ИИ-агенты это минное поле для приватности. Это не так, когда линия проведена осознанно. На корпоративных условиях ваши вводные данные не являются обучающими, а срок хранения это дни, а не вечность (7 для API Anthropic, 30 для OpenAI, затем удаление). С ZDR они не хранятся дольше проверки на злоупотребления. С зафиксированным размещением данных они остаются в вашем регионе. С извлечением через VPC или локально (on-prem) чувствительные данные вообще не покидают ваш периметр. С маскированием на границе поля, которые никогда не должны путешествовать, удаляются до того, как что-либо будет отправлено. С минимально необходимыми правами, наследующими разрешения пользователя, агент может дотянуться только до того, до чего уже мог дотянуться действующий человек.

Это конкретная, защитимая граница, и способность сформулировать её прямо это и есть весь смысл. Опасность никогда не была в том, что модель тихо впитает вашу компанию. Она в семи ошибках конфигурации и архитектуры выше, каждую из которых можно предотвратить до того, как первый агент выйдет в работу.

Это работа, которую мы делаем внутри стеков других компаний: выбор условий, определение прав идентичностей, изоляция публичного от конфиденциального, разрыв триады и владение границей, чтобы она держалась. Если вы хотите, чтобы эти ошибки были спроектированы как невозможные в ваших агентах до того, как они коснутся чего-либо реального, запишитесь на бесплатную консультацию ниже, и мы вместе составим карту вашей границы.

При поддержке Sistava.com

Хотите, чтобы это построили для вас?

Мы планируем, создаём и обслуживаем ИИ-агентов внутри вашего бизнеса, и эти ошибки конфиденциальности данных закладываются как невозможные ещё до запуска. Запишитесь на бесплатную консультацию.

Записаться на бесплатную консультацию

Часто задаваемые вопросы

01Означает ли использование ИИ-агента, что данные моей компании используются для обучения модели?+

Не на корпоративном API или аккаунте. В бизнес-тарифах OpenAI, Anthropic и Google Vertex AI ваши промпты и результаты по умолчанию не используются для обучения моделей провайдера, а срок хранения короткий (API Anthropic автоматически удаляет данные через 7 дней, OpenAI через 30). Утечка происходит на потребительских тарифах, где настройки по умолчанию могут обучаться на ваших данных, поэтому ошибка кроется в типе аккаунта, а не в технологии.

02Что такое смертельная триада в ИИ-агентах?+

Это термин, придуманный Саймоном Уиллисоном для трёх условий, которые, будучи объединёнными, позволяют одной внедрённой инструкции превратить агента в инструмент эксфильтрации данных: доступ к приватным данным, контакт с недоверенным контентом и возможность связи с внешним миром. Когда присутствуют все три, инъекция промпта может прочитать ваши данные и отправить их наружу. Единственное надёжное решение архитектурное: убрать одно из трёх звеньев, потому что инъекцию промпта невозможно предотвратить на 100%.

03Как именно EchoLeak (CVE-2025-32711) сливал данные?+

EchoLeak была атакой без кликов (zero-click) на Microsoft 365 Copilot, при которой специально составленное письмо запускало раскрытие чувствительных данных вообще без какого-либо взаимодействия пользователя. В письме была скрытая инструкция, у Copilot был доступ к внутренним данным и внешний канал отправки, так что смертельная триада была полной. Это хрестоматийный пример того, почему избыточный доступ агента плюс маршрут эксфильтрации и есть настоящий риск для приватности, а не обучение модели.

04Как помешать ИИ-агенту получить доступ к данным, к которым он не должен иметь доступа?+

Дайте агенту собственную идентичность с минимально необходимыми правами, предоставляя доступ только к тем конкретным источникам данных, которые требуются для его функции, и никогда широкий доступ ко всем данным организации. Когда он действует от имени пользователя, он должен наследовать разрешения этого пользователя, чтобы видеть только то, что разрешено этому человеку. Публичные агенты должны быть полностью изолированы от внутренних бизнес-данных физической или логической границей между ними.

05Может ли подрядчик, обслуживающий моих ИИ-агентов, видеть данные моей компании?+

Это зависит от границы, которую он выстраивает, поэтому попросите её показать. Ответственный оператор работает на корпоративных условиях без обучения и с коротким сроком хранения, может подписать соглашение о нулевом хранении данных (Zero Data Retention), фиксирует регион размещения ваших данных, извлекает данные из ваших систем с минимально необходимыми правами и маскирует чувствительные поля на границе. Если подрядчик не может точно сказать вам, что покидает ваше здание, а что не покидает никогда, это и есть ответ.

Хотите, чтобы это построили для вас?

Записаться на бесплатную консультацию Вся аналитика

7 ошибок конфиденциальности данных ИИ-агентов, которые незаметно сливают данные вашей компании (и как их избежать)

Ошибка 1: запуск рабочих агентов на аккаунтах потребительского уровня

Ошибка 2: избыточные права, которые наследует агент

Ошибка 3: публичные агенты, подключённые к внутренним данным

Ошибка 4: игнорирование смертельной триады

Ошибка 5: отношение к EchoLeak как к чужой проблеме

Ошибка 6: отсутствие границы по размещению или хранению данных

Ошибка 7: отношение к приватности как к чек-листу, который вы передаёте

Как выстраиваются семь ошибок и решений

Что на самом деле никогда не покидает периметр, когда граница выстроена правильно

Хотите, чтобы это построили для вас?

Часто задаваемые вопросы

Похожие материалы

ИИ-агенты и ваши данные в 2026 году: что на самом деле покидает вашу компанию, а что не покидает её никогда

Как не дать ИИ-агенту сделать что-то опасное (защитные механизмы, которые действительно работают в 2026 году)

Хотите, чтобы это построили для вас?

Инновации

Ресурсы

Компания