ЭйАй Секур’илка

Технологические прогнозы на 2026 год от IEEE

IEEE выкатила отчет, а там что называется «от патрона до…» дальше сами знаете. Документ посвящен анализу ключевых технологических трендов в 2026

OpenRT — модульная и расширяемая среда для систематической оценки безопасности больших языковых моделей

Заметка к документу Small Language Model for AI Agents HandBook

Авторы представляют новую атаку Doublespeak — простую и основанную на «захвате» внутренних представлений модели в контексте

Новый фреймворк для создания компактных моделей для поиска уязвимостей в коде на C/C++

Новая атака, которая позволяет определить тему запроса к LLM, по зашифрованному трафику

Как выбор LLM влияет на безопасность агента

Как будущие устройства со встроенными LLM станут проблемой безопасности, так как злоумышленники смогут “жить за счёт LLM” (Living Off the LLM, LOLLM)

Руководство по проектированию безопасных корпоративных ИИ-агентов с использованием MCP от IBM c верификацией от Anthropic

Новый класс атак, когда отдельно текст и изображение выглядят безопасно, но их совместное сочетание несёт злонамеренный смысл