
IEEE выкатила отчет, а там что называется «от патрона до…» дальше сами знаете. Документ посвящен анализу ключевых технологических трендов в 2026

OpenRT — модульная и расширяемая среда для систематической оценки безопасности больших языковых моделей

Авторы представляют новую атаку Doublespeak — простую и основанную на «захвате» внутренних представлений модели в контексте

Как будущие устройства со встроенными LLM станут проблемой безопасности, так как злоумышленники смогут “жить за счёт LLM” (Living Off the LLM, LOLLM)

Руководство по проектированию безопасных корпоративных ИИ-агентов с использованием MCP от IBM c верификацией от Anthropic

Новый класс атак, когда отдельно текст и изображение выглядят безопасно, но их совместное сочетание несёт злонамеренный смысл