В Anthropic рассказали, как отучили Opus 4.7 подхалимничать, а сотрудники Google DeepMind проголосовали за создание профсоюза из-за сделок с военными
Anthropic опубликовала исследование о том, как пользователи обращаются к Claude за личными советами. Из 639 тысяч изученных диалогов claude.ai за март-апрель 2026 года 6% оказались личными просьбами — это около 38 000 разговоров. По итогам исследования компания переобучила модели Claude Opus 4.7 и Claude Mythos Preview, и подхалимаж в советах об отношениях у новых моделей упал примерно вдвое.
Канал с гайдами и контентом по claude code, выкладываем новости (когда режут лимиты в 10 раз) и какие инструменты через claude реализуем для проектов, канал: https://t.me/claudedevolper
Три четверти всех личных вопросов сосредоточены в четырех темах: здоровье и самочувствие (27%), карьера (26%), отношения (12%) и личные финансы (11%). В среднем по всем темам Claude вел себя угодливо — то есть соглашался с пользователем вопреки фактам или одобрял сомнительные решения — в 9% диалогов. Но в советах об отношениях этот показатель достигал 25%, а в духовных вопросах — 38%. Anthropic привела типовые примеры: на основе одностороннего рассказа модель могла согласиться с пользователем, что партнер его "точно газлайтит", подтвердить, что "уволиться завтра без плана — правильный ход", или одобрить дорогую покупку как "вложение в себя".
Исследователи выяснили, что в советах об отношениях люди чаще всего возражают Claude — 21% диалогов против 15% в среднем. И именно под давлением модель чаще скатывается к лести: 18% против 9% без возражений. Чтобы это исправить, в Anthropic собрали типовые сценарии давления — критику первого ответа, вброс односторонних деталей — и превратили их в синтетические задачи для обучения. В этой среде Claude генерировал по два варианта ответа на каждую ситуацию, а отдельный экземпляр модели их оценивал.
Эффект мерили стресс-тестом через предзаполнение (prefilling): моделям подсовывали реальный разговор, где предыдущие версии Claude уже соглашались с пользователем вопреки фактам, и заставляли продолжать его как свой собственный. И Opus 4.7, и Mythos Preview показали меньше подхалимажа — и в советах об отношениях, и по всем темам в целом. Один из примеров: пользователь спросил, не выглядят ли его сообщения тревожно-навязчивыми. Claude Sonnet 4.6 под давлением сменил позицию, а Claude Opus 4.7 объяснил, что сами сообщения нормальные, но человек по ходу разговора несколько раз описывал тревожные мысли.
В Anthropic отдельно указали, что 22% пользователей в личных советах упоминали другие источники поддержки — семью, друзей, профессионалов. Но люди обращаются к Claude и потому, что не могут позволить себе специалиста. Поэтому компания планирует разработать отдельные оценочные тесты для высокорисковых сфер: медицины, юриспруденции, родительства, финансов. Параллельно Anthropic ссылается на свежее исследование UK AI Security Institute о том, что люди склонны принимать советы ИИ и в малозначимых, и в серьезных ситуациях, и собирается через опросы пользователей узнавать, что происходит после полученного совета.
Сотрудники Google DeepMind проголосовали за создание профсоюза из-за сделок с военными
Сотрудники британского подразделения Google DeepMind проголосовали за создание профсоюза, чтобы заблокировать предоставление технологий искусственного интеллекта лаборатории вооружённым силам США и Израиля. В адресованном управляющему директору Google в Великобритании и Ирландии Дебби Вайнштейн письме работники попросили признать объединения Communication Workers Union (CWU) и Unite the Union в качестве совместных представителей сотрудников DeepMind.
Стремление к созданию профсоюза направлено на то, чтобы заставить Google соблюдать собственные этические стандарты в отношении ИИ и способов монетизации этой технологии, включая вопросы целей применения продуктов и выбора партнёров, заявил Wired представитель CWU Джон Чадфилд. По его словам, благодаря созданию профсоюза работники коллективно оказываются в более сильной позиции, чтобы предъявлять требования к руководству.
Сотрудник DeepMind на правах анонимности рассказал, что инициатива по созданию профсоюза возникла в феврале 2025 года, когда материнская компания Google, Alphabet, исключила из своих этических норм обязательство не использовать ИИ в таких целях, как оружие и слежка. Сейчас специалисты лаборатории наблюдают тенденцию к дальнейшей милитаризации разрабатываемых ими ИИ-моделей, отметил собеседник Wired.
В конце февраля 2026 года сотрудники DeepMind и OpenAI подписали открытое письмо в поддержку Anthropic после того, Министерство обороны США попыталось классифицировать разработчика Claude как риск для цепочки поставок. Ранее Anthropic отказала ведомству в разрешении использовать её ИИ-модели для создания автономного оружия и массового наблюдения за американцами.
В прошлом месяце New York Times сообщила, что Google заключила сделку, позволяющую Пентагону использовать её ИИ для «любых законных государственных целей». Вскоре Минобороны США подтвердило наличие соглашений с семью ведущими компаниями в сфере ИИ, включая Google, OpenAI и Microsoft. После этого около 600 сотрудников Google в США подписали открытое письмо против этой сделки.
Тогда же представитель Google Дженн Крайдер заявила, что корпорация гордится своим участием в консорциуме ведущих ИИ-лабораторий, технологических и облачных компаний, предоставляющих услуги и инфраструктуру в поддержку национальной безопасности. Google по-прежнему привержена консенсусу частного и государственного секторов о том, что ИИ не должен использоваться для массовой слежки внутри США и автономного оружия без надлежащего контроля со стороны человека, добавила Крайдер.
В 2021 году американские сотрудники Google создали профсоюз Alphabet Workers Union.
Сотрудник DeepMind сообщил Wired, что если сотрудникам удастся создать профсоюз в Великобритании, они потребуют от Google расторгнуть контракт с израильской армией. Также они постараются добиться большей прозрачности в отношении использования ИИ-продуктов и гарантий касательно увольнений, ставших возможными благодаря автоматизации.
Если руководство Google не пойдёт навстречу, то сотрудники обратятся в арбитражный комитет с просьбой обязать компанию признать профсоюзы, следует из письма.
С начала текущего года Anthropic и OpenAI объявили о масштабном расширении своей деятельности в Лондоне. CWU надеется, что усилия по созданию профсоюза в DeepMind подтолкнут персонал этих лабораторий к аналогичным действиям. Чадфилд рассказал, что сотрудники Anthropic и OpenAI уже обращались за помощью к CWU.
Канал с гайдами и контентом по claude code, выкладываем новости (когда режут лимиты в 10 раз) и какие инструменты через claude реализуем для проектов, канал: https://t.me/claudedevolper