Компании режут расходы на ИИ и переходят на более дешёвые модели

Бизнес меняет подход к генеративному искусственному интеллекту: в 2026 году компании всё чаще отказываются от логики «чем мощнее модель, тем лучше» и начинают считать реальную стоимость каждого запроса, строки кода и автоматизированного действия. Поводом стал быстрый рост счетов за использование ИИ-сервисов, особенно в крупных организациях, где эксперименты с ИИ перешли в повседневную работу инженерных, аналитических и офисных команд.

Об этом 29 июня сообщило Reuters. Агентство отмечает, что ещё недавно дорогие передовые модели считались обязательным инструментом для компаний, которые хотели «застолбить» место в новой технологической гонке. Теперь приоритет смещается: бизнес старается подобрать модель под конкретную задачу, а не покупать максимально мощное решение по умолчанию. Премиальные модели сохраняют значение для сложного программирования, исследований и критически важных сценариев, но для массовых операций компании всё чаще выбирают более дешёвые или open-source-решения.

Одним из самых показательных примеров стал Uber. По данным Reuters и профильных технологических изданий, компания израсходовала весь бюджет на ИИ-инструменты на 2026 год всего за четыре месяца после того, как сотрудники активно начали использовать сервисы для написания кода. После этого менеджменту пришлось вводить ограничения на использование таких инструментов и жёстче контролировать расходы.

Рост затрат связан не только с расширением внедрения ИИ, но и с самой моделью тарификации. В отличие от классической подписки на корпоративное ПО, многие ИИ-сервисы берут плату по фактическому потреблению: за токены, обращения к модели, длину контекста и работу агентных функций. В результате компаниям становится сложнее заранее прогнозировать счета, а при массовом использовании расходы могут расти скачкообразно.

Почему компании меняют стратегию

На этом фоне бизнес начал активнее использовать маршрутизацию запросов между моделями. Смысл в том, чтобы дешёвые модели выполняли стандартные операции, а дорогие подключались только там, где действительно нужна максимальная точность или сложная логика. Reuters со ссылкой на рыночные данные указывает, что доля open-source-токенов, проходящих через площадку OpenRouter, в июне выросла до 65% против 34% в январе. Это показывает, насколько быстро компании переориентируются на более доступные инструменты.

Выиграть от этой тенденции могут разработчики open-source-моделей и более дешёвых альтернатив, в том числе китайские игроки вроде DeepSeek. Такие решения уже получили широкое распространение у стартапов, а теперь постепенно заходят и в крупный корпоративный сегмент, хотя для больших компаний по-прежнему остаются чувствительными вопросы безопасности, соответствия требованиям и защиты данных.

Дополнительное давление создаёт и общая стоимость ИИ-инфраструктуры. В начале июня аналитики Morgan Stanley предупреждали, что рост цен на память и другие компоненты для ИИ-систем усиливает давление на корпоративные бюджеты, облачные расходы и капитальные затраты, а также может замедлять внедрение новых технологий. Иными словами, дорожают не только сами модели, но и вся цепочка их промышленного использования.

Что это значит для рынка ИИ

При этом речь не идёт об отказе бизнеса от искусственного интеллекта. Напротив, внедрение ускоряется. В середине июня вице-президент Google Cloud по Великобритании, Ирландии и странам Африки к югу от Сахары Морин Костелло говорила Reuters, что использование ИИ в корпоративной среде достигло «точки перелома»: компании переходят от пилотных проектов к масштабному применению и уже начинают видеть отдачу. Но именно массовое внедрение делает вопрос цены ключевым.

На рынке складывается более прагматичная модель потребления: компаниям нужен не «самый умный» ИИ как таковой, а предсказуемый по цене инструмент с понятной окупаемостью. Это меняет конкурентную среду для OpenAI, Anthropic, Google, Meta и разработчиков open-source-моделей. Побеждать будут не только те, кто предлагает лучшую производительность, но и те, кто умеет дать приемлемое качество при контролируемой себестоимости.

Отдельно на это указывают и долгосрочные прогнозы Gartner. В марте компания сообщила, что к 2030 году стоимость инференса для больших языковых моделей с одним триллионом параметров может снизиться более чем на 90% по сравнению с уровнем 2025 года. Однако для корпоративных заказчиков это не означает быстрого удешевления уже сейчас: пока внедрение расширяется быстрее, чем падает стоимость вычислений, счета для бизнеса продолжают расти.

Коротко о главном

Главная причина разворота рынка — переход от демонстрационного использования ИИ к промышленному масштабу, где на первый план выходят экономика, безопасность и управляемость. В ближайшие кварталы компании, вероятно, продолжат дробить задачи между дорогими и дешёвыми моделями, усиливать внутренний контроль за токенами и активнее тестировать open-source-решения. Это ускорит ценовую конкуренцию среди поставщиков ИИ и может сделать корпоративный рынок менее зависимым от нескольких самых дорогих моделей.