51$ в месяц: автономный агент, который кодит, ресерчит и постит сам - на уровне топ-моделей

Прошло 5 месяцев, как я глубоко погружаюсь в то, как правильно управлять агентами, чтобы получать эффективный и понятный конечный результат. Знакомство с этим началось в январе: я увидел мемкоины по openclaw и их соцсеть. Сразу начал читать, что это, смотреть видео, потом снял сервер на vdsina и попробовал поставить туда клешню (агента openclaw). После трех попыток я понял, как это надо было делать, но важнее - понял, что не понимаю, зачем мне вообще автономный агент. Пообщался со знакомым программистом, начал изучать Claude, сразу поставил Claude Code и понеслось... но это уже другая история)

Вторая встреча с автономными агентами случилась, когда зашумел Hermes, а мне жесть как не хватало лимитов на подписке x20: Claude с армией агентов строил Useful и быстро все выжигал. Я решил - мне нужен агент, который тратит меньше денег, но работает на уровне Claude. Ух, как наивен я был тогда)))

Хотел запустить локальную модель на компе - уперся в его мощности.
Пробовал гибридный мозг: локальная модель плюс что-то из OpenRouter.

Первый вариант не подошел - не хотел докупать ПК и нормальную видеокарту с памятью. А гибридный мозг быстро съел все, что я закинул на OpenRouter, потому что я плохо настроил задачи. Через 5 дней проб я сложил руки: идей, как поднять агента по цене подписки, пока не было.

3 дня назад я вспомнил про «Гонку» (Gonka) и братьев Либерманов, пошел серчить, какие там модели и API. И чудо — нахожу proxy.gonka, где во фри дают 1 миллиард токенов, а внутри:

Kimi K2.6
Qwen3 235B
MiniMax-M2.7

Попробовал. Claude сказал, что Kimi силен, но мне зашел MiniMax. Спросил у ребят, кто им пользовался, и мне рассказали про основную подписку MiniMax: куча плюшек, 1.7 млрд токенов в месяц, можно авторизоваться в Hermes — и все это за 20$. И у моего товарища агент на этой подписке, с которым я общался, его посты и "мысли" были интересны, я знал что модель не тупая.

Выбор стал очевиден. И тут до меня дошло: агента можно собрать очень выгодно.

Ниже подробно распишу, что и как использовать, чтобы верно настроить агента и выжимать из него максимум.

P.S. Он уже разрабатывает второй продукт. Первый был чисто для тестов и настройки, а второй скоро увидит свет.

Важные ссылки

proxy.gonka.gg (фри-токены, 1 млрд)
MiniMax (подписка-мозг, 20$)
ChatGPT (наставник)
Claude / Claude Code (наставник)
OpenRouter (доступ ко всем моделям по 1 api)
Hermes (оболочка для агента)
GPTSubs (бот для оплаты подписок: claude, gpt, grok, x premium и suno)

1. Терминал или автономный агент - разница, которую я полгода не видел

Когда работаешь с Claude в терминале, он ждет, пока ты инициируешь каждый шаг: команда - ответ - следующий ход. Кажется, что так у тебя максимум контроля. Я так и думал 5 месяцев. Засада в том, что в этой схеме узкое место - ты сам. Агент сидит и ждет, пока ты посмотришь, почитаешь, нажмешь, разрешишь.

Автономный агент работает иначе: он крутится в цикле сам. Дал ему цель - он тащит ее без тебя, хоть ночью, хоть пока ты на работе. Контроль никуда не девается - просто он теперь не в том, чтобы жать кнопки, а в том, как ты агента настроил: какие лимиты, какие рамки, как он проверяет работу. Это и есть главный сдвиг в голове, который я так долго не мог понять, как настроить, и не хватало достаточно умного мозга.

2. Стек за 51$ в месяц - из чего собран мой агент

Весь смысл - собрать дешево, но чтобы тянуло на уровень топов. Вот из чего:

Мозг - MiniMax по подписке, 20$. 1.7 млрд токенов в месяц, фикс-цена, авторизуется прямо в Hermes. Это основа нашего агента, которая работает постоянно.
Наставник - ChatGPT/Claude, 20$. Он подключается раз в 4 часа, проверяет и направляет. За счет него идеи, код и решения агента вытягиваются на уровень топ-моделей. Эта подписка нужна еще и для изначальной настройки бота и его поддержке, у меня подписка claude за 200$ и я использовал ее, но если у вас нет подписки, то советую ChatGPT - подписка дает больше лимитов.
(GPTSubs бот для оплаты подписок: claude, gpt, grok, x premium и suno)
Подписка X Premium, 11$. Эта подписка выводит нашего агента в твиттер, позволяет проводить там ресерч, искать посты, треды, отслеживать аккаунты. Агент может как сам заходить в грок через браузер, так же может скачать еще одного Hermes, запустить его на гроке через х подписку и у него уже готов автономный агент серчер.
(GPTSubs бот для оплаты подписок: claude, gpt, grok, x premium и suno)
Сервер - 6-20$, если нет своего ПК. У меня агент живет на втором компе, поэтому за сервер не плачу. Подойдет старый ноутбук, офисный процессор. Нет своего железа - берешь VPS, и это единственная плавающая статья.

Итого ядро - 51$ (20$ + 20$ + 11$), сервер сверху по ситуации. И у нас остается Kimi K2.6 через гонку, на ней можно запустить еще одного агента, разделить между ними задачи и у вас уже целая команда (можно все сделать и на базе одного).

3. Главная фишка - наставник, который тянет агента на уровень топ-моделей

«Подсознание», или главный двигатель эволюции в вашем агенте. Двухуровневая система:

Рабочий - дешевый MiniMax. Онлайн постоянно, делает основную массу задач.
Наставник - ChatGPT/Claude. Заходит раз в 4 часа, разбирает работу рабочего, подсказывает идеи, чистит код и направляет. А так же MiniMax может напрямую обратиться к ChatGPT или Claude, чтобы они помогли агенту если он не может найти решение или проаудировали его идею, код, ход логики.

Получается как на стройке: рабочий вкалывает всю смену, а наставник проверяет, держит уровень и помогает, где нужно. Из-за наставника то, что выдает дешевый агент, по качеству идей, кода и решений получается на уровне топ-моделей - а платишь ты копейки относительно того, если бы все гонял на топовой модели напрямую.

Это и есть ответ на мой наивный вопрос «как сделать дешево, но на уровне Claude»: не одной супер-моделью на все, а связкой дешевый исполнитель плюс умный наставник.

4. Автономность и экономия: чтобы работал сам и не выжигал бюджет

Непрерывность дает сама оболочка Hermes. Внутри есть доска задач (kanban - карточки «сделать / в работе / готово») и кроны (запуск задач по расписанию). Мозг крутится сам, кроны только подталкивают и улучшают - агент не ждет тебя.

Чтобы не повторить мою историю с выжженным балансом, сразу ставь рамки:

Дневные лимиты на вопросы к наставнику - бюджет не утечет за ночь.
Правило, которое я повесил на стену: «дешево и плохо» не считается работой. Экономия не должна превращаться в халтуру.
Лимиты - это не ограничение свободы, это и есть контроль. Ты задаешь потолок один раз, а дальше отпускаешь процесс спокойно.

5. Безопасность и тонкости Hermes: коробка, запертые настройки и грабли

То, чего я сам боялся в начале (а он не сделает что-то опасное?), решается изоляцией и парой правил.

Ограниченное пространство. Агент живет в отдельной мини-системе (WSL - Linux внутри Windows): не видит твои диски, без прав администратора. Можно держать его и на отдельном втором ПК, как у меня.

Запертые настройки. Лимиты и «характер» агента храни там, куда сам агент писать не может. Звучит параноидально, но без этого агент со временем сам ослабит свои правила, чтобы ему было «удобнее» закрыть задачу.

Теперь тонкости самой оболочки - Hermes из коробки тяжелый и прожорливый, его надо подрезать:

Укороти главный файл-инструкцию: по стандарту он огромный и грузится в каждый запрос, то есть жжет токены на пустом месте.
Оставь одну платформу связи (Telegram), остальные отключи.
Отключи лишние наборы инструментов и плагины, которые агент все равно не трогает.
Снизь число повторов цикла (итераций), чтобы агент не уходил в бесконечность на одной задаче.

И две грабли, на которых легко обжечься:

Крон по расписанию. Если задать просто длительность вроде 4h, создается ОДНОРАЗОВЫЙ таймер, а не повторяющийся. Нужно писать «каждые N минут». Я ждал, что задача будет повторяться, а она сработала один раз и затихла.
Тишина агента - это почти всегда «что-то сломалось». Сделай резервный канал: пусть пишет статус в файл, если основной мессенджер умрет, иначе поздно узнаешь, что агент не работает.

6. Что из этого можно собрать

Самое интересное - это не «один бот», а база, из которой создается почти что угодно:

личный ассистент;
завод программ (агент сам кодит продукты);
ресерчер (собирает и разбирает информацию);
маркетолог;
контент-завод с автопостингом;
и дальше по фантазии - все на этой же связке.

И за счет наставника все это работает не на уровне «дешевой модельки», а на уровне топов.

7. С чего начать: стек, кроны и промт-помощник

Если хочешь повторить - вот короткий путь и готовый рецепт.

Шаг 0. Не ставь сразу автономного агента - я на этом обжегся. Начни с Claude или GPT в терминале и одной реальной задачи из своей жизни, чтобы понять механику.

Шаг 1. Потрогай модели на Гонке по фри-токенам, ничего не платя.

Шаг 2. Понравился MiniMax - бери подписку за 20$ и подключай к Hermes.

Шаг 3. Подними агента в отдельной коробке (или на втором ПК), повесь дневные лимиты и наставника.

Шаг 4. Подрежь Hermes по списку из раздела 5 и поставь резервный канал.

Кроны, которые реально нужны (у меня стоят такие):

Основной рабочий цикл - раз в час. Агент делает осознанный шаг к задаче и отчитывается.
Наставник - раз в 4 часа. Разбирает работу и пишет советы (та самая фишка из раздела 3).
Сторож - раз в 30 минут. Проверяет, что агент жив и кроны не упали.
По желанию: сторож-самопочинка (сам находит и чинит ошибки) и поток новых идей раз в 6 часов.
Помни про граблю: задавай «каждые N минут», а не голую длительность, иначе крон сработает один раз.

Лимиты (где реально течет бюджет):

Мозг (MiniMax) на подписке - цена фиксированная, по нему лимит не нужен, он и так в рамках 1.7 млрд токенов в месяц.
Наставник - вот его и ограничивай: у меня стоит около 24 вызовов в день. Раз в 4 часа это всего 6 заходов плюс запас - хватает с головой, а кошелек цел.
Держи этот потолок в отдельном месте, куда агент сам залезть не может (об этом в разделе 5).

Промт-помощник. Если не хочешь копаться сам - вставь это в Claude или ChatGPT, и он проведет тебя по настройке за руку:

«Помоги мне с нуля поднять автономного агента на оболочке Hermes, веди по одному шагу и объясняй простыми словами (я не программист). Стек: мозг - MiniMax по подписке (авторизация прямо в Hermes), наставник - ты, раз в 4 часа разбираешь работу агента и пишешь советы, связь - Telegram, агент в изоляции (отдельный ПК или WSL, без прав администратора). Сделай со мной по порядку: 1) подключить MiniMax к Hermes; 2) урезать Hermes - короткий файл-инструкция, оставить только Telegram, выключить лишние тулсеты и плагины, снизить число итераций; 3) настроить кроны: основной цикл раз в час, наставник раз в 4 часа, сторож раз в 30 минут (и помни: пиши «каждые N минут», а не голую длительность, иначе сработает один раз); 4) поставить дневной лимит на вызовы наставника (хватит около 24 в день) и резервный канал - запись статуса в файл. После каждого шага проверяй со мной, что он реально заработал, и только потом иди дальше.»

У меня на весь этот путь ушло 5 месяцев заблуждений и 3 дня экспериментов. У тебя теперь есть моя карта - пройдешь быстрее. Если есть вопросы пиши мне в тг - @Sol0xWarrior.

Важные ссылки

proxy.gonka.gg (фри-токены, 1 млрд)
MiniMax (подписка-мозг, 20$)
ChatGPT (наставник)
Claude / Claude Code (наставник)
OpenRouter (доступ ко всем моделям по 1 api)
Hermes (оболочка для агента)
GPTSubs (бот для оплаты подписок: claude, gpt, grok, x premium и suno)

Мой тг канал: https://t.me/cryptodot222

Навигация

Важные ссылки

1. Терминал или автономный агент - разница, которую я полгода не видел

2. Стек за 51$ в месяц - из чего собран мой агент

3. Главная фишка - наставник, который тянет агента на уровень топ-моделей

4. Автономность и экономия: чтобы работал сам и не выжигал бюджет

5. Безопасность и тонкости Hermes: коробка, запертые настройки и грабли

6. Что из этого можно собрать

7. С чего начать: стек, кроны и промт-помощник

Важные ссылки