Стек для AI-агента в 2026: Claude Code, Cursor, Qdrant, Voyage AI — как я собрал рабочее окружение для своего проекта

Если ты сейчас в начале пути и собираешь окружение под собственный проект с использованием ИИ — ты, скорее всего, уже столкнулся с тем, что инструментов слишком много, советы противоречат друг другу, а каждый второй гайд устарел. Я прошёл этот этап выбора и хочу честно показать, какой стек получился у меня, и главное — почему именно эти инструменты, а не десятки других популярных альтернатив.

Эта статья — не про "лучший AI-стек на свете", а про логику выбора. Прочитав её, ты сможешь сам решить, подходит ли такой набор тебе, или твоя задача требует другого. Я и дальше буду делиться дальнейшими находками и решениями по ходу проекта у себя в канале - https://t.me/C_Pulse.

Зачем вообще собирать собственный стек

Можно работать с ИИ через готовые продукты — ChatGPT, Claude, NotebookLM. Этого достаточно для обычных задач: спросить, перевести, набросать документ. Но если ты хочешь построить рабочую систему для полноценного бизнес-проекта, в которой ИИ-агент имеет доступ к твоей обширной базе знаний, помнит весь контекст между сессиями и сам выполняет задачи — нужен персональный стек.

Это не значит "программируй с нуля". Это значит — выбрать правильные кубики и собрать из них окружение под себя. Каждый кубик решает свою задачу, и важно понимать, какую именно. Иначе получится "купил дорогую гитару и комбоусилитель, а играть не научился".

Карта инструментов: что и зачем

Вот стек, который я собрал.

(картинку Grok сгенерил дизайн топ но с дезигном текста чудит иногда)

Карта инструментов: что и зачем

Дальше разберу каждый компонент отдельно.

Слой / Инструмент / Что делает и зачем /

Мозг (агент) Claude Code Автономный ИИ-агент в терминале, выполняет задачи end-to-end. Удобен в связке с курсором.
Среда разработки Cursor IDE на базе VS Code со встроенным ИИ. С клодом можно использовать и бесплатно.
База знаний (визуально) Obsidian Markdown-заметки, доступные и человеку, и агенту
Векторная база Qdrant Хранит транскрипты в виде векторов для семантического поиска

У меня много материалов в виде видео в которых хранится ценная для проекта информация. Поэтому видео транскрибируется и складывается в векторную базу - если коротко то векторная база лучше для связности при обработке длинных видео из которых нужно правильно вытягивать контекст. Тут опять же база нужная как второй мозг для клода, чтобы он все помнил и не жег в холостую токены.

Эмбеддинги Voyage AI Превращает текст в векторы лучше, чем большинство альтернатив

Если коротко Obsidian + Qdrant + Voyage AI это все для одной цели чтобы хранить и обрабатывать всю вашу Базу знаний и наработки через клод. Такие связки называют RAG системами и они могут быть разными под каждую задачу, если хочется углубиться в эту тему то вот хорошая статья, если сложно разобраться просто опишите ваш проект и ваши данные клоду и он сам порекомендует оптимальное для Вас и вашего проекта решение.

Транскрибация Faster-Whisper (large-v3-turbo) Превращает видео-материалы в текст локально на GPU

Если у вас как у меня много видео, то можно с помощью этой приблуды транскрибировать все в текст и скормить RAG системе. И клод дальше будет генерировать решения используя вашу базу знаний. Например вы можете скормить так полезный курс по маркетингу или по копирайтингу и Клод будет с учетом него генерить все, что вам потребуется.

Контейнеризация Docker Desktop Запуск Qdrant и других сервисов изолированно
Linux-окружение WSL2 + Ubuntu 24.04 Среда, где работают современные AI-инструменты.

Я поднимаю все на винде поэтому оптимальнее поднять дополнительно убунту, так просто работать будет быстрее и глючить будет меньше т.к для убунты решений различных больше и работают они стабильнее. Если у вас Мак то это делать не потребуется. Да и с виндой можно не делать, если готовы на периодические глюки;

Версионирование Git + GitHub Защита от потери данных, история всех изменений
Дизайн Figma Макеты лендингов и интерфейсов

Пока у меня макеты в фигме, но планирую перейдти на Клод Дизайн.

Минимальный ююджет такого старта — около 20-40 долларов в месяц на подписки и копейки на API при умеренной работе. При активной работе ну скажес 100-150 баксов. Дальше — детально.

Claude Code — главный инструмент: почему он, а не GPT или Gemini

Claude Code от Anthropic — это автономный ИИ-агент, запускающийся в терминале. Не редактор, не чат-бот в браузере. Это инструмент, которому можно сказать "проиндексируй вот эти 1500 видео, проверь качество транскрипции, перезапусти провалившиеся" — и он сделает всю задачу самостоятельно, подкрепляясь отчётами на каждом шаге.

Почему Claude, а не GPT-5 или Gemini 3

Во-первых, на апрель 2026 года Claude Opus 4.7 и Sonnet 4.6 — лучшие модели для агентных задач. Это видно и по бенчмаркам (SWE-bench, Terminal-bench), и по практике сообщества разработчиков. Anthropic с самого начала фокусировалась именно на агентных применениях, и эта инвестиция видна.

Во-вторых, Claude Code как продукт обогнал конкурентов по зрелости. У OpenAI есть Codex CLI, у Google есть Antigravity — но и тот и другой моложе, имеют меньше пользовательской базы, меньше готовых интеграций через MCP (Model Context Protocol — стандарт подключения инструментов к ИИ-агентам. Например очень просто подключается Google Drive / Календарь / Miro и еще куча полезного).

В-третьих, подписка Claude Pro ($20/мес) даёт доступ и к веб-интерфейсу claude.ai, и к Claude Code в терминале без отдельного API-биллинга, в рамках лимитов. Это очень удобно для старта — предсказуемая стоимость, не нужно следить за расходом токенов.

Я настоятельно рекомендую для работы использовать платную подписку ИИ. Сейчас бесплатные уже заметно отстают в профессиональных вопросах.

Когда стоит апгрейдиться на Claude Max

Лимитов Pro хватит на 1-3 часа активной агентной работы в день. Если упираешься в потолок — есть Claude Max за $100 или $200 в месяц с лимитами в 5-20 раз больше. Решение принимается по факту через несколько недель работы, не на старте.

Cursor — почему именно он среди IDE с ИИ

Cursor — это IDE (среда разработки), форк VS Code со встроенным ИИ. Главные функции — чат с моделями прямо в окне, инлайн-редактирование по Ctrl+K, режим Composer (агент), и Tab — умное автодополнение, которое работает и в коде, и в Markdown, и в любом тексте.

Cursor vs Antigravity: честное сравнение

Среди IDE с ИИ сейчас три серьёзных игрока: Cursor, Windsurf и новый Antigravity от Google. Я выбрал Cursor.

Cursor — самый зрелый продукт, два с лишним года на рынке, миллионы пользователей. Огромное сообщество, тонна гайдов на русском, стабильная работа. Поддерживает любые модели — Claude, GPT, Gemini — через свой прокси.

Antigravity вышел осенью 2025 и построен вокруг Gemini 3 как основного движка с упором на автономную агентную работу. На бумаге звучит интересно, но на практике проект ещё сырой, и его автономный агент дублирует функционал Claude Code. Зачем два агента, конкурирующих за одну роль?

Windsurf — нишевая альтернатива Cursor, тоже хорош, но сообщество меньше.

Логика такая: если основной агент у меня — Claude Code в терминале, то IDE нужна как редактор и помощник для быстрых правок, не как ещё один автономный мозг. В этой роли Cursor оптимален.

Платить ли за Cursor Pro

На старте для меня — бесплатный план достаточен. Планирую использовать подписку Claude и в правки кода я особо не лезу. Если по факту окажется, что я провожу в чате Cursor много времени — оформлю Cursor Pro за $20/мес. Решение по факту нагрузки, не заранее.

Obsidian — почему он, а не Notion

Obsidian — это бесплатный редактор заметок, работающий с локальными Markdown-файлами. На первый взгляд похож на Notion, но критическое отличие — данные лежат у тебя на диске, не в облаке.

Почему это важно для AI-проекта

Когда у тебя есть ИИ-агент (Claude Code), ты хочешь, чтобы он писал результаты прямо в твою базу знаний. Если база — это локальные файлы, агент пишет туда обычной командой записи файла. Если база — Notion, нужно ходить через их API, медленнее и сложнее.

Плюс — транскрипты всех моих 1500 обучающих видео, которые я буду индексировать, это тоже Markdown-файлы. Они лежат в той же папке, что и заметки в Obsidian. Получается единая структура: и я открываю их через красивый редактор, и Claude Code читает их напрямую с диска.

Notion и Google Docs — когда они

Notion имеет смысл подключить позже, когда:

Нужна совместная работа с подрядчиками (копирайтер, дизайнер)
Нужны структурированные базы данных вроде CRM
Нужны публичные страницы

Для одиночной работы и интеграции с ИИ-агентом Obsidian существенно лучше.

Qdrant — векторная база для семантического поиска

Qdrant — это специализированная база данных для векторного поиска, написанная на Rust. Запускается локально через Docker, бесплатна, очень быстрая.

Что такое векторный поиск простыми словами

Обычный текстовый поиск ищет по совпадению слов. Если в материалах было сказано "техника для возражений по цене", а ты ищешь "как работать с ценовыми возражениями" — обычный поиск ничего не найдёт.

Векторный поиск ищет по смыслу. Каждый кусок текста превращается в массив чисел (вектор), описывающий его смысл. Запрос тоже превращается в вектор. База находит куски текста с самыми похожими векторами — то есть с похожим смыслом, даже если слова разные.

Это критично для AI-агента. Когда Claude Code работает над задачей "напиши контент-план", он формулирует поисковые запросы под себя ("целевая аудитория", "эмоциональные триггеры"), и ему нужна понимающая смысл база, а не точный поиск слов.

Qdrant vs Pinecone vs ChromaDB

Конкурентов у Qdrant много. Сравним коротко:

Решение / Где работает / Цена / Производительность

Qdrant Локально (Docker) или облако Бесплатно локально Отличная
ChromaDB Локально Бесплатно Хуже на больших объёмах Pinecone Только облако От $70/мес Отличная
Weaviate Локально/облако Бесплатно локально Отличная, сложнее в настройке
pgvector PostgreSQL Бесплатно Хуже на чистом векторном поиске

Qdrant выигрывает по совокупности: бесплатно, локально, быстро, готовый MCP-сервер для подключения к Claude Code, простая миграция в облако позже если понадобится.

Voyage AI — почему внешние эмбеддинги, а не локальные

Voyage AI — компания, делающая модели эмбеддингов (превращающие текст в векторы). Anthropic официально рекомендует её как партнёра для работы с Claude.

Локальные эмбеддинги тоже работают

На моей RTX 3060 Ti можно запустить хорошие открытые модели — BGE-M3, multilingual-e5-large. Они бесплатны, не требуют интернета, работают на GPU. Логично же выбрать их?

Не совсем. Вот в чём дело: качество поиска прямо зависит от качества эмбеддингов. Voyage-3 на бенчмарках по русскому языку даёт на 15-25% более точные результаты, чем большинство открытых моделей. На длинных технических текстах (а транскрипты 1-2 часовых лекций — именно такие) разрыв ещё больше.

Сколько это стоит

Voyage AI берёт деньги за токены при индексации. Грубая прикидка для моих ~3000 часов аудио: единоразовая индексация всех транскриптов выйдет в 5-15 долларов. Дальше каждый поисковый запрос — это эмбеддинг короткой фразы, копейки.

При регистрации Voyage даёт 50 долларов бесплатных кредитов на старт — этого с большим запасом хватит на полную индексацию.

Когда я бы выбрал локальные эмбеддинги

Если бы данные были конфиденциальные (например, записи разговоров с клиентами — тогда да, лучше локально)
Если бы не было интернета или средств
Если бы качество поиска было некритично

Для базы видео контента на этапе 1 — Voyage AI оптимален.

Faster-Whisper и каскадная транскрибация

Перед индексацией все 1500 видео нужно превратить в текст. На английском это решённая задача — на русском всё чуть сложнее, потому что русский — не самый большой язык в обучающих данных Whisper.

Faster-Whisper, а не оригинальный Whisper

Faster-Whisper — это переписанная версия Whisper на движке CTranslate2. Работает в 4-5 раз быстрее оригинала на той же видеокарте, использует меньше памяти. Качество идентичное.

Почему каскадный подход лучше "просто large-v3"

Изначально я планировал гнать всё через large-v3 — самую качественную модель. Но это медленно: на 3000 часов аудио ушло бы 600-750 часов чистого времени работы GPU.

Идея каскада: сначала быстрая модель, потом проверка качества, медленная модель только на проблемных файлах.

Финальный пайплайн:

Первый проход — large-v3-turbo: почти как large-v3 по качеству, но быстрее в 2 раза
Авто-проверка качества по нескольким метрикам — avg_logprob, compression_ratio, наличие классических галлюцинаций ("Спасибо за просмотр" в тишине), плотность слов
Второй проход на провалившихся — large-v3 без VAD, чтобы взять то, что первый проход пропустил

Экономия по времени — примерно в 2 раза без потери качества. Несколько недель ночных прогонов превращаются в полторы.

Альтернатива — облачные сервисы

Можно отдать всё на Deepgram или AssemblyAI. Стоимость ~$0.005-0.01 за минуту аудио, на моём объёме это 200-400 долларов единоразово. Удобно — пара дней и всё готово, но дорого по сравнению с локальной транскрибацией. Их API я оставил на запасной вариант для самых проблемных файлов.

Docker Desktop, WSL2 и Git — фундамент, без которого всё остальное не работает

Эти три вещи — не "выбранные инструменты" в смысле "я долго думал". Это стандартный фундамент любой современной разработки.

WSL2 (Windows Subsystem for Linux)

WSL2 — это технология Microsoft, позволяющая запускать настоящий Linux внутри Windows без виртуальной машины. Большинство современных AI-инструментов изначально создаются под Linux. На Windows они часто работают, но с проблемами и танцами с бубном. В WSL2 — стандартно и предсказуемо.

Установка одной командой: wsl --install -d Ubuntu-24.04. Дальше у тебя в меню Пуск появляется Ubuntu, и в нём ты ставишь все Linux-инструменты как обычно.

Docker Desktop

Docker позволяет запускать сервисы в изолированных контейнерах. Для меня это нужно, чтобы запустить Qdrant одной командой без необходимости устанавливать его как программу. Завтра я могу его остановить, переустановить, заменить — без последствий для системы.

Git и GitHub

Git — версионирование. Каждое изменение в проекте сохраняется. Если что-то сломалось — можно откатиться на любую предыдущую версию. GitHub — облачное хранилище для репозиториев Git, бесплатное для приватных проектов.

Это обязательный инструмент. Без Git ты гарантированно потеряешь часть работы. С Git — никогда.

Figma — для дизайна посадочных и баннеров

Figma — стандарт индустрии для дизайна интерфейсов. Бесплатный план даёт до 3 проектов с неограниченными файлами — этого с большим запасом хватит для одиночного проекта.

Альтернатива — Canva — проще для непрограммиста, больше готовых шаблонов. Хороша для быстрых баннеров и постов в соцсети. Но у Figma есть критическое преимущество: Claude Code умеет работать с Figma через MCP. Я могу нарисовать в Figma макет страницы и попросить агента "сверстай эту страницу как HTML" — он посмотрит дизайн и напишет код. С Canva такого нет.

Поэтому беру обе: Figma для серьёзного дизайна и того, что пойдёт в код, Canva для быстрой оперативной графики.

Что НЕ вошло в стек и почему

Чтобы выбор был полным, расскажу про инструменты, которые мне рекомендовали и которые я отверг.

LM Studio

LM Studio — десктопная программа для запуска локальных LLM. Хороша, если нужно работать оффлайн или экспериментировать с открытыми моделями. Но это не RAG-решение в полноценном смысле, и качество локальных моделей размером 7-8B (которые влезут в 8 ГБ VRAM моей 3060 Ti) сильно ниже Claude. Для серьёзной работы не подходит.

LightRAG

LightRAG — это RAG-фреймворк с графами знаний. Извлекает сущности и связи из документов автоматически. Хорош для научной литературы, медицинских данных, юридических текстов — там где много чётких сущностей и сложных связей.

Для маркетингово-обучающего контента (где много общего нарратива) выигрыш над обычным RAG будет небольшим, а сложность настройки и стоимость индексации — в разы выше. Может быть имеет смысл попробовать позже как апгрейд, не как базовое решение.

NotebookLM

NotebookLM от Google — крутой инструмент для исследования материалов. Загружаешь документы, общаешься, получаешь mind-map, можешь сгенерировать аудио-обзор. Бесплатный.

Планирую использовать для локальных исследований, но он не заменяет основной RAG и у него есть лимит источников, нельзя контролировать индексацию. В общем использую как бонусный инструмент для творческих сессий с материалами, не как основу.

Готовые "kit"-репозитории на GitHub

Регулярно появляются проекты типа "одной командой развернёшь себе AI-сервер с памятью и Telegram-ботом". Заманчиво, но опасно: внутри куча решений принятых под чужие задачи, авторы часто бросают проекты, при поломке непонятно что чинить. Лучше построить свой стек из понятных компонентов, чем брать чужой комбайн целиком.

Сколько это всё стоит

Месячная стоимость моего стека на старте:

Подписка / Цена в мес.

Claude Pro $20 или $100
Cursor (бесплатный план) $0
Anthropic API (резерв) от $10
Voyage AI (после бесплатных $50) $1-3 после индексации
Obsidian, Qdrant, Whisper, Docker, Git, Figma $0
Итого ~$30-40/мес на старте. Думаю что в среднем на самом деле будет выходить около 100-150$

Единоразово на старте: ~$5-15 за полную индексацию транскриптов в Voyage AI.

При росте нагрузки можно апгрейдиться: Claude Max ($100/мес) вместо Pro, Cursor Pro ($20/мес) если активно работаю в IDE.

Главный принцип выбора

Когда тебе советуют новый инструмент, задавай три вопроса:

Решает ли он мою конкретную задачу или похожую?
Кто его разработчик и насколько проект живой? (звёзды на GitHub, активность коммитов, размер сообщества)
Что будет если он сломается — я могу починить или зависну?

Это отсеивает 80% советов. Остальные 20% — реально полезные.

И второй принцип: не оптимизируй заранее. Выбирай минимально достаточное, начинай работать, апгрейдь только когда упрёшься в реальное ограничение. Это сохраняет деньги, время и ясность мышления.

Что дальше

Стек собран — теперь буду делать проект. По ходу буду пробовать новые инструменты, что-то менять, находить решения для задач, которые сейчас даже не на горизонте.

Если тебе интересна тема Claude Code, AI-агентов и работающих стеков для предпринимателя или перехода на ИИ-стек — у меня есть Telegram-канал, где я буду выкладывать обновления, удачные скилы, разбор ошибок и инструменты по мере их появления в моём проекте.

👉 Подписаться на канал — и не пропустить следующий пост о том, как реально работает связка Claude Code + Qdrant на массиве из 1000+ видео.

Эта статья — часть серии о построении AI-агента для solo предпринимателя. Если у тебя есть свой опыт сборки стека или вопросы по инструментам — напиши в комментариях или мне в личку.

Навигация

Зачем вообще собирать собственный стек

Карта инструментов: что и зачем

Claude Code — главный инструмент: почему он, а не GPT или Gemini

Почему Claude, а не GPT-5 или Gemini 3

Когда стоит апгрейдиться на Claude Max

Cursor — почему именно он среди IDE с ИИ

Cursor vs Antigravity: честное сравнение

Платить ли за Cursor Pro

Obsidian — почему он, а не Notion

Почему это важно для AI-проекта

Notion и Google Docs — когда они

Qdrant — векторная база для семантического поиска

Что такое векторный поиск простыми словами

Qdrant vs Pinecone vs ChromaDB

Voyage AI — почему внешние эмбеддинги, а не локальные

Локальные эмбеддинги тоже работают

Сколько это стоит

Когда я бы выбрал локальные эмбеддинги

Faster-Whisper и каскадная транскрибация

Faster-Whisper, а не оригинальный Whisper

Почему каскадный подход лучше "просто large-v3"

Альтернатива — облачные сервисы

Docker Desktop, WSL2 и Git — фундамент, без которого всё остальное не работает

WSL2 (Windows Subsystem for Linux)

Docker Desktop

Git и GitHub

Figma — для дизайна посадочных и баннеров

Что НЕ вошло в стек и почему

LM Studio

LightRAG

NotebookLM

Готовые "kit"-репозитории на GitHub

Сколько это всё стоит

Главный принцип выбора

Что дальше