Как я перестал упираться в лимиты Claude: 10 привычек, которые реально работают

Нашел тред от @0x_kaize который набрал 10 миллионов просмотров в твиттере. Чувак разобрал как перестать упираться в лимиты Claude. Я перевел, проверил каждый пункт и добавил свои комментарии — потому что не все советы одинаково полезны.

Главная мысль: Claude не считает количество сообщений. Он считает токены. И если ты тратишь их бездумно, ты сжигаешь свой лимит в никуда.

Подготовил: https://t.me/cryptotimurka

1. Редактируй промпт, а не пиши "нет, я имел в виду..."

Когда Claude выдает не то что ты хотел, рука тянется написать:

— "Нет, я имел в виду вот это..." — "Блин, не то. Переделай вот так..."

Не делай этого.

Каждое новое сообщение добавляется в историю диалога. Claude перечитывает ВСЮ историю при каждом ответе, сжигая токены на контекст, который даже не помог.

Стоимость каждого сообщения = все предыдущие сообщения + твое новое.

При средних 500 токенах на обмен:

5 сообщений: 7,500 токенов
10 сообщений: 27,500 токенов
20 сообщений: 105,000 токенов
30 сообщений: 232,000 токенов

Сообщение номер 30 стоит в 31 раз дороже, чем первое. Тридцать один раз, Карл.

Вместо этого: нажми "Edit" на своем исходном сообщении, исправь его и перегенерируй. Старый обмен заменяется, а не складывается в стопку.

Чини промпт, а не корми историю.

2. Начинай новый чат каждые 15-20 сообщений

В предыдущем пункте я показал как растет стоимость токенов с каждым сообщением. В идеале новый чат нужно начинать каждые 15-20 сообщений.

Теперь представь чат на 100+ сообщений. При ~500 токенах на обмен это больше 2.5 миллионов сожженных токенов. И большая часть ушла просто на перечитывание старой истории.

Один разработчик замерил свое потребление и выяснил, что 98.5% токенов тратились на перечитывание истории. На сам результат шло всего 1.5%.

Когда чат становится длинным: попроси Claude все суммировать, скопируй саммари, открой новый чат, вставь как первое сообщение. Все, ты снова на старте с чистым контекстным окном.

Мой комментарий: по математике все верно, но на практике это жутко неудобно. Саммари никогда не передает 100% контекста, и в новом чате ты неизбежно теряешь нюансы. Особенно если кодишь и там куча зависимостей и решений. Лично я таким не пользуюсь — проще следить за тем чтобы промпты были четкими с самого начала.

3. Объединяй вопросы в одно сообщение

Многие думают что разбивка вопросов по отдельным сообщениям дает результат лучше. Почти всегда это наоборот.

Три отдельных промпта = три загрузки контекста. Один промпт с тремя задачами = одна загрузка контекста.

Вместо:

"Суммаризируй эту статью"
"Теперь выдели ключевые моменты"
"Теперь придумай заголовок"

Пиши:

"Суммаризируй эту статью, выдели ключевые моменты и придумай заголовок."

Бонус: ответы часто получаются лучше, потому что Claude сразу видит полную картину того, что тебе нужно.

Три вопроса. Один промпт. Всегда.

Мой комментарий: работает отлично, но с оговоркой. Если задачи связаны между собой (суммаризация + ключевые моменты + заголовок) — результат реально лучше, потому что Claude видит полную картину. Но если задачи слишком разные по сложности (напиши код + проверь грамматику + придумай название), Claude может одну сделать хорошо, а остальные слить. Для связанных задач — всегда объединяй. Для разнородных — лучше отдельно.

4. Загружай повторяющиеся файлы в проекты

Если ты загружаешь один и тот же PDF в разные чаты, Claude токенизирует этот документ каждый раз заново.

Вместо этого используй фичу "Projects". Загрузил файл один раз, он кешируется. Каждый новый разговор внутри проекта обращается к нему без повторного сжигания токенов.

Если работаешь с контрактами, брифами, стайл-гайдами или любыми длинными документами, одно это может кардинально сократить расход токенов.

5. Настрой память и пользовательские предпочтения

Каждый новый чат без сохраненного контекста тратит 3-5 сообщений на установку: "Я маркетолог, пишу в разговорном стиле, предпочитаю короткие параграфы..."

Наверняка видел как люди начинают каждый промпт с "Act as a..." — это токены сожженные на повтор. Claude может запомнить это навсегда.

Заходишь в Settings → Memory and User Settings. Сохраняешь свою роль, стиль коммуникации и настройки один раз. Claude будет автоматически применять их к каждому новому чату.

Мой комментарий: совет рабочий, но экономия небольшая — по сути экономишь 3-5 сообщений на старте каждого чата. Не революция, но приятная гигиена. Настроил один раз и забыл.

6. Выключай Extended Thinking когда не нужен

Extended Thinking (расширенное мышление) жрет токены как не в себя. Это режим где Claude "думает" перед ответом, и каждый такой мыслительный процесс — это дополнительные токены которые ты не видишь, но которые считаются.

Держи выключенным по умолчанию. Включай только когда задача реально сложная и первая попытка без него не устроила.

Мой комментарий: я сам очень часто пользуюсь Extended Thinking, потому что для сложных задач он дает заметно лучший результат. Но именно поэтому важно понимать, что он стоит дорого. Для простого "переведи текст" или "отформатируй таблицу" включать его — чистое расточительство.

7. Используй Haiku для простых задач

Проверка грамматики, брейнштормы, форматирование, быстрые переводы, короткие ответы — Haiku справляется со всем этим при гораздо меньшей стоимости чем Sonnet или Opus.

Выбор правильной модели — это самое важное решение, которое ты принимаешь каждый день.

Haiku на драфты и простые задачи — это 50-70% бюджета, высвобожденного для задач, которые реально требуют мощных моделей.

Ментальная модель:

Haiku → быстрые задачи, низкая стоимость
Sonnet → нормальная работа, средняя стоимость
Opus → глубокий анализ, высокая стоимость

Не нужна пушка для воробьев.

Мой комментарий: все верно, но есть нюанс. На Pro-плане ($20/мес) у тебя отдельные лимиты на каждую модель. То есть использование Haiku технически не "высвобождает бюджет" для Opus — это разные пулы. Но привычка выбирать модель под задачу все равно правильная: ты быстрее получаешь результат и не ждешь пока тяжелая модель отработает простой запрос.

8. Распределяй работу по дню

Система Claude использует скользящее окно в 5 часов. Лимит не сбрасывается в полночь — он постепенно убывает. Сообщения отправленные в 9 утра перестают учитываться к 14:00.

Если ты сжигаешь весь лимит за одну утреннюю сессию, большая часть твоего дневного ресурса остается неиспользованной.

Дели день на 2-3 сессии: утро, день, вечер. К моменту когда ты возвращаешься, предыдущее потребление уже не считается и у тебя новый лимит.

9. Работай в непиковые часы

С 26 марта 2026 Anthropic быстрее расходует твой лимит 5-часовой сессии в пиковые часы:

5:00 — 11:00 по тихоокеанскому времени (15:00 — 21:00 по Москве) в будние дни.

Тот же запрос, тот же чат — но в пиковые часы он сильнее бьет по лимиту.

Недельный лимит остается прежним. Но распределение изменилось. Тяжелые задачи вечером или на выходных заметно растянут твой план.

Если ты в Европе или СНГ — пиковые часы приходятся на твой вечер. Учитывай.

10. Пиши конкретные промпты с первого раза

Самый тупой способ сжечь токены — написать размытый промпт, получить не то, потом уточнять в 5 сообщениях. Каждое уточнение — это экспоненциальный рост стоимости (см. пункт 1).

Вместо "напиши мне текст про крипту" пиши "напиши пост на 200 слов для телеграм-канала про то, как работают prediction markets, в разговорном стиле, без воды".

Чем точнее промпт, тем меньше итераций. Чем меньше итераций, тем меньше токенов. Математика простая.

Потрать 2 минуты на формулировку запроса — сэкономишь 20 минут на переделках и кучу токенов в процессе.

Итого

Сначала будет тяжело следить за всеми правилами. Но когда привыкнешь применять их на автомате, ты почти никогда не будешь упираться в лимиты.

Может даже переедешь с Max-плана на обычный — токенов будет хватать.

Claude не считает сообщения. Он считает токены.

Подготовил: https://t.me/cryptotimurka