Обзор Claude 3.7 Sonnet: Революция в программировании или очередной хайп?
Введение
Вчера компания Anthropic наконец-то выпустила "Claude 3.7 Sonnet" — большую языковую модель, которую с нетерпением ждали программисты по всему миру. Эта модель вызывает одновременно восторг и страх: её анонсирующее видео стало настоящим событием, а самый популярный комментарий к нему принадлежит тем, кто с трепетом ждал этого релиза. Проведя тесты с использованием миллионов токенов, я могу сказать кратко: Claude 3.7 — абсолютный лидер.
Производительность и возможности
Claude 3.7 демонстрирует выдающиеся результаты в различных тестовых бенчмарках, доводя свои способности до предела. Эта модель превзошла саму себя, значительно улучшив навыки программирования. Она внедряет новый режим мышления, вдохновлённый успехом DeepSeek R1 в открытых моделях ИИ. Однако самая впечатляющая новинка — это инструмент Claude Code, командная строка (CLI), которая позволяет создавать, тестировать и запускать код прямо в ваших проектах. Этот инструмент формирует бесконечный цикл обратной связи, который, теоретически, способен заменить всех программистов. Кодовые инфлюенсеры уже заявляют, что наша профессия обречена.
Влияние на программистов
Сегодня, 25 февраля 2025 года, в этом "кодовом отчёте" мы разберёмся, правы ли они. Недавно Anthropic опубликовала исследование, посвящённое влиянию ИИ на рынок труда. Выяснилось, что ИИ затрагивает лишь 3,4% рабочих мест, но при этом связан с более чем 37% требований к вакансиям, включающим математику и программирование. Хотя ИИ пока не отбирает работу у людей, он уже изменил роль таких ресурсов, как Stack Overflow. В сети появляется всё больше "мусора" от ИИ, и уследить за качеством становится сложнее.
Тестирование и результаты
Для веб-разработки одним из лучших показателей является рейтинг Web Dev Arena, где предыдущая версия, Claude 3.5, уже занимала верхнюю строчку. Однако в бенчмарке по программной инженерии, основанном на реальных задачах с GitHub и проверенном людьми, Claude 3.5 была наравне с другими современными моделями. Но вот что удивительно: Claude 3.7 обходит всех конкурентов, включая OpenAI o1 Mini и DeepSeek, и решает 70,3% задач с GitHub. Если верить этим результатам, эта модель — настоящий прорыв.
Новые функции
Claude Code — это CLI-инструмент, который использует полный контекст вашего проекта для генерации кода. После установки вы можете запустить команду init, которая сканирует проект и создаёт markdown-файл с инструкциями и базовой информацией. Затем можно задавать команды для создания кода: Claude генерирует файлы, тесты и проверяет их корректность, используя типизированные языки и подход тест-ориентированной разработки.
Сравнение с другими моделями
Я протестировал Claude на двух задачах. Первая — простой генератор случайных имён — была выполнена идеально. Вторая — создание сложного фронтенд-приложения с визуализацией звуковой волны через микрофон — заняла больше времени и потребовала подтверждения множества шагов, но результат превзошёл ожидания. Для сравнения, OpenAI o1 Mini справился с той же задачей гораздо хуже, выдав код, который я бы назвал "постыдным куском мусора". Однако у Claude тоже были промахи: он проигнорировал TypeScript и Tailwind, хотя они были в стеке, и не использовал новую синтаксическую конструкцию SME-5.
Стоимость и практичность
Claude — недешёвое удовольствие. Использование напрямую через API Anthropic обходится в 15 долларов за 1 миллион выходных токенов, что в десять раз дороже, чем у моделей вроде Gemini Flash или DeepSeek. Например, одна сессия с фронтенд-приложением стоила 65 долларов — я бы предпочёл потратить эти деньги на что-то более осязаемое, вроде яйца или банана.
Заключение
Claude 3.7 Sonnet впечатляет своими возможностями в программировании, особенно в фронтенд-разработке. Однако код не всегда идеален, а высокая стоимость может отпугнуть пользователей. Для тех, кто ищет быстрые решения, рекомендую обратить внимание на Convex — спонсора этого обзора. Это реактивная база данных с открытым кодом, которая идеально сочетается с ИИ, такими как Claude, благодаря поддержке TypeScript и упрощённому написанию кода.