Grok 4. Обзор от "Джипити Хаб"
Введение
Этой статьёй начинаем рубрику "AI Тест Драйв" с обзором свежей, обновленной модели Grok 4 от Илона Маска. Её выход в инфополе подкрепился ажиотажем и восхвалением данной LLM, успешными бенчмарками и прорывными функциями. Но встаёт главный вопрос, оправдывает ли она, чтобы вы заплатили цену выше, чем у конкурентов?
Сайт - grok.com
Цена 30$/мес
Главный её плюс - это доступ к флагманскому ИИ, бесплатная версия которой не предоставляет возможности соприкоснуться с новинкой, тут же - использование не ограничено.
Новая модель, в отличие от предшественника, рассуждает в каждом своем ответе, в этом плане сравнить её можно с GPT o3/2.5pro Gemini. В том числе отсутствует и "Deep Research". Из этого выходит, что четвёртая модель не предназначена для простых и скоростных ответов, т.к. она будет мудрить даже над запросом "2+2". Зато точнее решает технические и логические задачи, в отличие от третьей версии, чье преимущество - повседневные запросы.
Отдельные плюсы
1) Ежедневные/еженедельные задачи с веб-поиском
2) Интересный раздел настроек, много разных полезных инструментов и кнопок
3) Удобный парсинг текста с сайтов, не добавляя и не убавляя ничего от себя.
4) Более честный и менее лояльный с пользователем: не поддакивает во всем, стремится к объективности, опирается на инструкцию.
5) Продвинутый голосовой режим, имеет гибкость в выборе разных персонажей для озвучки, их личностей, скорости речи. Пойдет, чтоб повеселиться или получить прожарку своей личности/идеи, главное не чрезмерствовать с использованием и не превратиться в главного героя фильма "Она".
Отдельные минусы
- Криво выгружает данные в PDF в отличие от ChatGPT
- Нереалистичная генерация изображений, слабый уровень в сравнении с Sora
- Коротко и малоинформативно расписывает пункты в собственных ответах
Разнообразные отзывы участников
Сравнение ключевых разделов
Сравнивать будем по ключевым показателям с моделями ChatGPT, Claude, Gemini, лоб в лоб.
Креатив
- Текста: конкурирует с остальными LLM на неплохом уровне, может передать живость в посте, отсутствует формальный стиль письма.
- Идеи и названия: предлагает неоднозначные и нереалистичные, напоминает сырые первые модели GPT, оригинальность на низком уровне, тут сравнивал с Gemini.
Кодинг
К сожалению, не подключается по API, отсутствует возможность работать в Cursor. Разработчики коммьюнити ставят в этом аспекте жирный минус.
Решение логических ситуаций, задач с пониманием контекста
Хорошее понимание требуемого в рабочих/практических вопросах, углубление в их решения через "Вопрос-Ответ", заметна прокачка "ума" модели. Также понравилось, что грамотно составляет промпты для различных заданий.
Итог и рекомендация
Маск постарался, но не дотянул своего чат-бота до уровня 30$ за подписку, в общем отношении проигрывая тем же Gemini/GPT, тем не менее создал интересную альтернативу для ценителей честности и меньшей дипломатичности от ИИ. Будь он бесплатным, возможно использовал бы Grok 4 ситуативно, чтобы посмотреть на альтернативную генерацию ответа. Однозначно, это не та LLM, на которую я пересяду в ближайшее время.
На этом обзор завершён, надеюсь он помог вам сэкономить 30$ или наоборот найти свой инструмент.
В "Джипити Хаб" собралось коммьюнити тех, кто работает с ИИ без розовых очков, проверяем нейросети на практике и делимся кейсами. Присоединяйтесь!