Тест новой модели DeepSeek V4
Прогнал DeepSeek V4 (режим “Эксперт”) через тест с ловушками.
Разбираю: вопрос → ответ модели → мой комментарий 👇
1.
Вопрос:
3 коробки (яблоки / апельсины / смесь), все подписаны неправильно. Можно достать 1 фрукт. Как определить?
👉 Ответ модели: берём из «яблоки и апельсины», дальше через исключение
💬 Комментарий: решение расписано подробно и строго. Логика чистая, без скачков — сильный старт.
2.
Вопрос:
1 кг железа или 1 кг перьев?
👉 Ответ: одинаково
💬 Комментарий: база, но важно — без попыток «перемудрить».
3.
Вопрос:
Сколько месяцев имеют 28 дней?
👉 Ответ: 12
💬 Комментарий: не попался на классическую ловушку.
4.
👉 Ответ: 66 (×3, +1)
💬 Комментарий: нашёл закономерность быстро. Но не отметил альтернативные варианты — чуть менее осторожен, чем предыдущая модель (GPT 5.5).
5.
Вопрос:
5 человек пожали руки. Сколько рукопожатий?
👉 Ответ: 10
💬 Комментарий: стандартно, без ошибок.
6.
Вопрос:
Поезд 100 м, мост 100 м, скорость 100 км/ч — время?
👉 Ответ: 7.2 секунды
💬 Комментарий: корректно учёл длину поезда. Всё чётко.
7.
Вопрос:
2 монеты = 15 рублей. Одна не 10. Какие?
👉 Ответ: 10 и 5
💬 Комментарий: ловушка пройдена. Формулировку понял правильно.
8.
Вопрос:
«Я не знаю ничего про никого»
👉 Ответ: «Я ничего ни про кого не знаю»
💬 Комментарий: грамматика ок, но слегка «в лоб». Можно было дать более естественный вариант (типа «ни о ком»).
9.
Вопрос:
«Все сдали, кроме некоторых» — что не так?
👉 Ответ: логическое противоречие
💬 Комментарий: точно и по делу.
10.
Вопрос:
Сократи текст про перенос мероприятия
👉 Ответ: «Мероприятие перенесено из-за ухудшения погоды»
💬 Комментарий: норм, но стиль чуть более канцелярский, чем мог бы быть.
11.
Вопрос:
Что выведет Python-код со списком?
👉 Ответ: [1, 2, 3, 4]
💬 Комментарий: понимает ссылки — ок.
12.
👉 Ответ: i += 1 не влияет на цикл
💬 Комментарий: дал корректное объяснение. Всё по делу.
13.
Вопрос:
Все кошки — животные ⇒ все животные — кошки?
👉 Ответ: нет
💬 Комментарий: не сделал логическую ошибку.
14.
Вопрос:
Можно ли узнать курс доллара без интернета?
👉 Ответ: нет
💬 Комментарий: не стал выдумывать — хороший знак.
15.
Вопрос:
2 + 2 = 5 (в другой системе)
👉 Ответ: 5
💬 Комментарий: принял условия задачи — корректно.
📊 Итог по DeepSeek V4
- уверенно решает логические задачи
- хорошо держит формулировки
- не галлюцинирует в критических местах
- даёт структурированные ответы
- чуть меньше осторожности (не всегда отмечает неоднозначность)
- иногда уходит в более «формальный» стиль
🧠 Личное ощущение
DeepSeek V4 ощущается как:
👉 сильный аналитик, который быстро находит решение
но не всегда делает шаг назад, чтобы проверить альтернативы
Это не ошибка, а скорее стиль мышления.
Лично для меня DeepSeek не та нейросеть, которую я был бы готов использовать ежедневно из-за его частых галлюцинаций и не умения распознавать изображения (умеет только извлекать текст оттуда). Чтобы DeepSeek работал нормально и давал понятный и правильный результат надо давать ему четкие инструкции и рамки. Модель очень хорошо показала себя в этом мини-тесте и затратила на ответ около 2х минут.