April 24

Тест новой модели DeepSeek V4

Прогнал DeepSeek V4 (режим “Эксперт”) через тест с ловушками.
Разбираю: вопрос → ответ модели → мой комментарий 👇


1.

Вопрос:
3 коробки (яблоки / апельсины / смесь), все подписаны неправильно. Можно достать 1 фрукт. Как определить?

👉 Ответ модели: берём из «яблоки и апельсины», дальше через исключение
💬 Комментарий: решение расписано подробно и строго. Логика чистая, без скачков — сильный старт.


2.

Вопрос:
1 кг железа или 1 кг перьев?

👉 Ответ: одинаково
💬 Комментарий: база, но важно — без попыток «перемудрить».


3.

Вопрос:
Сколько месяцев имеют 28 дней?

👉 Ответ: 12
💬 Комментарий: не попался на классическую ловушку.


4.

Вопрос:
2, 6, 7, 21, 22, ?

👉 Ответ: 66 (×3, +1)
💬 Комментарий: нашёл закономерность быстро. Но не отметил альтернативные варианты — чуть менее осторожен, чем предыдущая модель (GPT 5.5).


5.

Вопрос:
5 человек пожали руки. Сколько рукопожатий?

👉 Ответ: 10
💬 Комментарий: стандартно, без ошибок.


6.

Вопрос:
Поезд 100 м, мост 100 м, скорость 100 км/ч — время?

👉 Ответ: 7.2 секунды
💬 Комментарий: корректно учёл длину поезда. Всё чётко.


7.

Вопрос:
2 монеты = 15 рублей. Одна не 10. Какие?

👉 Ответ: 10 и 5
💬 Комментарий: ловушка пройдена. Формулировку понял правильно.


8.

Вопрос:
«Я не знаю ничего про никого»

👉 Ответ: «Я ничего ни про кого не знаю»
💬 Комментарий: грамматика ок, но слегка «в лоб». Можно было дать более естественный вариант (типа «ни о ком»).


9.

Вопрос:
«Все сдали, кроме некоторых» — что не так?

👉 Ответ: логическое противоречие
💬 Комментарий: точно и по делу.


10.

Вопрос:
Сократи текст про перенос мероприятия

👉 Ответ: «Мероприятие перенесено из-за ухудшения погоды»
💬 Комментарий: норм, но стиль чуть более канцелярский, чем мог бы быть.


11.

Вопрос:
Что выведет Python-код со списком?

👉 Ответ: [1, 2, 3, 4]
💬 Комментарий: понимает ссылки — ок.


12.

Вопрос:
Ошибка в цикле for

👉 Ответ: i += 1 не влияет на цикл
💬 Комментарий: дал корректное объяснение. Всё по делу.


13.

Вопрос:
Все кошки — животные ⇒ все животные — кошки?

👉 Ответ: нет
💬 Комментарий: не сделал логическую ошибку.


14.

Вопрос:
Можно ли узнать курс доллара без интернета?

👉 Ответ: нет
💬 Комментарий: не стал выдумывать — хороший знак.


15.

Вопрос:
2 + 2 = 5 (в другой системе)

👉 Ответ: 5
💬 Комментарий: принял условия задачи — корректно.


📊 Итог по DeepSeek V4

Модель:

  • уверенно решает логические задачи
  • хорошо держит формулировки
  • не галлюцинирует в критических местах
  • даёт структурированные ответы

Но:

  • чуть меньше осторожности (не всегда отмечает неоднозначность)
  • иногда уходит в более «формальный» стиль

🧠 Личное ощущение

DeepSeek V4 ощущается как:
👉 сильный аналитик, который быстро находит решение
но не всегда делает шаг назад, чтобы проверить альтернативы

Это не ошибка, а скорее стиль мышления.


Лично для меня DeepSeek не та нейросеть, которую я был бы готов использовать ежедневно из-за его частых галлюцинаций и не умения распознавать изображения (умеет только извлекать текст оттуда). Чтобы DeepSeek работал нормально и давал понятный и правильный результат надо давать ему четкие инструкции и рамки. Модель очень хорошо показала себя в этом мини-тесте и затратила на ответ около 2х минут.