November 14, 2024

ИИ: Рассказ о несбывшихся мечтах и неожиданных открытиях

История о том, как искусственный интеллект постоянно делает не то, что от него ждут (и почему это просто великолепно)

"Любая достаточно развитая технология неотличима от магии" — написал как-то Артур Кларк, известный английский писатель-фантаст. Современный искусственный интеллект временами действительно напоминает магию. Только не такую, как в "Гарри Поттере", где взмахнул палочкой — и всё готово, а скорее как в старых сказках, где джинн исполняет желания с подвохом, а волшебное кольцо работает только в полнолуние и при определённом расположении звёзд.

Помните? Там всё серьёзнее было. Неправильно составленное желание могло обернуться настоящей катастрофой. Пожелал богатства — и вот ты уже как царь Мидас: всё, к чему прикасаешься, превращается в золото. Звучит прекрасно, пока не попытаешься уснуть на золотой подушке. Пожелал любви прекрасной принцессы — и ты навечно заключён в её любимое зеркальце.

И ведь каждый думал: "Уж я-то точно сформулирую правильно! Я предусмотрю все лазейки! Я составлю желание идеально!" А джинн только посмеивался в свою синюю бороду, зная, что в любом, даже самом продуманном желании найдётся пара-тройка словечек, которые можно истолковать... скажем так, креативно.

Первый парадокс: Когда помощник не помогает (или помогает, но не тем)

В том, как работает современные нейросети, кроется любопытный парадокс, вызывающий у многих приступ когнитивный диссонанс. Мы ожидаем, что он, ИИ, восполнит пробелы в наших знаниях, станет универсальным помощником в любом начинании. Логично же: если у меня нет опыта — можно заменить его супер компьютером! Но реальность оказывается сложнее и намного интереснее.

Искусственный интеллект становится по-настоящему мощным инструментом именно там, где у человека уже есть глубокое понимание предмета. Почему? Потому что только тогда мы знаем, о чём именно спрашивать. Можем оценить качество ответа. И, главное, понимаем, как использовать полученные результаты. Условно говоря, ИИ не сделает новичка супер профессионала, но поможет состоявшемуся программисту написать код быстрее и эффективнее. Не научит начинающего юриста составлять договоры, но поможет опытному юристу находить неочевидные риски и прорабатывать больше сценариев.

Итак, вот он - первый акт нашей трагикомедии. Искусственный интеллект, эта невероятно умная система, почему-то лучше всего работает... с теми, кто и так всё знает!

Представьте себе такой диалог:

Новичок: "Напиши мне код для мобильного приложения."
ИИ: выдаёт что-то похожее на код
Новичок: "Ура, работает!" (спойлер: нет)

А теперь опытный разработчик:
"Так, тут можно оптимизировать алгоритм сортировки, учитывая специфику входных данных..."
ИИ: "О, смотрите, а если использовать вот такой подход..."
Разработчик: "Хм, интересно, а что если..."

И понеслась! Два технаря нашли друг друга и радостно оптимизируют код, пока пальцы не отвалятся.

Второй парадокс: Великий обман генерации изображений

В истории с генерацией изображений есть что-то от древнегреческой трагедии. Представьте: вы — мастер слова. Годами оттачивали способность облекать мысли в точные формулировки. Любой текст вам по плечу, любую идею можете объяснить. И тут появляется искусственный интеллект, который говорит: "Эй, опиши словами, что хочешь увидеть, и я это нарисую!"

Звучит как исполнение мечты, правда? Больше никаких долгих обсуждений с дизайнерами, иллюстраторами, фотографами. Никаких фотобанков и выкупа прав на изображение. Просто берешь и описываешь. Ты же эксперт в описаниях!

И вот ты садишься и пишешь подробнейшее описание. Применяешь весь свой опыт работы со словом. Каждый нюанс учтен, каждая деталь выверена...

Вот тут и скрыта ловушка. Потому что в генерации изображений важна не способность хорошо формулировать мысли, а умение совершенно иного рода — понимание принципов промптинга, особенностей конкретных моделей, их возможностей и ограничений. Это как если бы вы пришли к художнику не с заказом на картину, а с желанием научиться самостоятельно смешивать краски и работать с холстом. Вроде по месту, только времени займет гораздо больше.

Двойной удар по самолюбию, или Почему эксперты плачут

И вот тут начинается самое интересное. Потому что выясняется, что для получения вменяемых результатов нужно:
а) Забыть всё, что вы знали о точных описаниях
б) Выучить какой-то странный диалект английского, где "masterpiece, trending on artstation" важнее грамматически верного описания сцены
в) Смириться с тем, что контроль над результатом — это иллюзия

Представьте, что вы пришли в ресторан, где нужно заказывать блюда не названиями, а рецептами их приготовления. Причём половина ингредиентов — на латыни, и шеф-повар всё равно приготовит то, что ему больше нравится. Примерно так себя чувствуют простые люди, пытающиеся работать с генерацией изображений.

Почему это всё так раздражает?

Потому что это нарушает базовый принцип "я эксперт, я должен контролировать процесс". В работе с текстовым ИИ хотя бы понятно: чем больше знаешь, тем лучше результат. А тут? Тут можно быть гением слова и всё равно получать результаты, которые выглядят как иллюстрации к несуществующей книге Кафки.

Что со всем этим делать?

Возможно, пора принять простую истину: ИИ — это не инструмент в привычном смысле слова. Это не молоток, который бьёт туда, куда его направит рука, и не кисточка, которая рисует то, что задумал.

В случае с текстом — это скорее интеллектуальный спарринг-партнер. Чем лучше вы "играете", тем интереснее матч.

А в случае с изображениями — это что-то вроде креативного джинна с синдромом дефицита внимания. Да, он может создать нечто потрясающее, но только если вы научитесь говорить на его языке и примете, что практически всё он будет делать по-своему.

Мораль сей басни

Может быть, главная проблема в том, что мы всё ещё пытаемся впихнуть новую технологию в старые рамки? Хотим, чтобы ИИ работал как все привычные нам инструменты: предсказуемо, послушно, без сюрпризов.

А он между тем предлагает нам совсем другой подход:

  • Там, где мы состоявшиеся эксперты — он не помощник, а собеседник
  • Там, где мы ждём простых решений — он требует от нас достаточной глубины знаний
  • И везде он намекает: "Может, не стоит так держаться за контроль ситуации?"

P.S. Если вы всё ещё пытаетесь заставить нейросеть нарисовать точную копию картинки из вашей головы — помните: лучшая стратегия — это позволить джинну немного пофантазировать. В конце концов, Пикассо тоже не всегда рисовал глаза там, где им положено быть, и ничего, в историю вошёл. В общем, в случае с искусственным интеллектом лучшая магия — это знать, где не надо искать волшебство.