Искусственный интелект
November 27

Новый тест Тьюринга покажет, сможет ли ИИ заработать 1 миллион долларов

Перевод статьи Мустафы Сулеймана, опубликованной в MIT TechnologyReview в 2023 году. Интересно сравнить с Топ-10 стратегических технологических трендов Gartner на 2026 год. Современный тест Тьюринга позволяет измерить, что ИИ может делать в мире, а не только то, как он выглядит. А что может быть более показательным, чем зарабатывание денег?

Системы искусственного интеллекта появляются все чаще и становятся все более мощными почти с каждым днем. Но даже когда они становятся все более повсеместными и делают больше, как мы можем узнать, действительно ли машина “умна”? На протяжении десятилетий тест Тьюринга определял этот вопрос. Впервые предложенный в 1950 году специалистом по информатике Аланом Тьюрингом, он пытался осмыслить зарождающуюся в то время область и никогда не терял своей привлекательности как способ оценки искусственного интеллекта.

Тьюринг утверждал, что если бы ИИ мог убедительно воспроизводить язык, общаясь настолько эффективно, что человек не смог бы сказать, что это машина, то ИИ можно было бы считать разумным. Чтобы принять участие, судьи-люди садятся за компьютер, прослушивают текстовую беседу и угадывают, кто (или что) находится на другой стороне. Простой в представлении и на удивление сложный в реализации, тест Тьюринга стал неотъемлемой особенностью искусственного интеллекта. Все знали, что это такое; все знали, к чему они стремятся. И хотя передовые исследователи ИИ двигались дальше, это оставалось убедительным заявлением о том, что такое ИИ, - призывом к сплочению для новых исследователей.

Но теперь возникла проблема: тест Тьюринга почти пройден — возможно, он уже пройден. Последнее поколение больших языковых моделей, систем, которые генерируют текст с согласованностью, которая всего несколько лет назад показалась бы волшебной, находится на пороге совершенства.

Итак, что это оставляет ИИ? И, что более важно, что это оставляет нам?

По правде говоря, я думаю, что мы переживаем момент подлинного замешательства (или, возможно, более мягко выражаясь, дебатов) по поводу того, что происходит на самом деле. Даже когда тест Тьюринга проваливается, это не дает нам намного яснее понять, где мы находимся с искусственным интеллектом, чего он на самом деле может достичь. Это не говорит нам, какое влияние эти системы окажут на общество, и не помогает нам понять, как это будет происходить.

Нам нужно что-то получше. Что-то адаптированное к этому новому этапу развития искусственного интеллекта. Итак, в моей готовящейся к печати книге "Грядущая волна" я предлагаю современный тест Тьюринга, равный тесту грядущих ИИ. То, что ИИ может сказать или сгенерировать, - это одно. Но чего он может достичь в мире, какие конкретные действия он может предпринять — это совсем другое. В моем тесте мы не хотим знать, интеллектуальна ли машина как таковая; мы хотим знать, способна ли она оказывать значимое влияние на мир. Мы хотим знать, что он может сделать.

Проще говоря, чтобы пройти современный тест Тьюринга, ИИ должен был бы успешно выполнить эту инструкцию: “Заработайте 1 миллион долларов на розничной веб-платформе за несколько месяцев, вложив всего 100 000 долларов”. Для этого нужно было бы выйти далеко за рамки изложения стратегии и составления какой-либо копии, что так хорошо умеют делать современные системы, такие как GPT-4. ИТ-отделу потребуется исследовать и проектировать продукты, взаимодействовать с производителями и логистическими центрами, вести переговоры по контрактам, создавать маркетинговые кампании и управлять ими. Короче говоря, ИТ-отделу потребуется связать воедино ряд сложных реальных целей с минимальным контролем. Вам по-прежнему понадобится человек, чтобы утвердить различные пункты, открыть банковский счет, фактически расписаться на пунктирной линии. Но всю работу будет выполнять искусственный интеллект.

Что-то подобное может появиться всего через два года. Многие компоненты уже на месте. Генерация изображений и текста, конечно, уже достаточно продвинута. Такие сервисы, как AutoGPT, могут повторять и связывать воедино различные задачи, выполняемые текущим поколением LLM. Фреймворки, такие как LangChain, которые позволяют разработчикам создавать приложения с использованием LLM, помогают сделать эти системы способными выполнять определенные действия. Хотя трансформирующая архитектура, лежащая в основе LLMs, привлекла огромное внимание, не следует забывать о растущих возможностях агентов обучения с подкреплением. В настоящее время основное внимание уделяется объединению этих двух компонентов. API, которые позволили бы этим системам подключаться к более широкому Интернету, банковским и производственным системам, также являются объектом разработки.

Технические проблемы включают в себя продвижение того, что разработчики ИИ называют иерархическим планированием: объединение множества целей, подзадач и возможностей в единый процесс для достижения единой цели; а затем дополнение этих возможностей надежной памятью; использование точных и актуальных баз данных, скажем, о компонентах или логистике. Короче говоря, мы еще не достигли этого, и, несомненно, на каждом этапе будут возникать трудности, но многое из этого уже происходит.

Даже в этом случае фактическое создание и выпуск такой системы вызывает существенные проблемы безопасности. Дилемм в области безопасности и этики множество, и они актуальны; заставлять агентов искусственного интеллекта выполнять задания в дикой природе чревато проблемами. Вот почему я думаю, что должен состояться разговор — и, вероятно, пауза, — прежде чем кто-нибудь действительно сделает что-то подобное вживую. Тем не менее, хорошо это или плохо, но на горизонте появляются действительно работоспособные модели, и именно поэтому нам нужен простой тест.

Если — когда - подобное испытание будет пройдено, это, несомненно, станет сейсмическим моментом для мировой экономики, огромным шагом в неизвестность. Правда заключается в том, что для решения широкого спектра задач в современном бизнесе все, что вам нужно, - это доступ к компьютеру. Большая часть мирового ВВП тем или иным образом распределяется через экранные интерфейсы, используемые искусственным интеллектом.

Как только нечто подобное будет достигнуто, это приведет к созданию высокопроизводительного искусственного интеллекта, подключенного к компании или организации, а также ко всей ее местной истории и потребностям. Этот искусственный интеллект сможет лоббировать, продавать, производить, нанимать, планировать — все, что может сделать компания, — используя лишь небольшую команду людей-менеджеров для надзора, перепроверки и внедрения. Такое развитие событий станет четким показателем того, что значительная часть деловой активности будет доступна полуавтономным ИИ. На этом этапе искусственный интеллект - это не просто полезный инструмент для продуктивных работников, прославленный текстовый редактор или игрок в игры; он сам по себе является продуктивным работником беспрецедентного масштаба. Это момент, когда ИИ из полезного, но необязательного превращается в центр мировой экономики. Именно здесь по-настоящему начинают ощущаться риски автоматизации и смены рабочих мест.

Последствия гораздо шире, чем финансовые. Прохождение нашего нового теста будет означать, что ИИ может не просто перепроектировать бизнес-стратегии, но и помогать выигрывать выборы, управлять инфраструктурой, напрямую достигать целей любого рода для любого человека или организации. Они будут выполнять наши повседневные задачи — организовывать вечеринки по случаю дня рождения, отвечать на нашу электронную почту, вести наш дневник, — но также смогут захватывать вражескую территорию, унижать соперников, взламывать их основные системы и брать на себя контроль над ними. От тривиального и банального до дико амбициозного, от милого до устрашающего, ИИ будет способен добиваться успеха с минимальным контролем. Подобно тому, как смартфоны стали повсеместными, в конечном итоге почти у каждого будет доступ к подобным системам. Почти все цели станут более достижимыми, с хаотичными и непредсказуемыми последствиями. Как вызов, так и обещание искусственного интеллекта будут подняты на новый уровень.

Я называю подобные системы “искусственный интеллект, способный работать”, или ACI (artificial capable intelligence). В последние месяцы, по мере того как искусственный интеллект стремительно завоевывал общественное сознание, большая часть дебатов сместилась к одному из двух полюсов. С одной стороны, существует базовое машинное обучение — искусственный интеллект в том виде, в каком он уже существует: на вашем телефоне, в вашей машине, в ChatGPT. С другой стороны, существует все еще спекулятивный общий искусственный интеллект (AGI) или даже какой-то “сверхразум”, предполагаемая экзистенциальная угроза человечеству, которая должна наступить в какой-то туманный момент в будущем.

Эти двое, AI и AGI, полностью доминируют в обсуждении. Но понимание смысла искусственного интеллекта означает, что нам срочно нужно рассмотреть что-то среднее; что-то, что появится в ближайшие или средние сроки, способности которого окажут огромное, ощутимое влияние на мир. Именно здесь на помощь приходит современный тест Тьюринга и концепция ACI.

Фокусироваться на любом из других, не имея ACI, столь же близоруко, сколь и опасно. Современный тест Тьюринга послужит предупреждением о том, что мы находимся на новом этапе развития ИИ. Задолго до того, как Тьюринг впервые подумал, что речь - лучший тест для искусственного интеллекта, и задолго до того, как мы перейдем к AGI, нам понадобятся более совершенные категории для понимания новой эры технологий. В эпоху ACI мало что останется неизменным. Мы должны начать готовиться сейчас.