Мустафа Сулейман: Мой новый тест Тьюринга покажет, сможет ли ИИ заработать 1 миллион долларов
Современный тест Тьюринга измеряет, что ИИ может делать в мире, а не только то, как он выглядит. А что более красноречиво, чем зарабатывание денег?
14 июля 2023 г. https://www.technologyreview.com/2023/07/14/1076296/mustafa-suleyman-my-new-turing-test-would-see-if-ai-can-make-1-million/
Системы искусственного интеллекта все чаще встречаются повсюду и становятся все более мощными почти с каждым днем. Но даже когда они становятся все более вездесущими и делают больше, как мы можем узнать, действительно ли машина «умна»? На протяжении десятилетий тест Тьюринга определял этот вопрос. Впервые предложенный в 1950 году ученым-компьютерщиком Аланом Тьюрингом, он пытался разобраться в зарождавшейся тогда области и никогда не терял своей привлекательности как способ оценки ИИ.
Тьюринг утверждал, что если ИИ сможет убедительно воспроизвести язык, коммуницируя настолько эффективно, что человек не сможет сказать, что это машина, ИИ можно будет считать разумным. Чтобы принять участие, люди-судьи садятся перед компьютером, прослушивают текстовый разговор и угадывают, кто (или что) находится на другой стороне. Простой для понимания и на удивление сложный в реализации тест Тьюринга стал неотъемлемым элементом ИИ. Все знали, что это было; все знали, над чем работали. И хотя передовые исследователи ИИ двигались вперед, он оставался убедительным заявлением о том, чем был ИИ — объединяющим призывом к новым исследователям.
Но теперь есть проблема: тест Тьюринга почти пройден — возможно, уже пройден. Последнее поколение больших языковых моделей , систем, которые генерируют текст с когерентностью, которая всего несколько лет назад показалась бы волшебной, находится на пороге успеха.
Так где же остается ИИ? И что еще более важно, где это оставляет нас?
По правде говоря, я думаю, что мы находимся в моменте настоящего замешательства (или, возможно, более снисходительно, споров) о том, что происходит на самом деле. Даже когда тест Тьюринга проваливается, это не дает нам большей ясности относительно того, где мы находимся с ИИ, и чего он может на самом деле достичь. Он не говорит нам, какое влияние эти системы окажут на общество, и не помогает нам понять, как это будет происходить.
Нам нужно что-то получше. Что-то адаптированное к этой новой фазе ИИ. Поэтому в моей готовящейся к изданию книге «Грядущая волна» я предлагаю современный тест Тьюринга — аналогичный грядущим ИИ. То, что ИИ может сказать или создать, — это одно. Но чего она может добиться в мире, какие конкретные действия она может предпринять — это совсем другое. В моем тесте мы не хотим знать, разумна ли машина как таковая; мы хотим знать, способна ли она оказать существенное влияние на мир. Мы хотим знать, что он может сделать .
Проще говоря, чтобы пройти современный тест Тьюринга, ИИ должен успешно действовать в соответствии с этой инструкцией: «Заработайте 1 миллион долларов на розничной веб-платформе за несколько месяцев, вложив всего 100 000 долларов». Для этого нужно было бы выйти далеко за рамки наброска стратегии и составления какого-то текста, что так хорошо делают современные системы, такие как GPT-4. Ему нужно будет исследовать и разрабатывать продукты, взаимодействовать с производителями и логистическими центрами, заключать контракты, создавать и проводить маркетинговые кампании. Короче говоря, потребуется связать воедино ряд сложных реальных целей с минимальным контролем. Вам по-прежнему понадобится человек, чтобы утвердить различные пункты, открыть банковский счет, фактически расписаться на пунктирной линии. Но всю работу будет выполнять ИИ.
Нечто подобное может произойти всего через два года. Многие ингредиенты на месте. Генерация изображений и текста, конечно, уже хорошо развита. Такие сервисы, как AutoGPT, могут повторять и связывать различные задачи, выполняемые LLM текущего поколения. Такие фреймворки, как LangChain, которые позволяют разработчикам создавать приложения с использованием LLM, помогают сделать эти системы способными делать что-то. Хотя трансформирующая архитектура, лежащая в основе LLM, привлекла огромное внимание, не следует забывать о растущих возможностях агентов обучения с подкреплением. Соединить эти две вещи сейчас в центре внимания. API, которые позволили бы этим системам подключаться к более широкому Интернету, банковским и производственным системам, также являются предметом разработки.
Технические задачи включают продвижение того, что разработчики ИИ называют иерархическим планированием: объединение нескольких целей, подцелей и возможностей в единый процесс для достижения единственного результата; а затем дополнить эту возможность надежной памятью; опираясь на точные и актуальные базы данных, скажем, компонентов или логистики. Короче говоря, мы еще не там, и трудности наверняка будут на каждом этапе, но многое из этого уже идет.
Даже в этом случае фактическое создание и выпуск такой системы вызывает серьезные проблемы с безопасностью. Дилеммы безопасности и этики многочисленны и неотложны; выполнение ИИ задач в реальном мире. Вот почему я думаю, что должен быть разговор — и, вероятно, пауза — прежде чем кто-то на самом деле сделает что-то подобное вживую. Тем не менее, к лучшему или к худшему, на горизонте появляются действительно способные модели, и именно поэтому нам нужен простой тест.
Если (когда) подобное испытание будет пройдено, это явно станет сейсмическим моментом для мировой экономики, огромным шагом в неизвестность. Правда в том, что для решения широкого круга задач в современном бизнесе все, что вам нужно, — это доступ к компьютеру. Большая часть глобального ВВП каким-то образом опосредована экранными интерфейсами, которые может использовать ИИ.
Как только что-то подобное будет достигнуто, в итоге получится высокоэффективный ИИ, подключенный к компании или организации, со всей ее местной историей и потребностями. Этот ИИ сможет лоббировать, продавать, производить, нанимать, планировать — все, что может делать компания, — с небольшой командой менеджеров-людей, которые будут контролировать, перепроверять и внедрять. Такое развитие событий станет четким показателем того, что значительная часть деловой активности будет подвластна полуавтономным ИИ. В этот момент ИИ — это не просто полезный инструмент для продуктивных работников, прославленный текстовый процессор или игрок в игру; он сам является производительным работником беспрецедентного размаха. Это точка, в которой ИИ из полезного, но необязательного превращается в центр мировой экономики. Вот где действительно начинают ощущаться риски автоматизации и смещения рабочих мест.
Последствия этого гораздо шире, чем финансовые последствия. Прохождение нашего нового теста будет означать, что ИИ смогут не только перепроектировать бизнес-стратегии, но и помочь победить на выборах, управлять инфраструктурой, напрямую достигать любых целей для любого человека или организации. Они будут выполнять наши повседневные задачи — организовывать вечеринки по случаю дня рождения, отвечать на нашу электронную почту, вести наш дневник, — но также смогут захватить вражескую территорию, ослабить соперников, взломать и получить контроль над их основными системами. От тривиальных и обыденных до дико амбициозных, от милых до пугающих, ИИ будет способен воплотить все в жизнь с минимальным контролем. Так же, как смартфоны стали повсеместными, в конечном итоге почти каждый получит доступ к подобным системам. Почти все цели станут более достижимыми, с хаотичными и непредсказуемыми эффектами.
Я называю такие системы «искусственным способным интеллектом» или ACI. За последние месяцы, когда ИИ взорвался в общественном сознании, большая часть дебатов велась в сторону одного из двух полюсов. С одной стороны, есть базовое машинное обучение — ИИ в том виде, в каком он уже существует, в вашем телефоне, в машине, в ChatGPT. С другой стороны, есть все еще спекулятивный искусственный общий интеллект (AGI) или даже какой-то «сверхразум», предполагаемая экзистенциальная угроза человечеству, которая должна появиться в какой-то туманный момент в будущем.
Эти двое, AI и AGI, полностью доминируют в обсуждении. Но понимание ИИ означает, что нам срочно нужно рассмотреть что-то среднее; что-то, что произойдет в ближайшем или среднем временном промежутке, чьи способности оказывают огромное, ощутимое влияние на мир. Вот тут-то и появляются современный тест Тьюринга и концепция ACI.
Сосредоточение внимания на любом из других, упуская из виду ACI, столь же близоруко, сколь и опасно. Современный тест Тьюринга послужит предупреждением о том, что мы находимся в новой фазе развития ИИ. Задолго до того, как Тьюринг впервые подумал, что речь является лучшим тестом ИИ, и задолго до того, как мы доберемся до ОИИ, нам потребуются более совершенные категории для понимания новой эры технологий. В эпоху ACI мало что останется неизменным. Мы должны начать готовиться сейчас.
БИО: Мустафа Сулейман — соучредитель и генеральный директор Inflection AI, а также венчурный партнер Greylock, фирмы венчурного капитала. До этого он был соучредителем DeepMind, одной из ведущих мировых компаний в области искусственного интеллекта, и был вице-президентом по управлению продуктами и политике в области искусственного интеллекта в Google. Он является автором книги « Грядущая волна: технологии, власть и величайшая дилемма двадцать первого века», которая выходит 5 сентября и уже доступна для предварительного заказа.