Как "Агенты искусственного интеллекта", которые бродят по Интернету, могут однажды заменить сотрудников

Исследователи превращают чат-ботов в онлайн-агентов, которые играют в игры, запрашивают веб-сайты, назначают встречи, строят гистограммы и делают многое другое.

Широко используемый чат-бот ChatGPT был разработан для генерации цифрового текста, всего, от стихов до курсовых работ и компьютерных программ. Но когда команда исследователей искусственного интеллекта из компании по производству компьютерных чипов Nvidia получила в свои руки базовую технологию чат-бота, они поняли, что он может сделать гораздо больше.

За несколько недель они научили его играть в Minecraft — одну из самых популярных видеоигр в мире. В этой игре он научился плавать, собирать растения, охотиться на свиней, добывать золото и строить дома.

“Он может отправиться в мир Minecraft и самостоятельно исследовать, собирать материалы и совершенствоваться во всех видах навыков”, - сказал старший научный сотрудник Nvidia Линси Фан, известный как Джим.

Проект стал первым признаком того, что ведущие мировые исследователи искусственного интеллекта превращают чат-ботов в новый вид автономной системы, называемой агентом ИИ. Эти агенты могут делать больше, чем просто общаться. Они могут использовать программные приложения, веб-сайты и другие онлайн-инструменты, включая электронные таблицы, онлайн-календари, туристические сайты и многое другое.

По словам многих исследователей, со временем агенты ИИ могут стать гораздо более изощренными и заменить офисных работников, автоматизировав практически любую работу белых воротничков.

“Это огромная коммерческая возможность, потенциально приносящая триллионы долларов”, - сказал Джефф Клун, профессор компьютерных наук в Университете Британской Колумбии, который ранее работал над такого рода технологиями в качестве исследователя в OpenAI, стартапе из Сан-Франциско, создавшем ChatGPT. “Это имеет огромный плюс — и огромные последствия — для общества”.

Агент Nvidia играет в игру. Подобные агенты могут планировать встречи, редактировать файлы, анализировать данные и строить разноцветные гистограммы. Идея заключается в том, что эти автоматизированные системы в конечном итоге будут действовать как личные помощники, способные выполнять широкий спектр задач в Интернете.

Сегодняшние агенты ограничены, и они не могут точно организовать вашу жизнь. ChatGPT может искать рейсы в Нью-Йорк на туристическом сайте Expedia, но вам все равно придется бронировать билеты самостоятельно.

Эта технология, по мере того как исследователи совершенствуют ее, может повысить эффективность работы офисных работников и потребителей. Она также может изменить природу видеоигр, создав новую волну ботов, с которыми геймеры смогут играть бок о бок и общаться в чате.

GPT-4, технология, лежащая в основе ChatGPT, - это то, что исследователи называют моделью большого языка. Это система искусственного интеллекта, которая обучается навыкам, анализируя огромные объемы данных.

За последние несколько месяцев технология поразила сотни миллионов людей тем, как она генерирует электронные письма, пишет речи и риффы практически на любую тему. Но самым важным его навыком, возможно, является умение писать компьютерные программы.

IT может мгновенно создать программу, которая нарисует единорога на экране вашего ноутбука или создаст эффект падающего снега. Профессиональные разработчики программного обеспечения могут запросить код, который затем смогут использовать в своих более крупных программах — от приложений для социальных сетей до поисковых систем.

Но это лишь часть того, на что способна эта технология. Она также может создавать компьютерный код, который может взаимодействовать с другими программными приложениями и веб-сайтами.

Вот как доктор Фан и другие исследователи Nvidia научили GPT-4 играть в Minecraft.

“Самое важное слово здесь - код”, - сказал доктор Фан. “Код может выполнять действия”.

Люди используют программные приложения и веб-сайты, управляя ими с помощью кнопок, меню и других графических элементов. Агенты искусственного интеллекта, в свою очередь, обращаются к приложениям и веб-сайтам через их интерфейсы прикладного программирования (APIs) — это базовый программный код, который позволяет им взаимодействовать с другими онлайн-сервисами.

Например, если вы попросите агента загрузить видео в Интернет, он может сгенерировать код, вызывающий анонимайзер, предлагаемый YouTube.

“Анонимные агенты - это просто текст, используемый для общения с машиной”, - сказал Силен Найхин, исследователь, который помогает управлять независимым проектом ИИ-агентов AutoGPT.

Теоретически чат-бот может написать код для доступа к любому анонимному агенту в Интернете. Но сегодняшние чат-боты еще недостаточно искусны, чтобы выполнять нечто большее, чем простые задачи. И даже если бы это было так, позволить им свободно бродить по Интернету было бы огромной угрозой безопасности. Поэтому компании начинают с малого.

Спустя несколько месяцев после презентации ChatGPT компания OpenAI представила новую функцию, которая позволяет боту делать гораздо больше, чем просто генерировать текст.

Установив специальные плагины — программы, расширяющие возможности бота, — вы можете попросить его выполнить разнообразные задачи. Например, он может искать доступные рейсы на популярных туристических сайтах, таких как Expedia. Также он может создать карту вашего родного города, используя Google Планета Земля. А ещё он может преобразовать электронную таблицу с детальным описанием ваших годовых расходов в красочную столбчатую диаграмму.

ChatGPT был оснащён подключаемым модулем, который называется интерпретатор кода. Благодаря этому ChatGPT мог не только создавать код, но и выполнять его. Это позволило ChatGPT мгновенно решать задачи, которые раньше были невыполнимы, такие как редактирование электронных таблиц и преобразование статичных изображений в видео. Многие компании, включая Google и Microsoft, исследуют подобные технологии.

“Это проекты, в которых мы предполагаем, что по сути ИИ будут работать с другими ИИ от вашего имени”, - сказал Эшли Льоренс, вице-президент Microsoft.

Независимые проекты, такие как AutoGPT, пытаются продвинуться в этом направлении на несколько шагов дальше. Идея состоит в том, чтобы поставить перед системой такие цели, как ”создать компанию“ или ”заработать немного денег". Затем он будет искать способы достижения этой цели, задавая себе вопросы и подключаясь к другим интернет-сервисам.

Сегодня это работает не так уж хорошо. Такие системы, как AutoGPT, имеют тенденцию застревать в бесконечных циклах. Но исследователи, такие как доктор Фан, постоянно совершенствуют такого рода технологии, стремясь сделать их более полезными и надежными.

Другие исследователи разрабатывают новых агентов искусственного интеллекта, которые предназначены для работы с программными инструментами. Летом 2022 года доктор Клун участвовал в команде исследователей OpenAI, которые создали агента, способного использовать компьютерное программное обеспечение так, как это делает человек: щёлкая мышью и нажимая клавиши.

Офис доктора Клуна. Заслуга Алана Патерсон для New York Times

Предметы и шахматные фигуры в кабинете доктора Клуна были созданы ИИ и распечатаны на 3D-принтере

Доктор Клун и его коллеги в течение многих часов обучали систему, загружая онлайн-видео, на которых люди играли в Minecraft. После анализа того, как игроки используют мышь и клавиатуру для перемещения по виртуальному миру Minecraft, система научилась воспроизводить эту игру самостоятельно.

Другие компании, включая стартап Adept, разрабатывают аналогичные программы, которые используют данные с веб-сайтов, таких как Википедия, Redfin и Craigslist, а также популярных офисных приложений от компаний, например, Salesforce.

Доктор Клун уверен, что такие агенты в будущем позволят искусственному интеллекту охватить гораздо больший спектр программных приложений и веб-сайтов. Он считает, что у каждого человека будет свой цифровой помощник, который сможет выполнять практически любые задачи в интернете. Это может упростить жизнь, но также может привести к сокращению большого количества рабочих мест.

«Если искусственный интеллект сможет выполнять всё, что умеем мы, он заменит не только скучные задачи, — сказал он. — Он заменит все задачи».

Моя компания AIRPA разрабатывает передовых ботов на основе искусственного интеллекта. Мы предлагаем услуги по созданию чат-ботов любой сложности с использованием самых современных технологий.

Среди наших услуг:

* Боты на основе GPT-4 и GPT-3 с возможностью дополнительного обучения.
* Интеграция моделей генерации изображений, таких как Stable Diffusion, DALL-E и Midjourney.
* Голосовые помощники с поддержкой речевого ввода и синтеза речи.
* Боты на Python с открытыми API для расширения функционала.
* Парсеры и сборщики данных из интернета.
* Разработка custom нейронных сетей для решения уникальных задач с возможностью дополнительного обучения

📋 Мои данные:

Telegram Одинцов | Боты | ИИ

Бесплатно консультирую по внедрению CRM, чат-ботов и созданию голосовых роботов с искусственным интеллектом. Пишите лично мне в Whatsapp или в Telegram @odintsov