May 26, 2023

Что должен знать каждый генеральный директор о генеративном ИИ

Генеративный ИИ развивается с рекордной скоростью, в то время как руководители компаний все еще изучают бизнес-ценность и риски этой технологии. Здесь мы предлагаем узнать некоторые основные принципы генеративного ИИ.

На фоне ажиотажа вокруг генеративного ИИ после выхода ChatGPT, Bard, Claude, Midjourney и других инструментов для создания контента, руководители компаний по понятным причинам задаются вопросом: Это технологическая шумиха или возможность изменить игру? И если это последнее, то какова ценность для моего бизнеса?

Публичная версия ChatGPT достигла 100 миллионов пользователей всего за два месяца. Она демократизировала ИИ в невиданной ранее манере и стала самым быстрорастущим приложением в истории. Благодаря своей доступности генеративный ИИ отличается от всех предшествующих ему ИИ. Пользователям не нужно иметь степень в области машинного обучения, чтобы взаимодействовать с ним или извлекать из него пользу; почти каждый, кто умеет задавать вопросы, может его использовать. И, как и в случае с другими прорывными технологиями, такими как персональный компьютер или iPhone, одна платформа генеративного ИИ может породить множество приложений для аудитории любого возраста или уровня образования и в любом месте, где есть доступ в Интернет.

Все это возможно благодаря тому, что генеративный ИИ чат-ботов работает на основе фундаментальных моделей, которые представляют собой обширные нейронные сети, обученные на огромном количестве неструктурированных, немаркированных данных в различных форматах, таких как текст и аудио. Фундаментальные модели могут использоваться для решения широкого круга задач. В отличие от этого, предыдущие поколения моделей ИИ часто были "узкими", то есть они могли выполнять только одну задачу, например, прогнозировать отток клиентов. Одна базовая модель, например, может составить резюме для технического отчета о квантовых вычислениях объемом 20 000 слов, разработать стратегию выхода на рынок для компании, занимающейся обрезкой деревьев, и предложить пять различных рецептов для десяти ингредиентов в холодильнике человека. Недостатком такой универсальности является то, что на данный момент генеративный ИИ может иногда давать менее точные результаты, что заставляет вновь обратить внимание на управление рисками ИИ.

При наличии соответствующих ограждений генеративный ИИ может не только открыть новые варианты использования для бизнеса, но и ускорить, масштабировать или иным образом улучшить существующие. Представьте себе, например, разговор с клиентом по продажам. Специально обученная модель ИИ может предложить продавцу возможности для повышения продаж, но до сих пор эти возможности обычно основывались только на статических данных о клиенте, полученных до начала разговора, таких как демографические характеристики и характер покупок. Генеративный инструмент ИИ может предлагать продавцу возможности повышения продаж в режиме реального времени на основе фактического содержания разговора, опираясь на внутренние данные о клиенте, внешние тенденции рынка и данные о влиятельных людях в социальных сетях. В то же время генеративный ИИ может предложить продавцу первый вариант предложения для адаптации и персонализации.

Предыдущий пример демонстрирует влияние технологии на одну рабочую роль. Но почти каждый работник, занимающийся знаниями, может извлечь пользу из совместной работы с генеративным ИИ. На самом деле, хотя генеративный ИИ может в конечном итоге использоваться для автоматизации некоторых задач, большая часть его ценности может быть получена от того, как производители программного обеспечения внедрят технологию в повседневные инструменты (например, электронную почту или текстовые редакторы), используемые работниками сферы знаний. Такие модернизированные инструменты могут существенно повысить производительность труда.

Руководители компаний хотят знать, стоит ли им действовать сейчас, и если да, то с чего начать. Некоторые из них видят возможность опередить конкурентов, переосмыслив способы выполнения работы людьми с помощью генеративных приложений ИИ. Другие, возможно, захотят проявить осторожность, поэкспериментировать с несколькими вариантами использования и узнать больше, прежде чем делать крупные инвестиции. Компаниям также придется оценить, обладают ли они необходимыми техническими знаниями, архитектурой технологий и данных, операционной моделью и процессами управления рисками, которые потребуют некоторые из наиболее преобразующих внедрений генеративного ИИ.

Цель этой статьи - помочь руководителям компаний и их командам осмыслить аргументы в пользу генеративного ИИ для создания стоимости и то, как начать свой путь. Сначала мы предлагаем вводную информацию по генеративному ИИ, чтобы помочь руководителям лучше понять быстро развивающееся состояние ИИ и имеющиеся технические возможности. В следующем разделе мы рассмотрим, как компании могут участвовать в генеративном ИИ на примере четырех примеров, направленных на повышение эффективности организации. Эти примеры отражают то, что мы наблюдаем среди ранних последователей, и проливают свет на множество вариантов с точки зрения требований к технологии, стоимости и операционной модели. Наконец, мы рассмотрим жизненно важную роль генерального директора в позиционировании организации для достижения успеха с помощью генеративного ИИ.

Волнение вокруг генеративного ИИ ощутимо, и руководители высшего звена по праву хотят двигаться вперед с продуманной и целенаправленной скоростью. Мы надеемся, что эта статья предлагает бизнес-лидерам взвешенное введение в многообещающий мир генеративного ИИ.

Рисунок 1

*Деятельность Meta (соцсети Facebook и Instagram) запрещена в России как экстремистская.

Больше, чем чат-бот

Генеративный ИИ можно использовать для автоматизации, дополнения и ускорения работы. В рамках данной статьи мы сосредоточимся на том, как генеративный ИИ может улучшить работу, а не на том, как он может заменить роль человека.

В то время как текстовые чат-боты, такие как ChatGPT, привлекают к себе повышенное внимание, генеративный ИИ может предоставить возможности для работы с широким спектром контента, включая изображения, видео, аудио и компьютерный код. Он может выполнять несколько функций в организациях, включая классификацию, редактирование, обобщение, ответы на вопросы и составление нового контента. Каждое из этих действий способно создать ценность за счет изменения способов выполнения работы на уровне действий в рамках бизнес-функций и рабочих процессов. Ниже приведены некоторые примеры.

Классификация

  • Аналитик по выявлению мошенничества может ввести описания транзакций и документы клиентов в генеративный инструмент ИИ и попросить его определить мошеннические транзакции.
  • Менеджер по работе с клиентами может использовать генеративный ИИ для категоризации аудиофайлов звонков клиентов на основе уровня их удовлетворенности.

Редактирование

  • Копирайтер может использовать генеративный ИИ для исправления грамматики и преобразования статьи в соответствии с фирменным стилем клиента.
  • Графический дизайнер может удалить устаревший логотип с изображения.

Обобщение

  • Ассистент художника-постановщика может создать видеоролик на основе многочасового видеоматериала о мероприятии.
  • Бизнес-аналитик может создать диаграмму Венна, которая обобщает ключевые моменты из презентации руководителя.

Ответы на вопросы

  • Сотрудники производственной компании могут задавать "виртуальному эксперту" на основе генеративного ИИ технические вопросы о рабочих процедурах.
  • Потребитель может задать чат-боту вопросы о том, как собрать новый предмет мебели.

Проекты работ

  • Разработчик программного обеспечения может попросить генеративный ИИ создать целые строки кода или предложить способы завершения частичных строк существующего кода.
  • Менеджер по маркетингу может использовать генеративный ИИ для составления различных версий сообщений кампании.

По мере развития и совершенствования технологии такие виды генеративного ИИ могут все больше интегрироваться в рабочие процессы предприятия для автоматизации задач и непосредственного выполнения конкретных действий (например, автоматическая отправка кратких заметок в конце совещаний). Мы уже видим появление инструментов в этой области.

Чем генеративный ИИ отличается от других видов ИИ

Как следует из названия, основной способ, которым генеративный ИИ отличается от предыдущих форм ИИ или аналитики, заключается в том, что он может генерировать новый контент, часто в «неструктурированных» формах (например, письменный текст или изображения), которые не представлены в естественном виде — таблицы со строками и столбцами (см. ниже врезку «Глоссарий» для списка терминов, связанных с генеративным ИИ).

Глоссарий

API (Application programming interface) - Интерфейс прикладного программирования - это способ программного доступа к (обычно внешним) моделям, наборам данных или другим частям программного обеспечения.

AI (Artificial intelligence) - Искусственный интеллект (ИИ) - это способность программного обеспечения выполнять задачи, для которых традиционно требуется человеческий интеллект.

Deep learning - Глубокое обучение - это подмножество машинного обучения, использующее глубокие нейронные сети, которые представляют собой слои соединенных "нейронов", чьи связи имеют параметры или веса, которые можно обучить. Это особенно эффективно при обучении на неструктурированных данных, таких как изображения, текст и аудио.

Fine-tuning - Тонкая настройка - это процесс адаптации предварительно обученной базовой модели для более эффективного выполнения конкретной задачи. Это подразумевает относительно короткий период обучения на маркированном наборе данных, который намного меньше, чем набор данных, на котором изначально обучалась модель. Это дополнительное обучение позволяет модели научиться и адаптироваться к нюансам, терминологии и специфическим закономерностям, обнаруженным в меньшем наборе данных.

Foundation models (FM) - Базовые модели (FM) - это модели глубокого обучения, обученные на огромном количестве неструктурированных, немаркированных данных, которые можно использовать для широкого круга задач "из коробки" или адаптировать к конкретным задачам путем тонкой настройки. Примерами таких моделей являются GPT-4, PaLM, DALL-E 2 и Stable Diffusion.

Generative AI (GenAI) - Генеративный ИИ - это ИИ, который обычно строится с использованием базовых моделей и обладает возможностями, которых не было у более ранних ИИ, например, способностью генерировать контент. Фундаментальные модели также могут использоваться для негенеративных целей (например, классификация настроений пользователей как негативных или позитивных на основе стенограмм звонков), при этом они значительно улучшаются по сравнению с более ранними моделями. Для простоты, когда мы говорим о генеративном ИИ в этой статье, мы включаем все случаи использования базовых моделей.

GPUs (Graphics processing units) - Графические процессоры - это компьютерные чипы, которые изначально были разработаны для создания компьютерной графики (например, для видеоигр) и также полезны для приложений глубокого обучения. В отличие от этого, традиционное машинное обучение и другие анализы обычно выполняются на центральных процессорах (CPU), обычно называемых "процессором" компьютера.

LLMs (Large language models) - Большие языковые модели - представляют собой класс базовых моделей, которые могут обрабатывать огромные объемы неструктурированного текста и изучать отношения между словами или частями слов, известными как лексемы. Это позволяет LLM генерировать текст на естественном языке, выполняя такие задачи, как обобщение или извлечение знаний. GPT-4 (лежит в основе ChatGPT) и LaMDA (модель, лежащая в основе Bard) являются примерами LLM.

ML (Machine learning) - Машинное обучение (МО)- это подмножество ИИ, в котором модель приобретает способности после того, как ее обучают или показывают на множестве примеров данных. Алгоритмы машинного обучения выявляют закономерности и учатся делать прогнозы и рекомендации, обрабатывая данные и опыт, а не получая явные инструкции по программированию. Алгоритмы также адаптируются и могут стать более эффективными в ответ на новые данные и опыт.

MLOps относится к инженерным моделям и практикам для масштабирования и поддержания ИИ и МО. Она включает в себя набор практик, охватывающих полный жизненный цикл МО (управление данными, разработка, развертывание и эксплуатация). Многие из этих практик в настоящее время поддерживаются или оптимизируются с помощью вспомогательного программного обеспечения (инструментов, которые помогают стандартизировать, упорядочить или автоматизировать задачи).

Prompt engineering - Инженерия подсказок - это процесс разработки, уточнения и оптимизации входных подсказок для направления генеративной модели ИИ на получение желаемых (то есть точных) результатов.

Structured data - Структурированные данные - это табличные данные (например, организованные в таблицах, базах данных или электронных таблицах), которые могут быть использованы для эффективного обучения некоторых моделей машинного обучения.

Unstructured data - Неструктурированные данные не имеют единого формата или структуры (например, текст, изображения и аудиофайлы) и обычно требуют более сложных методов для извлечения информации.

Как следует из названия, основное отличие генеративного ИИ от предыдущих форм ИИ или аналитики заключается в том, что он может генерировать новый контент, часто в "неструктурированной" форме (например, письменный текст или изображения), который не может быть естественным образом представлен в таблицах со строками и столбцами (список терминов, связанных с генеративным ИИ, см. на боковой панели "Глоссарий").

Технология, лежащая в основе работы генеративного ИИ, представляет собой класс искусственных нейронных сетей, называемых фундаментными моделями. Искусственные нейронные сети вдохновлены миллиардами нейронов, соединенных в человеческом мозге. Они обучаются с помощью глубокого обучения - термина, обозначающего множество (глубоких) слоев в нейронных сетях. Глубокое обучение стало основой многих последних достижений в области ИИ.

Однако некоторые характеристики отличают модели foundation от предыдущих поколений моделей глубокого обучения. Начнем с того, что их можно обучать на очень больших и разнообразных наборах неструктурированных данных. Например, тип фундаментальной модели, называемый большой языковой моделью, может быть обучен на огромных объемах текста, который находится в открытом доступе в Интернете и охватывает множество различных тем. Хотя другие модели глубокого обучения могут работать на значительных объемах неструктурированных данных, они обычно обучаются на более конкретном наборе данных. Например, модель может быть обучена на определенном наборе изображений, чтобы она могла распознавать определенные объекты на фотографиях.

На самом деле, другие модели глубокого обучения часто могут выполнять только одну такую задачу. Например, они могут либо классифицировать объекты на фотографии, либо выполнять другую функцию, например, делать предсказания. В отличие от них, одна базовая модель может выполнять обе эти функции, а также генерировать контент. Фундаментальные модели накапливают эти возможности путем изучения закономерностей и взаимосвязей на основе обширных обучающих данных, которые они получают, что, например, позволяет им предсказывать следующее слово в предложении. Именно так ChatGPT может отвечать на вопросы по различным темам, а DALL-E 2 и Stable Diffusion могут создавать изображения на основе описания.

Учитывая универсальность базовой модели, компании могут использовать одну и ту же модель для реализации нескольких бизнес-кейсов, чего редко удавалось достичь при использовании более ранних моделей глубокого обучения. Фундаментальная модель, содержащая информацию о продукции компании, может быть использована как для ответов на вопросы клиентов, так и для поддержки инженеров при разработке обновленных версий продукции. В результате компании смогут быстрее создавать приложения и реализовывать их преимущества.

Однако из-за того, как работают существующие модели фундамента, они не подходят для всех приложений. Например, большие языковые модели могут быть склонны к "галлюцинациям", или ответам на вопросы с правдоподобными, но неправдивыми утверждениями (см. боковую панель "Ответственное использование генеративного ИИ"). Кроме того, не всегда можно найти обоснование или источники для ответа. Это означает, что компании должны быть осторожны с интеграцией генеративного ИИ без человеческого контроля в приложениях, где ошибки могут причинить вред или где требуется объяснение. В настоящее время генеративный ИИ также не подходит для прямого анализа больших объемов табличных данных или решения сложных задач численной оптимизации. Исследователи активно работают над устранением этих недостатков.

Ответственное использование генеративного ИИ

Генеративный ИИ сопряжен с различными рисками. Руководители компаний захотят разработать свои команды и процессы для снижения этих рисков с самого начала - не только для того, чтобы соответствовать быстро меняющимся нормативным требованиям, но и для того, чтобы защитить свой бизнес и заслужить цифровое доверие потребителей (рекомендации по этому поводу мы предлагаем далее в статье).

Справедливость: Модели могут генерировать алгоритмическую предвзятость из-за несовершенства обучающих данных или решений, принятых инженерами, разрабатывающими модели.

Интеллектуальная собственность (ИС): Данные обучения и результаты моделирования могут создавать значительные риски для интеллектуальной собственности, включая нарушение авторских прав, товарных знаков, патентов или других материалов, защищенных законом. Даже при использовании генеративного инструмента ИИ, предлагаемого поставщиком, организациям необходимо понимать, какие данные использовались для обучения и как они используются в выходных данных инструмента.

Конфиденциальность: Проблемы конфиденциальности могут возникнуть, если пользователи будут вводить информацию, которая впоследствии окажется в выходных данных модели в форме, позволяющей идентифицировать личность. Генеративный ИИ также может использоваться для создания и распространения вредоносного контента, такого как дезинформация, глубокие подделки и язык вражды.

Безопасность: Генеративный ИИ может использоваться злоумышленниками для повышения сложности и скорости кибератак. Им также можно манипулировать для получения вредоносных результатов. Например, с помощью техники, называемой инъекцией подсказки, третья сторона дает модели новые инструкции, которые обманом заставляют модель выдать результат, не предусмотренный производителем модели и конечным пользователем.

Объяснимость: Генеративный ИИ опирается на нейронные сети с миллиардами параметров, что ставит под сомнение нашу способность объяснить, как получается тот или иной ответ.

Надежность: Модели могут давать разные ответы на одни и те же вопросы, что мешает пользователю оценить точность и надежность результатов.

Организационное воздействие: Генеративный ИИ может существенно повлиять на рабочую силу, а воздействие на конкретные группы и местные сообщества может быть непропорционально негативным.

Социальное и экологическое воздействие: Разработка и обучение моделей основ может привести к пагубным социальным и экологическим последствиям, включая увеличение выбросов углекислого газа (например, при обучении одной большой языковой модели может быть выброшено около 315 тонн углекислого газа).

Развивающаяся экосистема генеративного ИИ

В то время как базовые модели служат "мозгом" генеративного ИИ, возникает целая цепочка создания стоимости для поддержки обучения и использования этой технологии (Рисунок 2).1 Специализированное оборудование обеспечивает значительные вычислительные мощности, необходимые для обучения моделей. Облачные платформы позволяют использовать это оборудование. MLOps и поставщики центров моделей предлагают инструменты, технологии и методы, необходимые организации для адаптации базовой модели и ее развертывания в приложениях конечных пользователей. Многие компании выходят на рынок, предлагая приложения, построенные на основе базовых моделей, которые позволяют выполнять конкретные задачи, например, помогать клиентам компании в решении вопросов обслуживания.

Рисунок 2

Первые базовые модели требовали больших инвестиций для разработки, учитывая значительные вычислительные ресурсы, необходимые для их обучения, и человеческие усилия, необходимые для их совершенствования. В результате они были разработаны в основном несколькими технологическими гигантами, стартапами, получившими значительные инвестиции, и некоторыми исследовательскими коллективами с открытым исходным кодом (например, BigScience). Однако в настоящее время ведется работа как над более компактными моделями, способными обеспечить эффективные результаты при решении некоторых задач, так и над более эффективным обучением. В конечном итоге это может открыть рынок для большего числа участников. Некоторые стартапы уже преуспели в разработке собственных моделей - например, Cohere, Anthropic и AI21 Labs создают и обучают свои собственные большие языковые модели.

Каждый генеральный директор должен вместе с командой руководителей подумать, где и как играть. Некоторые руководители могут решить, что генеративный ИИ представляет собой трансформационную возможность для их компаний, предлагая шанс переосмыслить все - от исследований и разработок до маркетинга и продаж и работы с клиентами. Другие предпочтут начать с малого, а затем расширить масштабы. Как только решение принято, существуют технические пути, по которым могут пойти специалисты по ИИ для реализации стратегии, в зависимости от конкретного случая использования.

Большая часть пользы (хотя и не обязательно вся польза) от генеративного ИИ в организации будет получена от работников, использующих функции, встроенные в уже имеющееся у них программное обеспечение. Системы электронной почты будут предоставлять возможность написания первых черновиков сообщений. Приложения для повышения производительности создадут первый черновик презентации на основе описания. Финансовое программное обеспечение будет генерировать прозаическое описание примечательных особенностей финансового отчета. Системы управления взаимоотношениями с клиентами предложат способы взаимодействия с клиентами. Эти функции могут ускорить производительность каждого работника, обладающего знаниями.

Но генеративный ИИ может быть и более преобразующим в определенных случаях использования. Далее мы рассмотрим четыре примера того, как компании из разных отраслей используют генеративный ИИ сегодня для изменения методов работы в своей организации. Примеры варьируются от требующих минимальных ресурсов до ресурсоемких начинаний. (Для краткого сравнения этих примеров и более подробной технической информации см. рисунок 3).

Рисунок 3

Чтобы повысить производительность труда инженеров, компания внедряет продукт для завершения кода на основе искусственного интеллекта, который интегрируется с программным обеспечением, используемым инженерами для разработки кода. Это позволяет инженерам писать описания кода на естественном языке, а ИИ предлагает несколько вариантов блоков кода, которые удовлетворяют описанию. Инженеры могут выбрать одно из предложений ИИ, внести необходимые уточнения и нажать на него, чтобы вставить код.

Наши исследования показали, что такие инструменты могут ускорить создание кода разработчиком на 50 процентов. Они также могут помочь в отладке, что может улучшить качество разработанного продукта. Но сегодня генеративный ИИ не может заменить квалифицированных инженеров-программистов. На самом деле, более опытные инженеры получают наибольшую отдачу от использования этих инструментов, а неопытные разработчики видят менее впечатляющие, а иногда и отрицательные результаты. Известный риск заключается в том, что генерируемый ИИ код может содержать уязвимости или другие ошибки, поэтому для обеспечения качества и безопасности кода необходимо участие инженеров-программистов (о способах снижения рисков читайте в последнем разделе этой статьи).

Стоимость этого готового инструмента генеративного кодирования ИИ относительно невелика, а время выхода на рынок невелико, поскольку продукт доступен и не требует значительных внутренних разработок. Стоимость зависит от поставщика программного обеспечения, но подписка с фиксированной платой составляет от 10 до 30 долларов США на пользователя в месяц. При выборе инструмента важно обсудить с поставщиком вопросы лицензирования и интеллектуальной собственности, чтобы убедиться, что сгенерированный код не приведет к нарушениям.

Поддержка нового инструмента - это небольшая межфункциональная группа, которая занимается выбором поставщика программного обеспечения и мониторингом производительности, который должен включать проверку интеллектуальной собственности и проблем безопасности. Внедрение требует только изменения рабочего процесса и политики. Поскольку инструмент представляет собой готовое программное обеспечение как услуга (SaaS), дополнительные затраты на вычисления и хранение данных минимальны или вообще отсутствуют.

Менеджеры по связям с общественностью тратят значительное время на просмотр больших документов, таких как годовые отчеты и стенограммы звонков о доходах, чтобы быть в курсе ситуации и приоритетов клиента. Это позволяет RM предлагать услуги, соответствующие конкретным потребностям клиента.

Банк решил построить решение, которое получает доступ к модели фундамента через API. Решение сканирует документы и может быстро предоставить синтезированные ответы на вопросы, заданные RM. Вокруг базовой модели создаются дополнительные слои для упрощения работы пользователей, интеграции инструмента с системами компании и применения контроля рисков и соответствия нормативным требованиям. В частности, результаты работы модели должны быть проверены, как организация проверяет результаты работы младшего аналитика, поскольку некоторые большие языковые модели, как известно, могут вызывать галлюцинации. RM также обучаются задавать вопросы таким образом, чтобы получить наиболее точные ответы от решения (так называемый оперативный инжиниринг), а также внедряются процессы для упрощения проверки результатов работы инструмента и источников информации.

В данном случае генеративный ИИ может ускорить процесс анализа RM (с нескольких дней до нескольких часов), повысить удовлетворенность работой и потенциально получить информацию, которую RM мог бы не заметить.

Затраты на разработку в основном связаны с созданием пользовательского интерфейса и интеграцией, что требует времени от специалиста по исследованию данных, инженера машинного обучения или инженера по данным, дизайнера и front-end разработчика. Текущие расходы включают в себя обслуживание программного обеспечения и стоимость использования API. Затраты зависят от выбора модели и оплаты услуг сторонних поставщиков, размера команды и времени до создания минимально жизнеспособного продукта.

Представители службы поддержки клиентов этой компании обрабатывают сотни входящих запросов в день. Время ответа иногда было слишком большим, что вызывало недовольство пользователей. Компания решила внедрить генеративный бот для обслуживания клиентов с искусственным интеллектом, который будет обрабатывать большинство запросов клиентов. Целью был быстрый ответ в тоне, соответствующем бренду компании и предпочтениям клиентов. Часть процесса доработки и тестирования базовой модели включает в себя обеспечение соответствия ответов специфическому языку, обещаниям бренда и тону, заданному для компании; постоянный мониторинг необходим для проверки работы системы по нескольким параметрам, включая удовлетворенность клиентов.

Компания создала дорожную карту продукта, состоящую из нескольких волн, чтобы минимизировать потенциальные ошибки модели. В ходе первой волны чат-бот был опробован внутри компании. Сотрудники могли давать ответы "большой палец вверх" или "большой палец вниз" на предложения модели, и модель могла учиться на этих данных. В качестве следующего шага модель "слушала" разговоры со службой поддержки и предлагала свои предложения. Когда технология была достаточно протестирована, началась вторая волна, и модель была переведена на работу с клиентами, в которой участвовал человек. В конечном итоге, когда руководители полностью уверены в технологии, она может быть полностью автоматизирована.

В данном случае генеративный ИИ позволил высвободить представителей службы поддержки, чтобы сосредоточиться на более ценных и сложных запросах клиентов, повысить эффективность работы представителей и удовлетворенность их работой, а также повысить стандарты обслуживания и удовлетворенность клиентов. Бот имеет доступ ко всем внутренним данным о клиенте и может "запоминать" предыдущие разговоры (включая телефонные звонки), что представляет собой шаг вперед по сравнению с существующими чат-ботами для клиентов.

Для получения преимуществ этот вариант использования потребовал существенных инвестиций в программное обеспечение, облачную инфраструктуру и технических специалистов, а также более высокой степени внутренней координации рисков и операций. В целом, доработка базовых моделей обходится в два-три раза дороже, чем создание одного или нескольких программных слоев поверх API. Увеличение затрат связано с расходами на персонал и сторонних специалистов для облачных вычислений (при доработке модели на собственном хостинге) или API (при доработке через API стороннего производителя). Для внедрения решения компании потребовалась помощь специалистов DataOps и MLOps, а также других подразделений, таких как управление продуктами, дизайн, юридическая служба и специалисты по обслуживанию клиентов.

В этом примере ученые-исследователи, занимающиеся разработкой лекарств в фармацевтической компании, должны были решить, какие эксперименты проводить дальше, основываясь на изображениях, полученных с помощью микроскопии. У них был набор данных из миллионов таких изображений, содержащих огромное количество визуальной информации об особенностях клеток, которые имеют значение для открытия лекарств, но которые трудно интерпретировать человеку. Эти изображения использовались для оценки потенциальных терапевтических кандидатов.

Компания решила создать инструмент, который помог бы ученым понять взаимосвязь между химическим составом лекарств и зарегистрированными результатами микроскопии, чтобы ускорить научно-исследовательскую работу. Поскольку подобные мультимодальные модели находятся в зачаточном состоянии, компания решила создать свою собственную. Для создания модели члены команды использовали как реальные изображения, которые применяются для обучения основополагающих моделей на основе изображений, так и большой внутренний набор данных микроскопических изображений.

Обученная модель добавила ценность, предсказав, какие кандидаты в лекарственные препараты могут привести к благоприятному исходу, и улучшив способность точно определять соответствующие характеристики клеток для поиска лекарств. Это может привести к более эффективным и результативным процессам открытия лекарственных препаратов, не только улучшая время достижения ценности, но и уменьшая количество неточных, вводящих в заблуждение или неудачных анализов.

В целом, обучение модели с нуля обходится в 10-20 раз дороже, чем создание программного обеспечения на основе API модели. Разница в стоимости объясняется более крупными командами (включающими, например, экспертов по машинному обучению уровня PhD) и более высокими расходами на вычисления и хранение данных. Прогнозируемая стоимость обучения базовой модели сильно варьируется в зависимости от желаемого уровня производительности модели и сложности моделирования. Эти факторы влияют на необходимый размер набора данных, состав команды и вычислительные ресурсы. В данном примере использования большая часть затрат пришлась на инженерную группу и текущие облачные расходы.

Компания обнаружила, что потребуются значительные изменения в технической инфраструктуре и процессах, включая доступ ко многим экземплярам GPU для обучения модели, инструменты для распределения обучения по многим системам и лучшие практики MLOps для ограничения стоимости и продолжительности проекта. Кроме того, потребовалась значительная работа по обработке данных для сбора, интеграции (обеспечение одинакового формата и разрешения файлов различных наборов данных) и очистки (фильтрация некачественных данных, удаление дубликатов и обеспечение соответствия распределения предполагаемому использованию). Поскольку базовая модель была подготовлена с нуля, необходимо было провести тщательное тестирование окончательной модели, чтобы убедиться в точности и безопасности использования результатов.

Уроки, которые руководители компаний могут извлечь из этих примеров

Приведенные здесь примеры использования предлагают важные выводы для руководителей компаний, вступающих на путь генеративного ИИ:

  • Трансформационные сценарии использования, обеспечивающие практическую пользу для рабочих мест и трудовой деятельности, уже существуют. Компании всех отраслей, от фармацевтики до банковского дела и розничной торговли, создают целый ряд примеров использования, чтобы использовать потенциал создания стоимости. Организации могут начинать с малого или крупного, в зависимости от их стремления.
  • Затраты на использование генеративного ИИ варьируются в широких пределах, в зависимости от варианта использования и данных, необходимых для программного обеспечения, облачной инфраструктуры, технических знаний и снижения рисков. Компании должны принимать во внимание вопросы риска, независимо от случая использования, и некоторые из них потребуют больше ресурсов, чем другие.
  • Несмотря на преимущества быстрого старта, создание базового бизнес-кейса поможет компаниям лучше ориентироваться в пути генеративного ИИ.

Организация для генеративного ИИ

Многие организации начали изучать возможности традиционного ИИ в рамках разрозненных экспериментов. Генеративный ИИ требует более взвешенного и скоординированного подхода, учитывая его уникальные риски и способность базовых моделей лежать в основе множества вариантов использования в организации. Например, модель, доработанная с использованием запатентованных материалов для отражения фирменного стиля предприятия, может быть развернута в нескольких вариантах использования (например, генерирование персонализированных маркетинговых кампаний и описаний продуктов) и бизнес-функциях, таких как разработка продуктов и маркетинг.

С этой целью мы рекомендуем созвать межфункциональную группу руководителей компании (например, представляющих науку о данных, инженерные, юридические, кибербезопасные, маркетинговые, дизайнерские и другие бизнес-функции). Такая группа может не только помочь определить и расставить приоритеты для наиболее ценных вариантов использования, но и обеспечить скоординированное и безопасное внедрение в рамках всей организации.

Создание сквозных решений в противовес фокусированию на вариантах использования

Генеративный ИИ - это мощный инструмент, который может изменить методы работы организаций, оказывая особое влияние на определенные сферы бизнеса в цепочке создания стоимости (например, маркетинг для розничной торговли или операционная деятельность для производителя). Простота развертывания генеративного ИИ может искушать организации применять его в единичных случаях использования по всему бизнесу. Важно иметь представление о семействе вариантов использования по областям, которые будут обладать наибольшим преобразующим потенциалом для всех бизнес-функций. Организации заново представляют себе целевое состояние, которое обеспечивается генеративным ИИ, работающим синхронно с другими традиционными приложениями ИИ, а также новыми способами работы, которые раньше были невозможны.

Обеспечение полностью загруженного технологического стека

Современный стек данных и технологий является ключом практически к любому успешному подходу к генеративному ИИ. Руководители компаний должны обратиться к своим главным технологам, чтобы определить, обладает ли компания необходимыми техническими возможностями в плане вычислительных ресурсов, систем данных, инструментов и доступа к моделям (с открытым исходным кодом через центры моделей или коммерческим через API).

Например, жизненной силой генеративного ИИ является текущий доступ к данным, заточенным под конкретный бизнес-контекст или проблему. Компании, которые еще не нашли способов эффективной гармонизации и обеспечения свободного доступа к своим данным, не смогут точно настроить генеративный ИИ, чтобы раскрыть все его потенциально преобразующие возможности. Не менее важно разработать масштабируемую архитектуру данных, включающую процедуры управления данными и обеспечения безопасности. В зависимости от варианта использования, существующая вычислительная и инструментальная инфраструктура (которая может быть получена от облачного провайдера или создана собственными силами) также может нуждаться в модернизации. Четкая стратегия в области данных и инфраструктуры, основанная на бизнес-ценностях и конкурентных преимуществах, получаемых от генеративного ИИ, будет иметь решающее значение.

Строительство «маяка»

Руководители компаний захотят избежать застревания на стадии планирования. Новые модели и приложения разрабатываются и выпускаются быстро. Например, GPT-4 был выпущен в марте 2023 года, после выхода ChatGPT (GPT-3.5) в ноябре 2022 года и GPT-3 в 2020 году. В мире бизнеса время имеет первостепенное значение, и стремительный характер технологии генеративного ИИ требует от компаний быстрых действий, чтобы воспользоваться ее преимуществами. Есть несколько способов, с помощью которых руководители компаний могут не останавливаться на достигнутом.

Хотя генеративный ИИ еще только зарождается, важно показать на внутреннем уровне, как он может повлиять на операционную модель компании, возможно, с помощью "маячного подхода". Например, один из вариантов развития событий - создание "виртуального эксперта", который позволит сотрудникам передового звена использовать собственные источники знаний и предлагать клиентам наиболее актуальный контент. Это может повысить производительность, вызвать энтузиазм и позволить организации протестировать генеративный ИИ внутри компании, прежде чем масштабировать его на приложения, ориентированные на клиентов.

Как и в случае с другими волнами технических инноваций, будет наблюдаться усталость от пробных концепций и множество примеров компаний, застрявших в "чистилище пилотов". Но поощрение доказательства концепции по-прежнему является лучшим способом быстро протестировать и доработать ценный бизнес-кейс, прежде чем расширять его до смежных вариантов использования. Сосредоточившись на ранних победах, дающих значимые результаты, компании могут наращивать темпы, а затем расширять масштабы, используя многоцелевой характер генеративного ИИ. Такой подход может позволить компаниям способствовать более широкому внедрению ИИ и создать культуру инноваций, которая необходима для сохранения конкурентных преимуществ. Как уже говорилось выше, межфункциональная команда руководителей должна быть уверена в том, что такие пробные концепции являются продуманными и скоординированными.

Баланс между риском и созданием ценности

Как показывают наши четыре подробных примера использования, бизнес-лидеры должны сбалансировать возможности создания стоимости с рисками, связанными с генеративным ИИ. Согласно нашему недавнему исследованию Global AI Survey, большинство организаций не снижают большинство рисков, связанных с традиционным ИИ, несмотря на то, что более половины организаций уже внедрили эту технологию. Генеративный ИИ заставляет вновь обратить внимание на многие из этих же рисков, таких как возможность увековечить предвзятость, скрытую в обучающих данных, и одновременно создает новые риски, такие как склонность к галлюцинациям.

В результате межфункциональная команда руководителей должна не только разработать общие этические принципы и рекомендации по использованию генеративного ИИ, но и тщательно изучить риски, связанные с каждым потенциальным случаем использования. Важно искать первоначальные варианты использования, которые соответствуют общей толерантности организации к риску и имеют структуры для снижения последующего риска. Например, организация розничной торговли может отдать предпочтение варианту использования, который имеет немного меньшую ценность, но и меньший риск - например, создание первоначальных черновиков маркетингового контента и другие задачи, в которых человек постоянно находится в курсе событий. В то же время компания может отложить в сторону более ценные и высокорискованные варианты использования, такие как инструмент для автоматического составления и отправки гиперперсонализированных маркетинговых писем. Такая практика, ориентированная на риск, может позволить организациям создать механизмы контроля, необходимые для надлежащего управления генеративным ИИ и обеспечения соответствия требованиям.

Руководители компаний и их команды также захотят быть в курсе последних изменений в регулировании генеративного ИИ, включая правила, связанные с защитой данных потребителей и прав интеллектуальной собственности, чтобы защитить компанию от проблем с ответственностью. Страны могут применять различные подходы к регулированию, как они уже часто делают это в отношении ИИ и данных. Организациям может потребоваться адаптировать свой рабочий подход, чтобы откалибровать управление процессами, культуру и управление талантами таким образом, чтобы они могли справиться с быстро меняющейся нормативной средой и рисками генеративного ИИ в масштабе.

Применение экосистемного подхода к партнерским отношениям

Руководители компаний должны сосредоточиться на создании и поддержании сбалансированного набора альянсов. Стратегия приобретений и альянсов компании должна по-прежнему концентрироваться на создании экосистемы партнеров, адаптированных к различным условиям и удовлетворяющих требованиям генеративного ИИ на всех уровнях технологического стека, но при этом следует избегать привязки к поставщикам.

Партнерство с правильными компаниями может помочь ускорить реализацию. Организациям не обязательно самим создавать все приложения или базовые модели. Вместо этого они могут сотрудничать с поставщиками и экспертами в области генеративного ИИ для более быстрого продвижения вперед. Например, они могут объединиться с поставщиками моделей для настройки моделей под конкретный сектор или сотрудничать с поставщиками инфраструктуры, которые предлагают вспомогательные возможности, такие как масштабируемые облачные вычисления.

Компании могут использовать опыт других и быстро воспользоваться преимуществами новейших технологий генеративного ИИ. Но генеративные модели ИИ - это только наконечник копья: для создания стоимости требуется множество дополнительных элементов.

Фокусировка на необходимых талантах и навыках

Чтобы эффективно применять генеративный ИИ для повышения ценности бизнеса, компаниям необходимо наращивать свои технические возможности и повышать квалификацию имеющегося персонала. Это требует согласованных усилий со стороны руководства для определения необходимых возможностей на основе приоритетных сценариев использования компании, которые, вероятно, выходят за рамки технических ролей и включают в себя набор талантов в области инженерии, данных, проектирования, рисков, продуктов и других бизнес-функций.

Как видно из приведенных выше примеров использования, технические потребности и потребности в талантах сильно варьируются в зависимости от характера конкретной реализации - от использования готовых решений до создания базовой модели с нуля. Например, для создания генеративной модели компании могут понадобиться специалисты по машинному обучению уровня доктора наук; с другой стороны, для разработки инструментов генеративного ИИ с использованием существующих моделей и предложений SaaS достаточно инженера по данным и инженера-программиста.

Помимо найма нужных специалистов, компании захотят обучать и тренировать имеющийся персонал. Разговорные пользовательские интерфейсы на основе подсказок могут сделать приложения генеративного ИИ простыми в использовании. Однако пользователям все еще необходимо оптимизировать подсказки, понимать ограничения технологии и знать, где и когда они могут приемлемо интегрировать приложение в свои рабочие процессы. Руководству следует предоставить четкие рекомендации по использованию инструментов генеративного ИИ и предложить постоянное обучение и тренинги, чтобы сотрудники были в курсе рисков, связанных с ними. Формирование культуры самостоятельных исследований и экспериментов также может стимулировать сотрудников к внедрению инновационных процессов и продуктов, эффективно использующих эти инструменты.


Предприятия уже много лет реализуют амбиции в области ИИ, и многие из них добились новых потоков доходов, улучшения качества продукции и повышения эффективности работы. Большая часть успехов в этих областях была достигнута благодаря технологиям ИИ, которые остаются лучшим инструментом для конкретной работы, и компаниям следует продолжать наращивать такие усилия. Однако генеративный ИИ представляет собой еще один многообещающий скачок вперед и мир новых возможностей. Хотя операционные и рисковые леса для этой технологии еще только создаются, руководители компаний знают, что им следует начать путь к генеративному ИИ. Но с чего и как им следует начать? Ответ на этот вопрос зависит от конкретной компании, а также от организации в целом. Одни начнут с большого, другие проведут небольшие эксперименты. Лучший подход будет зависеть от стремления компании и ее склонности к риску. Каковы бы ни были амбиции, главное - начать и учиться на практике.


В статье использованы материалы исследований отчётов McKinsey & Company