Цифровая трансформация
December 22, 2023

Графы знаний — инструмент для поддержки успешных программ цифровой трансформации

Графы знаний в наши дни довольно популярны. Хотя в наши дни этот класс технологий привлекает большое внимание рынка и поставщиков, это не обязательно новая конструкция или подход. Основные принципы существуют уже несколько десятилетий. Организации все больше осознают потенциал графов знаний, но многие цифровые лидеры озадачены тем, как сделать следующий шаг и создать бизнес-возможности, которые будут использовать эту технологию.

Сет Эрли
Эксперт с более чем 20-летним опытом работы в области стратегии знаний, информационной архитектуры, поисковых приложений и решений для поиска информации. Он автор отмеченной наградами книги «Предприятие, основанное на искусственном интеллекте», а также востребованный оратор, автор и влиятельный человек. Признан Thinkers 360 одним из 50 лучших мировых лидеров мысли и влиятельных лиц в области искусственного интеллекта 2022 года.

Как и многие технологические тенденции, то, что кажется новым, на самом деле имеет богатую историю. В презентации на конференции в апреле 2021 года Хуан Секеда и Клаудио Гутьеррес обсудили историю знаний и представления данных и проследили ее хронологию с 1950-х годов до наших дней.

Они описали, как строительные блоки и основные принципы графов знаний разрабатывались на протяжении десятилетий, и как проблема осмысления неструктурированной информации и ее связи со структурированными данными лежала в основе инициатив в области ИИ за тот же период.

Вечнозеленые проблемы с данными

У каждой организации есть проблемы с любыми видами данных. Сюда входят структурированные данные, такие как

  • бухгалтерская информация,
  • транзакционные и операционные данные,
  • данные процессов,
  • внешние источники данных,
  • потоки данных, создаваемые цифровым опытом и технологиями на рабочем месте,
  • данные о поведении клиентов,
  • данные об эффективности производства,
  • данные электронной коммерции и многое другое.

Интеграция множества наборов структурированных данных в значимую обобщённую картину создаёт технические проблемы. Однако сделать неструктурированный контент более удобным и доступным для поиска оказалось еще сложнее и очень дорого.

Неструктурированный контент включает в себя разнообразный набор документов, изображений и явных знаний в виде политик, процедур, руководств, устранения неполадок, этапов установки, дизайна продукта, технических схем, чертежей и других «явных» знаний.

Проблемы управления контентом постоянны — они не поддаются постоянным решениям из-за появления новых типов контента, скорости информационных потоков, характера развития технологий и динамичных изменений на рынке.

С годами предприятие перешло от формального владения и централизованного контроля над «документами» в форме функции управления записями к полностью децентрализованному созданию и управлению чем-либо, напоминающим документ, что нанесло ущерб менеджерам по документации и индустрии управления документами. Записью может быть что угодно, что может подтвердить любой, кто участвует в «судебных разбирательствах».

Нормативно-правовая среда также стала более сложной, а официальные записи транзакций, бизнес-процессов и деловых отношений лежат в основе соблюдения нормативных требований, что делает управление ими все более сложным, и ещё более важным.

Проблема «как мне найти свои вещи» с годами становится все более актуальной, и поставщики в области поиска, контента и управления знаниями пытались решить эту проблему, продвигая в качестве решения свой новейший технический подход. Организации говорят: «Хорошо, давайте попробуем – похоже, у них есть секретный соус» и применяют инструменты. Все выглядит великолепно, и люди могут найти свои вещи… на какое-то время.

К сожалению, спеша подготовить инструменты, руководство, возможно, не уделило должного внимания основам, необходимым для информации – структуре, на которой она организована.

Неизбежно новый блестящий инструмент наполняется все большим и большим количеством контента, но с непоследовательными атрибутами и именами файлов, оперативным добавлением тегов и другими грехами и нарушениями библиотечной науки.

Поскольку беспорядок становится несостоятельным, система, которую когда-то все любили, становится объектом презрения пользователей. «Наши пользователи ненавидят _________», (заполните поле).

Но на самом деле они ненавидят не инструмент или технологию, так оно и было реализовано – без достаточного учета потребностей пользователей и ситуаций, в которых им придется использовать этот инструмент.

Бизнес-лидеры (или технологические лидеры, монополии на принятие плохих решений не существует) решают, что нужен новый инструмент. Тот другой инструмент был неподходящим. И вот новый, который они видят демо-версию, читают статью или узнают от коллеги, и цикл начинается заново.

Введите когнитивный ИИ

Когнитивный искусственный интеллект, который стремится имитировать человеческие мысли и реакции, снижает когнитивную нагрузку на людей, обеспечивая поиск на естественном языке, виртуальных помощников или персонализированный опыт работы в Интернете с помощью ботов-помощников и чат-ботов.

Некоторые технологии искусственного интеллекта пытаются искупить прошлые грехи организаций, связанные с плохим дизайном и информационной гигиеной. Граф знаний представляет собой информационную основу предприятия, которая сообщает алгоритмам, что важно, и помогает решить проблему отсутствия тегов в неструктурированном тексте.

Графы знаний можно определить с нескольких точек зрения. Лидеры цифровых технологий понимают, что информация должна быть организована таким образом, чтобы помочь клиентам найти то, что им нужно, будь то продукт или информация о том, как решить проблему.

Таксономии — это способ организации информации (например, каталога продуктов для сайта электронной торговли), который группирует продукты в структуру «родитель/потомок» или «цело/части» (электроинструменты/электрические дрели/аккумуляторные дрели).

На уровне страницы продукта пользователи могут фильтровать товары по бренду, цене, размеру, напряжению, типу батареи и т. д. Эти списки определяются с использованием таксономий и контролируемых словарей. На рисунке 1 приведен пример набора таксономий, определяющих характеристики аккумуляторных дрелей:

Каждый дескриптор имеет список значений, поэтому при проектировании информационной структуры сайта электронной торговли определяется несколько таксономий для создания цифрового опыта.

Отношения также могут быть построены между таксономиями. Например, если одна таксономия описывает продукты, а другая — услуги, доступность конкретных услуг для этого продукта становится способом связать эти две структуры.

Промышленный дистрибьютор может использовать несколько таксономий для описания не только продуктов. Информационная область содержит множество различных элементов.

Когда определяются отношения между различными таксономиями, результат называется онтологией. Онтология содержит три типа отношений:

  • Иерархический: Традиционный родитель/ребенок, целая часть «сущности» (это дрель, аккумуляторная дрель — это разновидность дрели).
  • Эквивалентность: это непредпочтительные термины (варианты, которые используют люди и которые не являются «официальными» терминами — синонимы, аббревиатуры, технические термины по сравнению с терминами для непрофессионалов, кодовыми названиями).
  • Ассоциативные: это концептуальные отношения. Список решений может быть связан со списком услуг «услуги для решений». Ассоциативные отношения — это отношения «см. также», которые можно увидеть в указателе в конце книги. Создание онтологий влечет за собой отображение этих отношений.

Расширение промышленного примера открывает дополнительные возможности. Понимание отрасли клиента может помочь расставить приоритеты в определенных категориях. Понимание роли покупателя и его интересов дополнительно влияет на рекомендации по продукту. Рекомендации могут касаться конкретных процессов, работы в конкретной среде, необходимости выполнения конкретных задач и т. д.

Онтология — это структура или основа для знаний, контента и данных. Когда эта структура накладывается поверх источников данных, результатом является граф знаний.

На этом рисунке несколько объектов были призваны показать, как их можно использовать для улучшения рекомендаций по продукту.

Представьте себе пользователя, который ищет фразу «зачистка пресс-формы» на веб-сайте промышленного дистрибьютора.

  • Если бы пользователь работал в компании, занимающейся литьем под давлением, его, скорее всего, заинтересуют расходные материалы, необходимые для разборки литьевой формы.
  • Если бы пользователь работал в девелоперской компании, он, скорее всего, искал бы способы удаления плесени и грибка с поверхности.

Понимание интересов, роли, процессов или отрасли предоставит сигналы, необходимые для предоставления подходящих продуктов для этого пользователя.

Таксономии, онтологии и графы знаний

Таксономии: официальная терминология, описывающая продукты, услуги, решения, клиентов, документы, отделы, рынки и т. д. — все концепции, важные для бизнеса.

Онтологии: все таксономии, описывающие мир организации; т.е. область знаний и отношения между ними. Для наук о жизни эта область может включать болезни, показания, лекарства, мишени лекарств, механизм действия и многое другое.

Отношения могут включать в себя «показания к заболеванию», «мишени для механизма действия лекарств» и т. д.

Для страховой компании домен будет включать типы полисов, классы охваченных предприятий, риски и регионы деятельности с такими связями, как «риски». в регионе», «тип полиса для класса бизнеса» и т. д.

Граф знаний: онтология в сочетании с организационными данными. Граф знаний представляет отношения между сущностями. Вместо анализа количественных данных или других структурированных данных, как это делает традиционная реляционная база данных, графовая база данных фокусируется на связях и представляет их в визуализированной форме.

Поэтому становятся очевидными связи между людьми, местами, событиями или другими сущностями. Поскольку в базе данных графов хранятся данные о взаимосвязях, анализ выполняется намного быстрее, чем при традиционном анализе, который обычно требует написания запросов к нескольким базам данных для выявления этих взаимосвязей.

Ваша точка зрения

Теперь мы спрашиваем: «Ну и что?» – Именно здесь застревают многие проекты графов знаний. Это отличный способ получить доступ к данным и контенту, но как они приносят измеримую ценность для организации?

Трудно определить твердую рентабельность инвестиций в проблемы и проекты, связанные с данными и инфраструктурой. Одна организация, с которой я разговаривал, недавно потратила 500 тысяч долларов на работу с графом знаний с фирмой, оказывающей услуги (не моей фирмой), и когда я спросил о рентабельности инвестиций, руководитель программы сказал: «Окупаемости инвестиций нет — нам просто нужно было начать». Что ж, я бы предположил, что всегда должно быть экономическое обоснование и рентабельность инвестиций, даже при изучении новой технологии.

В некоторых случаях организации будут изучать новые инструменты без окупаемости инвестиций — это часть исследований и изысканий, необходимых для поиска новых подходов и возможностей. Однако у них должен быть вариант использования, оправдывающий экспериментирование. «Оправдание» может служить оправданием для инвестиций, которые могут принести дополнительную отдачу в других областях.

Сбор данных о клиентах –идентифицирующий граф

Графы знаний можно использовать для сопоставления информации о взаимодействии с клиентами в разных точках взаимодействия, а затем эти данные можно использовать для улучшения взаимодействия с пользователем.

Многие организации начинают разрабатывать свои собственные программы обработки данных, которые позволяют собирать данные и профильную информацию в результате взаимодействия между каналами, устройствами и точками взаимодействия. Данные, полученные в результате этих взаимодействий, становятся входными данными для графа знаний для взаимодействия с клиентами. Это также называется графом идентичности.

Одним из преимуществ графа знаний является его способность сопоставлять вместе разрозненные источники и структуры данных. Выполнение этого с помощью графа идентичности с использованием платформы данных о клиентах (CDP) или другой платформы графических данных позволяет получить 360-градусное представление о взаимодействии с клиентами и возможность действовать в соответствии с «цифровым языком тела» клиента.

Рассмотрим преимущества такой консолидации сигналов:

  • Более глубокое понимание всех взаимоотношений, когда несколько подразделений или бизнес-подразделений продают или обслуживают одного и того же клиента.
  • Возможность перекрестных и дополнительных продаж на основе прошлых покупок клиентов, установленной среды и взаимодействия со службой поддержки клиентов.
  • Улучшенная персонализация и рекомендации по продуктам
  • Повышение эффективности программ клиентской аналитики.

Версия графа знаний клиента, представляющая собой граф знаний, по сути, является моделью атрибутов клиента. Он предоставляет информацию о клиентах, такую как типы контента, продукты, темы и процессы, которые их больше всего интересуют, а также предыдущие покупки и то, как они взаимодействовали с организациями продаж, обслуживания или поддержки. Эти данные обычно собираются в CDP и позволяют в режиме реального времени отслеживать цифровой язык тела клиента. Короче говоря, это подсказки и детали, которые они оставляют после себя, взаимодействуя с различными частями организации.

Графы знаний поддерживают цифровые преобразования

Графы знаний имеют множество применений на предприятии. Помимо персонализации, их можно использовать для каталогизации источников структурированных данных, предоставления механизмов для интеграции разрозненных типов информации и обеспечения методов доступа, которые контекстуализируют данные («что произошло») с содержанием и знаниями («почему это произошло»).

Графы знаний также могут документировать происхождение данных, качество данных, разрешенное использование, право собственности, права и управление, а также процессы управления изменениями. Они позволяют демократизировать данные, улучшая прозрачность данных, а также обеспечивая соответствующий доступ, не ставя под угрозу политику данных.

Использование диаграмм знаний для каталогизации данных и управления доступом к ним также улучшает прозрачность корпоративных данных, что позволяет большему количеству заинтересованных сторон использовать эти данные для поддержки бизнес-императивов.

Корпоративный граф знаний обеспечивает целостную и многоролевую метамодель или контекстную модель для любой части или всей миссии или функции.

По сути, он обеспечивает расширенный подход к объединению организационных данных, цепочек создания стоимости/цепочек поставок и экологических данных, информации, знаний, обучения, осведомленности, поддержки принятия решений (полный спектр аналитики) и операционной мудрости в расширенной форме CMDB для предоставления глубокого и актуального руководства и поддержки в операционной деятельности.

Конечно, графы знаний не являются панацеей, они по-прежнему требуют блокирования и применения передовых методов управления данными и надлежащей гигиены данных. Они являются инструментом в корпоративном наборе инструментов, который поддерживает многие цели программ цифровой трансформации.

Цифровые преобразования по сути являются преобразованиями данных. Создание и поддержка корпоративной онтологии и графа знаний обеспечивает основу данных, от которой зависит успех трансформации.

Источник

Курирование и адаптация: Онтограф

Графы знаний Онтологии Таксономии Цифровая трансформация