August 19, 2020

ЧТО ТАКОЕ BIG DATA И КАК ЭТУ ТЕХНОЛОГИЮ ИСПОЛЬЗУЮТ?

В онлайн-мероприятии участвовало 50 функциональных экспертов из 8 компаний:

Тема обсуждения - текущие проекты Big Data в компаниях и поиск решений по ключевым вызовам, стоящим перед направлением интеллектуального анализа данных в казахстанских компаниях: единый подход, вовлечение бизнеса, выбор технологий, развитие экспертизы.

Представители крупнейших компаний страны поделились своим опытом внедрения аналитики и рассказали об успехах. Нужны ли вообще бизнесу «большие данные» и какие они приносят выгоды? Как выстроить бизнес-процесс? Какие технологии использовать? Где найти кадры? Мы прослушали все сессии круглого стола и выбрали самое важное для вас.

Как используют аналитику данных?

Казахстанские компании, включая группу Фонда «Самрук-Қазына», работают над собственными Big Data проектами. О них на круглом столе рассказали представители «КазМунайГаза», «Самрук-Энерго», «Казахтелекома» и Kceлл.

ABAI и нефть

В «КазМунайГаз» продолжается работа над системой ABAI, или Advanced base Artificial intelligence. Проект, по словам руководителя Ильи Васильева, призван связать технологии Big Data с применением ИИ для проведения анализа и решения текущих проблем активов КМГ.

Сейчас проект ABAI находится на стадии разработки в «КМГ Инжиниринг». промышленную версию планируют запустить уже в 2021 году. Система является полностью отечественной и разрабатывается силами специалистов этого института и состоит из трех направлений:

  • аналитика и искусственный интеллект;
  • центр визуализации;
  • интеллектуальное месторождение.

Все они будут связаны между собой, чтобы проект мог обеспечить для компании:

  • рост операционной эффективности за счет сокращения времени принятия управленческих решений и применения современных аналитических систем в бизнес-процессах;
  • мгновенную агрегацию и визуализацию любых данных блока добычи без применения дополнительного ПО;
  • обеспечение удаленного доступа для непрерывного управления производством.

«Венец» проекта, по словам Ильи Васильева, – это практическое применение данных из аналитических модулей на месторождениях.

«Датчики и данные сами по себе не формируют интеллектуальное месторождение. ABAI – это платформа, которая на основе данных поможет сформировать аналитику, визуализацию и готовые управленческие решения», – сказал руководитель проекта.

Аналитика для сокращения потерь электроэнергии

Проект «Автоматизированная система коммерческого учета электроэнергии» (АСКУЭ) с использованием «больших данных» развивают в АО «Самрук-Энерго» и внедряют в «Алатау Жарық Компаниясы» – электроэнергетическая компания по передаче и распределению электричества в Алматы и Алматинской области.

Проект направлен на выявление потерь электроэнергии в сетях, отметил руководитель офиса по цифровизации «Самрук-Энерго» Азамат Мажын. По его словам, такие потери бывают двух видов: техническими и коммерческими. И если от первых избавиться сложно ввиду технологических сложностей, то коммерческие можно снизить. В основном это нелегальные действия граждан, занимающихся хищением электричества.

Это большая проблема для отрасли, с которой борются компании по всему миру. К примеру, на юге России энергетики выявили свыше 153 миллионов кВт ч. неучтенного потребления электроэнергии за 2017 год.

Отслеживать реальное потребление электроэнергии можно с помощью счетчиков, которые передают показатели напрямую компании-поставщику энергии. Такие счетчики внедряют в Алматы с 2014 года.

Данные отправляются напрямую в базу АСКУЭ. По Алматы уже более 39% физлиц-потребителей и 29% юрлиц установили такие счетчики. Им не нужно передавать показания по телефону, как это делалось раньше. Количество обладателей новых счетчиков планируют постоянно наращивать.

Как работает система? С помощью анализа данных идет поиск «опасных моментов», ситуаций, когда потребление на трансформаторной подстанции и у потребителей не совпадает. При выявлении такого случая проводится более глубокий анализ в разрезе клиентов. Берутся исторические данные по потреблению и с помощью машинного обучения формируется прогноз потребления, который сравнивают с фактическими данными. Если разница большая, то к потребителю отправляют инспектора для проверки.

Сейчас систему продолжают тестировать и исследовать ее практическое применения.

Big Data как сервис «Казахтелекома»

Активно «большие данные» используются в телекоммуникационной отрасли. «Казахтелеком» сделал Big Data частью своих бизнес-процессов, например, по управлению оттоком клиентов или повышению удовлетворенности клиентов через предиктивную аналитику.

Идея комплексно заняться «большими данными» возникла в 2017 году. В том же году был сформирован бизнес-план, а его реализация началась в 2018-м.

«Исторически, когда мы думали о BigData, были поставлены несколько задач. В первую очередь, это сегмент B2C и B2B, есть естественный кейс удержания клиентов. Традиционная телефония имеет нисходящий тренд, традиционный интернет в сравнении с мобильным у нас идет немного «вниз». Поэтому мы серьезно работаем по удержанию клиентов», – отметил Куат Сандалов, директор департамента бизнес-решений и инфокоммуникаций «Казахтелекома»

Также используется «рекомендательная аналитика» в части предложений для пользователей. Чем больше параметров клиента есть в системе, тем точнее его можно сегментировать и тем более полезной может быть компания для клиента.

Основная задача в этом направлении – увеличить «lifetimevalue» и удовлетворенность клиента. Клиент должен получить именно тот продукт, который он хочет, за те деньги, которые он хочет за это заплатить.

В 2020 году один из акцентов сделан на предиктивные модели оттока. Клиентам с помощью аналитики предлагаются максимально интересные предложения в том или ином регионе, районе, доме.

«Казахтелеком» готов оказывать рынку услугу в части «больших данных». Например, компания может предложить «аналитику как сервис». Это означает использование данных традиционных и сотовых операторов для улучшения аналитики по передвижению граждан, размещению и планированию строительства разных объектов.

«Инфраструктура как сервис» – это предоставление вычислительных ресурсов и услуг по созданию Big Data кластера, а «консалтинг как сервис» – это содействие в планировании и разработке соответствующей документации.

Как в компаниях отвечают на ключевые вызовы Big Data?

В настоящее время казахстанские компании в секторе Big Data находятся на разном уровне зрелости и сталкиваются с различными вопросами на своем становлении. С чего начать и как достичь результатов, не погрязнув в постоянных итерациях, как вовлечь бизнес и какие технологии предпочесть, как решить кадровый дефицит экспертов? Об этом уже на параллельных сессиях из групп по 7-10 человек рассказали представители Офиса цифровой трансформации Фонда «Самрук-Казына», а также Казахтелеком и Kceлл.

Как вовлечь менеджмент в аналитику данных?

Одна из основных причин для внедрения систем с использование «больших данных» – это желание компании повысить свою эффективность, сократить расходы или нарастить прибыль, лучше используя свои ресурсы.

Бейбут Хасенов, директор Департамента по архитектуре данных и ИБ Офиса цифровой трансформации «Самрук-Казына», рассказал, с чем столкнулись эксперты в портфельных компаниях при внедрении проектов с Big Data:

Преодолеть эти сложности можно благодаря нескольким шагам. Первое – нужно найти конкретную бизнес-задачу, для достижения которой будут использоваться технологии аналитики данных.

Эту работу можно начать с диалога с бизнесом, чтобы собрать текущие проблемы и «болевые точки». Важно разговаривать с представителями бизнеса на одном языке. При выборе кейсов для решения следует опираться на данные, которые есть в системах и на проектах с максимально потенциальным эффектом.

Далее нужно привести данные в порядок. Сам факт наличия данных в системе вовсе не означает, что их можно использовать для решения поставленных задач. Нередко компании накапливают данные в течение многих лет, и они, скорее всего, не структурированы или неполны.

Третье. Сами данные лучше презентовать менеджменту в виде графиков, диаграмм либо другими способами визуализации. Это важно для быстрого его вовлечения и понимания выявленных решений. Таблицы использовать можно для погружения в детали, но только после визуализации графиками и диаграммами.

Также важно определить метрики проекта, достижение которых можно измерить и оцифровать.

Еще несколько шагов: это развитие экспертизы по данным (работать с ними без навыков будет невозможно); фокус на «быстрых победах» на начальном этапе (перед большими проектами лучше показать на небольших примерах, что данные вообще что-то меняют) и понимание, что все не так сложно, как кажется.

Развитие по указанным направлениям позволит прийти к Data Driven модели, которая использует данные максимально эффективно для нужд бизнеса. Но это требует следования определенным принципам: готовности вкладывать в это деньги и время, доверять данным, уметь их анализировать и принимать управленческие решения на их основе.

В этих основных шагах кроется секрет успешного внедрения Big Data в бизнесе.

Как выстроить работы по интеллектуальному анализу данных в компаниях?

Аналитику данных необходимо придерживаться четкой последовательности действий, чтобы не усложнять поиск оптимальных решений. Эту последовательность действий описывают такие методологии, как CRISP-DM:Cross Industry Standard Process of Data Mining. Среди методологий анализа данных первое место по популярности регулярно занимает именно CRISP-DM. Ее применение обсуждалось на данной сессии.

Серик Жанабеков, главный менеджер по анализу данных Департамента по архитектуре данных и ИБ Офиса цифровой трансформации Фонда «Самрук-Казына» отметил, что одним из важнейших свойств методологии является старт от бизнес-проблем, чтобы вовлечь бизнес компании. Это позволяет менеджменту компании воспринимать интеллектуальный анализ данных не как обособленные эксперименты "айтишников", а как нужный полноценный бизнес-процесс компании, требующий их внимания.

Другой особенностью CRISP-DM является детальное документирование каждого шага, что позволяет менеджменту лучше понимать суть проекта, а аналитикам – больше влиять на принятие решений. Ведь зачастую многие аналитики не документируют промежуточные результаты и возникают трудности по пониманию работ между аналитиками, не говоря уже о менеджменте компании.

Методология допускает различные варианты согласно специфики работ. Есть возможность итеративно откатываться на предыдущие шаги, пропускать нерелевантные шаги.

Каждый из этих этапов в свою очередь делится на задачи. На выходе каждой задачи должен получаться определенный результат.

Важно создать синергию. Основа этого направления – применения единого подхода к внедрению проектов во всех портфельных компаниях Фонда.

У компании «Казатомпром» есть несколько инициатив, связанных с геологоразведкой и добычей урана.

«Основная сложность, с которой мы сталкиваемся, по моему мнению, – это принятие новых технологий и терминов производством. У «Казатомпрома» специфичный бизнес, и сложность – это разговор на «одном языке» с бизнесом при внедрении аналитики данных в промышленности», – говорит Мирас Аусат из департамента цифровой трансформации «Казатомпром» .

Светлана Чухарева из команды Big Data компании «Казахтелеком» рассказала, что, помимо выстраивания бизнес-процессов с использованием аналитики данных, важной задачей остается формирование правильных ожиданий у бизнеса от аналитических кейсов.

«У нас в целом не такой большой отрыв, потому что люди в телеком-отрасли больше знакомы с технологиями, чем производственники. Но проблема в ожиданиях – бизнес хочет «космолет», но такого быстро не бывает», – отметила Светлана Чухарева.

Айбек Нуркадыр, директор по стратегическому развитию мобильного оператора Kcell рассказывает, что оператор много инвестировал в направление данных.

«Мы верим, что все сделанное для нашей компании применимо и интересно компаниям на рынке, потому что решения касаются всех департаментов. В первую очередь, это вопросы бизнеса, но есть и интересные кейсы по HR, техническим департаментам».

IT-архитектура в аналитике данных. Как ее правильно построить?

Самым главным вопросом сессии стала тема «Как определить, правильно ли построена IT-архитектура?» Однозначного ответа на него быть не может, отметил Мади Сакен, представитель компании Казахтелеком.

У каждой конкретной компании, в зависимости от бизнес-задач, которые она планирует решить с помощью аналитики данных будет уникальная IT-архитектура.

Архитектура Big Data в «Казахтелекоме» позволяет компании управлять оттоком клиентов, предсказывать, какие услуги могут быть им интересны и т.д.

Единого стандарта о начале внедрения «больших данных», нет. Мади Сакен отметил, что такое решение должно приниматься не только из-за того, что у компании «скопились» данные, а из ее общей готовности создавать необходимую инфраструктуру.

Глеб Стибло, архитектор Big Data решений в «Казахтелекоме», добавил, что нужно обращать внимание и на структурированность данных. От этого зависит, можно ли будет с ними работать.

Другой важный вопрос – это обеспеченность компании нужными ресурсами. Азамат Мажын, руководитель Офиса цифровизации «Самрук-Энерго», задался вопросом, насколько возможно своими силами, обучив имеющийся персонал, внедрять аналитику данных.

«Базово это зависит от целеполагания и необходимой скорости внедрения, как скоро компании нужно трансформироваться. Для телеком-рынка это очень важно, нужно удерживать клиента. Другой момент – это расходы на команду, их нужно тоже закладывать (во внедрение проектов. – Ред.). В теории все выполнимо. В «Казахтелекоме» есть подход, что нужно развивать внутренние компетенции, особенно в части дата-инжиниринга», - ответил Мади Сакен.

Как подобрать специалистов по анализу данных?

Big Data – относительно новая сфера, которая сейчас бурно развивается. Она связана, прежде всего, с умением работать с большими объемами информации, структурировать ее и использовать на пользу реальному бизнесу. Как выглядят адепты «больших данных»?

На примере Kcell:

  • Всего «большими данными» занимаются 26 человек. Это разные люди с разным образованием. Больше всего специалистов из МГУ и «Политеха», много сотрудников из КБТУ, СДУ, КазНУ и др. казахстанских и российских вузов.
  • Средний возраст – чуть меньше 30 лет. Мужчин больше, чем женщин. Пока в Казахстане в технических специальностях, в том числе и анализе данных, работает больше мужчин.
  • В Казахстане, когда тебе от 22 до 27 лет и опыт работы от 0 до 5 лет, то скорее всего, тебе интереснее заниматься данными. С большей вероятностью тебя возьмут на работу, связанную с анализом данных.

Одним из важных вопросов в отрасли остаются зарплаты. Для примера, в Kceлл, разброс зарплат достаточно большой в зависимости от уровня квалификаций.

На примере «Казатомпром»:

  • Напрямую занимаются «большими данными» всего 4 человека, каждый – по своему фронту работы.
  • На рынке «больших данных» постоянно встает вопрос: брать человека с навыками, но без производственного опыта, либо брать производственника, который знает компанию и ее «дух».
  • «Казатомпром» – это не IT-компания, которая предоставляет услуги рынку, а производственная группа. Один человек в подразделении Big Data занимается архитектурой данных – он много лет проработал в структуре компании, прошел внедрение SAP. Почему именно он? Он понимает, откуда берутся данные и как они потом используются.

В «Казатомпроме», учитывая специфику бизнеса, не так много ресурсов для хантинга высококвалифицированных специалистов. Число штатных единиц ограничено, и потому по части создания условий для специалистов была выбрана «золота середина».

Резюме

В условиях цифровой трансформации аналитика данных становится одним из тех инструментов, которые помогут реально изменить бизнес-процессы и улучшить управление ресурсами компании.

Поможет внедрению подобных инструментов активный обмен опытом и внедрение единых стандартов для реализации проектов по аналитике.

А в вашей компании занимаются управлением данными? Оставьте ваш ответ в комментариях ниже.