Arenadata - обзор бизнеса и сравнение с IT сектором
В 2024 году Arenadata, одной из немногих, удалось успешно пройти непростой период и нарастить выручку, темпами, достойными IT сектора (+52% г/г). Разберём подробнее, чем компания занимается и где востребованы её продукты. Ну и, конечно же, посмотрим на неё глазами инвестора.
Внимание, это лонгрид! Как раз за выходные с нескольких (возможно) попыток, все-таки получится разобраться, во что же мы такое инвестируем, покупая акции Аренадаты ;)
Как всегда, большая благодарность нашему подписчику Андрею (An/Sh), без него такой глубокий и проработанный материал бы не получился.
Область IT
В случае с Arenadata мы попадаем в область системного (как сама компания пишет) или инфраструктурного (как теперь модно выражаться) программного обеспечения (далее ПО). Инфраструктура предполагает некоторый базис, на основе которого функционирует что-то ещё. Инфраструктурное ПО ставится на "железо" первым: средства виртуализации, операционные системы, логическое управления сетями, базы данных. Только после этого разворачиваются рабочие приложения, выполняющие некую логику. Последнее в нашем списке - базы данных (далее БД), это и есть то, чем занимается Arenadata. Востребованность баз данных постоянно растёт, в связи с тем, что постоянно растут объёмы генерируемой и хранимой в мире информации. Да что там в мире, уже и в России.
Но нельзя просто складывать информацию на диск в виде большого числа файлов, поскольку информацию периодически требуется обрабатывать: искать, что-то добавлять, что-то редактировать и удалять. В случае с файлами, поиск и обработка будет происходить достаточно медленно. Для ускорения поиска, сокращения времени доступа и обработки, инженерам приходится ухищряться, придумывать оптимальные способы размещения информации на носителе, алгоритмы обработки информации, индексацию (пометку), кеширование и другие механизмы. Поэтому, более правильное название программного обеспечения данного класса, не базы данных, а системы управления базами данных (СУБД). Только с продуманной логикой управления информацией (системой управления) получится быстрая обработка этой самой информации.
Но чаще говорят БД, имея в виду, конечно же, СУБД. Мы так же вперемешку будем использовать и то и другое, подразумевая СУБД. Так вот, конёк Arenadata - это аналитические базы данных.
Мы ещё вернёмся к этому термину - аналитические БД, а пока ещё немного общей информации.
Почти все продукты компании сделаны не с нуля, а на основе open-source продуктов. Перечислим их:
- Picodata - собственная разработка дочерней компании;
- Arenadata Postgres - сделана на базе открытой PostgreSQL;
- Arenadata DB - сделана на базе открытых Greenplum / Greengage;
- Arenadata QuickMarts - сделана на базе открытой ClickHouse;
- Arenadata Hadoop – сделана на базе открытой экосистемы Hadoop;
- Arenadata Streaming - сделана на базе открытых Apache Kafka и Apache NiFi.
За каждым open-source проектом обычно стоит некая якорная компания. Например, ClickHouse детище Яндекса (сейчас этот открытый проект под эгидой самостоятельной компании ClickHouse Inc), Apache Kafka и Apache NiFi соответственно поддерживаются компанией Apache. Флагманское ПО Arenadata DB (ADB) построено на базе проекта с открытым исходным кодом Greenplum. В мае 2024 этот проект под эгидой Broadcom стал закрытым, но Arenadata,уже под своей эгидой, запустила open-source аналог - Greengage.
Получается, что идея создания ПО на основе уже имеющегося, хорошо себя зарекомендовала, особенно, если мы вспомним презентацию Astra, где две компании с такой моделью разработки имеют наилучшие результаты:
Действительно, Astra Linux сделан на базе Debian, а Arenadata DB на базе Greenplum. Если открытое ПО отлично решает поставленную задачу, то почему бы его не взять за основу. Внедрение и доработка ускоряются, к тому же, обеспечивается широкая совместимость. На Astra Linux будут работать многочисленные программы, написанные для Debian (а их намного больше, чем собственных), а если кто-то написал программы для работы с аналитической базой данных Greenplum, то их можно легко состыковать с Arenadata DB. Этакая гибкость или даже международная конверсия, назовём это так. В течении полугода-года Arenadata в состоянии перевести заказчика с зарубежного решения на собственный продукт.
Продуктовая линейка
Ну что же, нам предстоит понять, что такое аналитические БД и какие ещё существуют БД. Пробежимся по теории, и заодно разберём основные продукты Arenadata.
1. OLTP
Область IT под названием базы данных, делится на сегменты или типы. Каждый тип баз данных предназначен для решения своих задач. Самое крупное деление - это деление на транзакционные базы данных - OLTP и аналитические базы данных - OLAP. Запоминайте по 3 букве: T - Transaction, во втором термине будет буква A - Analytical.
Транзакционная БД (OLTP, Online Transaction Processing) - система обработки транзакций в реальном времени. Это способ организации работы с базами данных, который позволяет обрабатывать большое количество небольших операций (транзакций) в режиме реального времени и при этом обеспечивать мгновенный отклик для пользователя.
OLTP, по сути, классические базы данных, с которыми человечество имело дело, начиная с 1970 года, когда впервые была сформулирована реляционная модель данных. Транзакционная БД состоит из таблиц (вроде книг Excel) со связями между ними, и подходит под широкий круг задач.
Например, если мы хотим сделать интернет-магазин с каталогом товаров, возможностью для посетителя положить товары в корзину, сформировать и оплатить заказ, то транзакционная БД, вроде MySQL, PostgreSQL или Microsoft SQL нас вполне устроит. Задача таких баз: хранить таблицы с различной структурированной информацией, позволять неспешное формирование новых записей и редактирование существующих записей (поступление новых товаров, изменение цен, скидки).
На этом поприще Arenadata представлена двумя продуктами:
Особенность Picodata в том, что содержимое БД полностью размещается в оперативной памяти, что позволяет быстрее обрабатывать информацию. Называется резидентная база данных, очень нужная штука в ряде случаев.
Представьте, что наше приложение - это навигатор. Необходимо быстро загружать информацию о местонахождении множества водителей (координаты), формировать информацию о заторах, образующихся на их пути следования и вовремя подсказывать моменты поворота. В абсолютном выражении, объёмы такой информации не велики, но их частота появления и необходимость быстрой обработки существенны. И наверняка, вам не понравится, когда программа попросит повернуть, уже после того, как вы проехали нужный поворот.
Ещё один продукт, Arenadata Postgres (ADPG), по сути, старый добрый транзакционный открытый PostgreSQL с доработками от компании.
Ещё, в этом сегменте, в портфолио компании появится купленный в этом году продукт «Proxima DB». Спросил у IR зачем покупка, вроде есть аналог. Ответ:
"Функционально наша СУБД Arenadata Postgres не дотягивала до уровня ближайших конкурентов, в том числе в части сертификации ФСТЭК и полной совместимости с 1С."
Ещё эта сделка оказалась интересной, поскольку в ней, в качестве продавца «Proxima DB», засветилась компания, известная в среде IT-шников - Orion soft или, строго говоря, ООО «ОРИОН». Примечательна она тем, что выпускает российское ПО для виртуализации zVirt - тоже инфраструктурное ПО и оно тоже сделано на базе открытого ПО - oVirt. Ну, теперь вы понимаете, какая модель разработки в России выбрана для создания, как минимум, инфраструктурного ПО )) Возможно, когда-нибудь, увидим Orion soft и на IPO. Группа Астра пытается составить ей конкуренцию с решением для виртуализации «Брест», но oVirt известен шире.
Завершаем тему с транзакционными БД (OLTP).Как уже отмечалось, классические транзакционные БД общего назначения, не основная специализация Arenadata. Малые объёмы инсталляций Picodata и Arenadata Postgres на картинке с объёмами инсталляций, тому подтверждение. Но компания, очевидно, наращивает присутствие в данном сегменте.
2. OLAP
Что же произойдёт, если в транзакционной БД мы попытаемся сформировать какой-то сложный отчёт, требующий обработки, например, 30% всей хранящейся информации, с увязкой множества разных таблиц. Это возможно, но время получения результата окажется неприемлемым. Для решения таких задач нужны БД другого класса.
Аналитическая БД (OLAP, Online Analytical Processing) — система, которая позволяет анализировать большие объёмы данных в режиме реального времени. Она предназначена для подготовки отчётов, построения прогностических сценариев и выполнения статистических расчётов на базе больших информационных массивов сложной структуры.
Рассмотрим применение OLAP на примере одного из потребителей продукции Arenadata - сектора ритейла. Предположим, что большая часть клиентов условной "Пятерочки" зарегистрированы в системе лояльности (если что, X5 Group и Магнит реальные клиенты Arenadata). В таком случае OLAP можно задать такие вопросы:
- Определи рентабельность каждой возрастной группы клиентов (как в процентах, так и в общей сумме) по категориям продуктов.
- Определи оптимальные объёмы и даты закупок молочной продукции у поставщиков по каждому региону.
Примеры условные, но как вы понимаете, что-то подобное, и многие другие вопросы, должны интересовать менеджмент, который стремится сделать свой бизнес максимально эффективным. На уровне БД, решение таких задач за приемлемое время, требует иной организации хранения информации, нежели в OLTP.
Arenadata QuickMarts (ADQM) позволяет готовить относительно несложные аналитические отчёты, но здесь задумка формировать подобные отчёты на регулярной основе. Это могут быть типовые запросы отдела продаж, маркетинга, кадров, бухгалтерская и финансовая аналитика. СУБД построена на базе ClickHouse, который своими корнями обязан Яндексу.
Arenadata DB (ADB) главный продукт компании, способный для ускорения подготовки аналитических отчётов распараллеливать обработку на несколько серверов. СУБД построена на упоминавшейся ранее и закрытой нынче СУБД Greenplum, а та в свою очередь была создана на базе PostgreSQL с применением массово‑параллельной архитектуры (MPP).
Как правило, возможности аналитической БД (OLAP) включают в себя возможности транзакционной БД (OLTP), и в целом, аналитические БД, являются следующей ступенью развития баз данных. Принципы их работы впервые были сформулированы в 1993 году.
В презентации компании, продукт Arenadata DB ещё назван корпоративным хранилищем данных. Действительно, на определённом этапе развития баз данных, была введена концепция Data Warehouse (DWH), кладовка данных - покрывающая все потребности в хранении данных предприятия, в том числе для решения аналитических бизнес-задач. И решения DWH определённое время оставались топовыми для бизнеса... пока не пришла эпоха Big Data.
3. Data Lake и Lakehouse
В решении Arenadata для машинного обучения и искусственного интеллекта Arenadata Hadoop (ADH) упоминаются два термина. Первый термин, Data Lake, озеро данных, был введён с появлением необходимости хранить большое количество неструктурированных данных. Это может быть маленький текст (пост) или большой текст (целый роман), картинки, аудио записи, видео записи, какой-то протокол и т.д. В общем, любой набор байтов, имеющий хоть какое-то смысловое значение. Неструктурированные данные - это то, с чем в дальнейшем предстоит работать системам машинного обучения и нейросетям. Сами посудите, как можно структурировать, например, роман "Война и мир"? Но у ИИ должен быть под рукой текст романа целиком, который он на просьбу пользователя: "Изложи в двух словах" препарирует на действующие лица, определит ключевые события, завязку, кульминацию, мораль и т.д.
Польза неструктурированных данных в том, что по мере развития систем обработки можно извлечь пользу из неочевидных на текущий момент источников информации. Постепенно, кроме неструктурированных данных, в Data Lake начали включать частично структурированные данные (например, ввели главы книг), и даже структурированные данные. Но в любом случае, данные в Data Lake не настолько структурированы, чтобы по ним проводить аналитику.
И вот тогда появляется понятие Data Lakehouse. Его ввели в противовес предыдущему Data Warehouse, которое, как вы помните, позволяло хранить все возможные данные предприятия в одной БД. Но в настоящее время сложно отделить аналитику и искусственный интеллект, проведение аналитики всё чаще происходит как раз с помощью ИИ. Получается, что современная топовая БД для предприятия должна хранить как неструктурированные данные, так и иметь область хранения структурированных данных. Такая гибридная база данных и обозначается Data Lakehouse. И такую гибридизацию поддерживает Arenadata Hadoop (ADH).
Термин Hadoop упоминаемый в названии продукта от Arenadata происходит от одноимённой технологии, разработка которой потребовалась при работе с большими данными (Big Data). Увеличение данных обычно приводит к пропорциональному увеличению дисков для хранения, процессоров и памяти для обработки. По сути, с приходом эпохи Big Data, встал вопрос о серьёзных материальных затратах на "железо". Тогда как изобретение распределённой файловой системы Hadoop (HDFS) позволило снизить эту гигантскую нагрузку на "железо" и уменьшить его количество. Сейчас Hadoop - это целая открытая экосистема, на которой и базируется решение компании.
4. ETL
Последний значимый продукт компании, Arenadata Streaming (ADS) - это и не база данных вовсе, а средство для скоростной передачи информации, которое встраивается в решения для мгновенного обмена сообщениями между корпоративными информационными системами и для передачи информации между разными типами баз данных. Например, если данные из транзакционной БД, понадобились для сбора статистики их можно "скопировать" в аналитическую БД. По сути, технология ETL обыгрывает 3 простых задачи: Extract (извлечение), Transform (преобразование), Load (загрузка).
На этом разбор продуктовой линейки закончим. В общей сложности у Arenadata 15 программных продуктов, но остальные решения нам разбирать нет смысла. Arenadata Catalog, Clean Data, MDM - это тоже не базы данных в чистом виде, а некие программные решения под узкоспециализированные задачи. Отметим ещё только облако.
5. Облако
Внутри облака всё то же самое, что мы обсудили. Если нагрузка на базу данных предполагается большой, то OLTP и OLAP решения от Arenadata можно развернуть на большом количестве своих или арендованных серверов. Облако более гибко задействует ресурсы, занимая и освобождая их по мере необходимости.
Макро
Посмотрим теперь, какую нишу Arenadata занимает внутри российского рынка баз данных. Далее слайды из аналитики "Центра стратегических разработок" (ЦСР).
Наиболее полное название: рынок систем управления и обработки данных (почти 90 млрд руб. по итогам 2024 года). Структурно он состоит из 4-х сегментов:
Arenadata представлена преимущественно в сегменте СУБД, к сегменту Data Governance (политика управления данными - категорирование информации, сколько хранить, кому дать доступ и т.п.) относится её продукт Arenadata Catalog. К сегменту средств загрузки данных относится Arenadata Streaming.
В свою очередь, наиболее крупный сегмент СУБД (51 млрд руб. по итогам 2024 года) делится на 4 части по типам баз данных. Это деление мы обсуждали в теоретической части:
С течением времени, ожидается, что доля СУБД общего назначения будет уменьшаться, а доля более "продвинутых" аналитических СУБД и СУБД Big Data будет расти. Растёт и востребованность резидентных "скоростных" баз данных.
По итогу, в исследовании ЦСР всё выглядит замечательно, российские разработчики молодцы, конъюнктура благоволит, график рынка баз данных растущий, увеличение рынка до 2031 года предполагается ежегодными темпами под 16%. Значит, и у Arenadata показатели выручки должны будут прирастать. Компания, как известно, ориентирует нас на ежегодное увеличение выручки темпами не ниже 40%, и последние три года это получалось.
Как вы думаете, компания поставляющая продукты для аналитики, способна качественно прогнозировать своё будущее? ))
Организационная структура
Общая численность сотрудников компании, по данным на конец 2024 года - 632 человека, 70% из них IT специалисты, 15% - коммерческий отдел, 15% - back office (кадровики, бухгалтеры, юристы). На конец 2025 года ожидается увеличение численности до 800 человек.
ПАО «Группа Аренадата» имеет 5 дочерних предприятий:
1. ООО «Аренадата Софтвер»
2. ООО «Клин Дейта»
3. ООО «Пикодата»
4. ООО «Датакаталог»
5. ООО «Тера Интегро»
Маленькие компании «Клин Дейта», «Пикодата» и «Датакаталог» выпускают одноимённые продукты Clean Data, Picodata и Arenadata Catalog. Ещё одна маленькая «Тера Интегро», как следует из названия, является системным интегратором и компанией, осуществляющей техническую поддержку. Также «Тера Интегро» проводит обучение. За прошедшее время, работе с программами Arenadata обучили более 4000 человек. Разработка основных программных продуктов сосредоточена в наиболее крупной «Аренадата Софтвер».
Как водится у IT компаний, активы Arenadata малы. Значительный размер дебиторской задолженности, по словам менеджмента, погашен в 1 квартале 2025 года.
Основные расходы компании - это ФОТ персонала, на это уходит примерно 50% выручки. Динамика роста ФОТ достаточно скромная, по сравнению с тем, что доводилось видеть. Темпы роста ниже инфляции, но в абсолютных значениях не мало.
Потребители продукции
Arenadata работает преимущественно с крупными клиентами B2B, B2G, частично со средним бизнесом, то есть там где накапливаются достаточно большие массивы информации и требуется сложная аналитическая экспертиза. Понемногу происходят инсталляции на малых предприятиях.
Есть давние клиенты, вроде X5 Group и Газпром нефть (сотрудничество с 2018, 2019 года), основной рост, естественно, произошёл в 2022 году.
На бирже
Размещение акций компании произошло по цене 95 рублей. Дата начала торгов - 1 октября 2024 года. Общее число акций - 218,321 млн штук.
Акция входит во второй котировальный список Мосбиржи с free-float 18% (доля акций в свободном обращении).
- POSI - free-float 24% (1 котировальный список);
- ASTR - free-float 15% (1 котировальный список);
- SOFL - free-float 16% (2 котировальный список);
- IVAT - free-float 11% (2 котировальный список);
- DIAS - free-float 7% (2 котировальный список).
Планы попадания в 1 котировальный список у компании имеются, по размеру free-float по нижней границе Arenadata проходит (для компаний, с капитализацией меньше 60 млрд. руб., доля free float рассчитывается по специальной формуле). Следующие требования касаются корпоративного управления – количества независимых членов совета директоров и комитетов.
Ещё, этим летом Московская биржа совместно с Банком России планирует запустить индекс создания стоимости российских компаний, он же индекс эталонных эмитентов акций. Для включения в этот индекс Arenadata не хватает кредитного рейтинга. Обычно он формируется для тех эмитентов, кто использует заёмные средства, но за все годы существования у Arenadata отрицательный чистый долг и необходимости в заёмном капитале не возникало. Получением кредитного рейтинга потребуется озаботиться отдельно.
По акции есть налоговая льгота. Как-то мы разбирали с вами Рынок инноваций и инвестиций (РИИ) (подробнее можно почитать по ссылке). Так вот, компания Arenadata входит в перечень РИИ, а это значит, что удерживая акцию 1 год и получив рост стоимости, можно продать её не уплачивая налог с дохода. Тоже самое касается почти всех остальных IT компаний, только почему-то Группы Астра не увидел в перечне.
Кейс Positive Technologies заставляет спрашивать у всех IT компаний насчёт допэмиссии. Спрашивали и у Arenadata. Не исключают, что на каком-то этапе допэмиссия понадобится, но в постоянном режиме как у Positive Technologies это происходить не будет.
Финансовые показатели и мультипликаторы
Пробежимся по основным метрикам.
У компании почти отсутствуют капитальные расходы, причём не только в 2024 году, но и во всех предыдущих.
Оценка
Arenadata продавала себя в прошлом году, на основе оценок 2023 года. С тех пор показатели почти не изменились, выросла выручка с прибылью, но и котировки подросли (для расчётов взял чистую прибыль, а не NIC, чтобы корректно сравнить с другими):
- P/S (2023) = 21 / 3,951 = 5,3; P/E (2023) = 21 / 1,46 = 14,4;
- P/S (2024) = 27 / 6,015 = 4,49; P/E (2024) = 27 / 1,94 = 13,9;
Интересно, что эпоха P/S под 10х и P/E под 25х (с такими ориентирами выходили POSI и ASTR) ушла в прошлое. За прошедшее время публичности, IT компании не очень впечатлили инвесторов и смотрят на них уже более приземлённо. Для сравнения (на середину июля 2025):
- ASTR - P/S = 79,8/17,2 = 4,6; P/E = 79,8/6 = 13,3;
- POSI - P/S = 101,5/24,5 = 4,1; P/E = 101,5/3,7 = 27,4;
- IVAT - P/S = 12,3/3,33 = 3,7; P/E = 12,3/1,9 = 6,5;
- DIAS - P/S = 27,5/10,1 = 2,7; P/E = 27,5/2,39 = 11,5;
- SOFL - P/S = 41/81 = 0,5; P/E = 41/2,6 = 15,8;
Между Astra и Arenadata различий почти нет, несмотря на лучший темп роста у Astra. Но она тоже как и Positive Technologies планирует играть в периодическое размытие и это не пошло ей на пользу.
Positive Technologies в этом году предстоит произвести работу над ошибками, выровнять свою доходную и расходную части. Здесь есть определённая интрига, если выручка всё-таки подрастёт до прогнозных значений, переоценка не заставит себя ждать. Компания, на мой взгляд, сильная, выглядит пока лучше рынка.
IVA в первый же год публичности решила не соблюдать дивидендную политику, хотя уже по отчёту было видно, что нужной суммы денег на счетах нет. В целом компания интересная и недорогая, тоже выглядит недооценённой. Но как сложатся дела дальше? Надо наблюдать.
Diasoft растёт темпами не выше ритейла, соответственно, оценён справедливо.
Чем занимается Softline, никто не понимает, поэтому по выручке дёшево. Прибыль куда-то испаряется, отсюда высокий P/E, дивиденды платить отказались.
По итогу, можно сказать, что Arenadata по сравнению с "коллегами" оценена справедливо. Пока что компания не "раздражает" инвесторов допэмиссиями и рассказами про фантастические иксы. Зато уверенно прирастает от года к году. Платит дивиденды, как водится у IT, они не большие, но дивидендная политика соблюдается. У бизнеса сохраняется положительная денежная позиция и ей делятся с инвесторами, выполняя свои обещания. Регулярные встречи и открытость тоже кладём в копилку инвестиционной привлекательности. При сохранении текущих темпов роста, акции компании могут стать неплохим выбором в среднесрочный и долгосрочный портфель, если вы рассматриваете истории роста.