Power BI
June 20, 2019

Сравнительный анализ SAP Analytics Cloud и Power BI (из рабочего)

С точки зрения ВИЗУАЛЬНОЙ привлекательности, могу сказать, что Power BI выглядит более интересно, чем SAP AC.
Это выражается в целой совокупности деталей различной степени сложности:
- графики, диаграммы и прочие визуальные элементы более живые и динамичные.
- визуальные элементы взаимозависимы, при выделении значений на одних графиках/диаграммах, происходит фильтрация/выделение на других. В SAP BI это тоже возможно, но это настраивается специальным образом, действиями средней степени сложности, тогда как в PBI это по умолчанию уже настроено и включено.
- при наведение мыши на график, происходит подсвечивание точки на графике, при этом точка перемещается следом за курсором мыши, и показывается всплывающее значение
- при наведение мыши на график может показываться всплывающий отчет-детализация, относящийся к конкретно данной точке графика. В SAP BI такого нет.
- в PBI большое количество встроенных визуализаций, и большое количество дополнительных визуализаций, скачиваемых из магазина, и разработанных сторонними компаниями.

С точки зрения РАЗРАБОТКИ, также могу сказать, что PBI также проще, удобней и приятней.
В качестве отличительных моментов, по моему мнению, может выступать следующее:
- интуитивная понятность интерфейса, плюс PBI наследует принципы сводных таблиц Excel, знакомых большинству пользователей. SAP AC по моим ощущениям более тяжеловесен, и хотя и обладает множеством настроек, чтобы добиться такого же визуального качества, как в PBI, необходимо приложить значительные усилия, производя все эти настройки, и результат все равно может не соответствовать.
- многие сложные вещи в PBI делаются очень просто, к примеру: взаимная фильтрация визуальных элементов, всплывающие отчеты, проваливание в другие отчеты.
- разработка в PBI происходит в отдельном десктопном приложении, а не в окне браузера, как в SAP AC, что обуславливает гораздо большую скорость работы в PBI и независимость от стабильности работы самого браузера, его версий.
- формулы вычисления очень похожи на формулы Excel, что позволяет довольно легко освоить их пользователям. Да, как только требуются нетривиальные вычисления, навроде Like-for-Like мер или TopN+Other, сложность формулы возрастает, но если понять механизм вычислений, увидеть готовое решение, то уже не так сложно. Тем более, что постоянно добавляют новые функции, которые реализуют целый блок вычислений, упрощая таким образом работу.

Дополнительно могу добавить, что
- в PBI очень богатый выбор разных дополнительных инструментов, возможность писать визуализации на Python, коннекторы к различным источникам на Python, производить анализ с помощью R
- в PBI очень подробный и глубокий road-map / дорожная карта развития, что отдельно отмечено Gartner, система активно развивается и стремится реализовать все, что только можно, при этом не теряя в простоте и понятности.
- в PBI возможно встраивание в бизнес-приложения, в частности в Directum.
- PBI доступен для развертывания on-Premise, т.е. локально на наших серверах, - бесплатно, и без ограничений по количеству пользователей. Это возможно благодаря подписке SQL Server Enterpraise Edition Software Assurance, в которую он входит. Для развертывания на облачном сервисе необходимо приобретение лицензий на пользователей, по цене 10$/чел/мес, самая низкая цена на рынке. Преимущества облачного развертывания перед on-Premise, вся новая функционально реализуется в локальной версии с задержкой примерно в полгода, и некоторых продвинутых функций там нет.
- в AC, в качестве сильной стороны платформы, консультанты нам продемонстрировали возможности анализа посредством моделей машинного обучения, а также возможности поиска зависимостей в данных и автоматического построения специальных отчетов по выявленным зависимостям. Пока неясно насколько это нам нужно, но если станет нужно, то в PBI это тоже есть, правда для использования функционала машинного обучения необходимо подключать облако, локально это недоступно (возможно, что пока). Построение отчетов по выявленным зависимостям в PBI также есть.

Кроме того, необходимо отметить, что в отрасли BI весьма знаковым и определяющим является ежегодное исследование BI систем, проводимое Gartner: "Magic Quadrant for Analytics and Business Intelligence Platforms".
И PBI отмечен как лидер среди средств BI в исследовании Gartner, лидерство было захвачено в 2016-17м годах и с тех пор упрачивается с каждым годом.
https://cadran-analytics.nl/wp-content/uploads/2019/02/2019-Gartner-Magic-Quadrant-for-Analytics-and-Business-Intelligence-Platforms.pdf
Анализ строится как раз по двум вышеописанным показателям:
- Ability to execute - функциональность BI системы (больше-лучше)
- Completeness of vision - понимание требований рынка, бизнес-модель, сервис, инновационность, разработка/воплощение новых технологий и тп (больше-лучше)
Так вот, лидеры выстроились так, показатели Ability to execute / Completeness of vision:
Квадрант лидеров:
1. PBI 90 / 76
2. Tableau 68 / 70
3. Qlik 72 / 54
4. ThoughSpot 69 / 52
Квадрант "провидцев"
1-4 : SalesForce, Sisence, SAS, TIBCO Software
5. SAP 57 / 37
Как видно SAP уступает в 1,5 - 2 раза продукту Microsoft (Power BI).

SAP AC, как мне видится, неплохо себя покажет в связке с SAP ERP системой и СУБД SAP HANA, поскольку остальные системы BI взаимодействуют с SAP гораздо хуже.
Кроме того в SAP HANA, есть определенные сильные стороны, цитата из Wiki: "Архитектура HANA обеспечивает как высокоскоростную обработку транзакций, так и работу со сложными аналитическими запросами, совмещая решение этих задач в рамках единой платформы", т.е. хорошо исполняются и транзакционные запросы, и аналитические, как следствие можно строить модель данных прямо на базе исходной базы учетной системы, она там даже есть встроенная, и это теоретически позволит видеть real-time аналитику. Но в то же время, если все же запрос будет слишком тяжелым, то сами же консультанты признают, что необходимо искать способы оптимизации: использовать Calculations views. либо делать некое хранилище, на базе самой же HANA, и для этого есть спец. механизмы в этой СУБД для регулярного инкрементного обновления.
Но, в то же время, отзывы в интернете очень противоречивы, несмотря на то, что в системе вроде бы многое встроено, по факту немало приходится разрабатывать добавлять в систему, в том числе в области хранения данных для целей аналитики. Разработка же ведется на языке платформы SAP, с помощью специально обученных людей. Как пример, вот здесь можно прочитать про нагрузочное тестирование in-memory систем, в том числе SAP HANA, произведенное специалистами Tinkoff : https://habr.com/ru/company/tinkoff/blog/310620/ , и вот что пишут: "Основную часть по настройке серверов и оптимизации запросов произвели коллеги из одной консалтинговых компаний, являющихся представителями SAP в России. Без них посмотреть на базу и оценить ее преимущества мы бы не смогли: как показала практика, для работы с HANA требуется наличие опыта.", при этом специалисты без проблем развернули все остальные базы, участвовавшие в тестировании.
Итого, по отзывам же: SAP ERP предполагает использование СУБД SAP HANA, SAP HANA, судя по отзывам же, предполагает использование SAP Analytics Cloud (ранее - Business Objects), поскольку подключиться к HANA из другой системы сильно проблематично (хотя и можно, необходимо отдельно приобретать и разворачивать специальный hub). SAP Analytics Cloud же, без SAP HANA, хоть и не пр��дполагает знание языка разработки платформы SAP, все же сильно уступает по части возможностей лидерам рынка, и установка его как отдельного средства BI не сильно распространена.

Дополнительно, небольшая выжимка из заключения Gartner:

SAP AC:

- Большинство компаний, использующих SAP AC, используют также и другие бизнес-продукты SAP
- Пользователи отмечают значительный рост возможностей продукта, SAP фокусируется и старается развивать BI функционал

Сильные стороны :
- облачная, гибридная платформа, с сильным аналитическим функционалом: Smart-insights - функции на базе машинного обучения для исследования данных; SAP Analytics Hub - "мост" между облаком и локальной системой, представляющий единый портал для доступа к аналитике. Введение данного функционала значительно повлияло на отзывы референсных пользователей, и подняло их оценку и ожидания от платформы.
- единая платформа для для аналитики, планирования и прогнозирования(предсказательные возможности). SAP - один из 2х продуктов в обзоре, который обладает подобным. Плюс есть SAP Digital
Boardroom (отдельный доп. продукт) позволяет делать анализ "что-если" и разные симуляции (сценарный анализ?).
- встроенный набор аналитики: бизнес-ориентированность продуктов SAP предполагает наличие библиотек преднастроенного аналитического контента, для широкого диапазона видов бизнесов, фунциональных направлений. В него входят: модели данных, визуализации, шаблоны, руководства.

Слабые стороны:
- Функциональные ограничения: несмотря на сильное улучшение пользовательского интерфейса и доступности, SAP AC до сих пор отстает по ряду направлений, в частности, в плане масштабируемости по размеру и сложности модели данных (об этом говорят большинство пользователей, и примерно треть из них пользователей столкнулись со сложностями при анализе больших данных) (прим. мое - по части загрузки в облако SAP больших данных я тоже слышал какие то проблемные отзывы, проблема там была при загрузке 25 млн строк, у нас же по продажам ритейлеров 235 млн строк на текущий момент и активно растет). Кроме того, возможности по части подключения к данным очень сильно ограничены источникам из линейки продуктов самого SAP, очень сильно ограничены возможности по встраиванию отчетов в другие приложения.
- Производительность и качество : референсные пользователи помещают SAP AC в нижней трети среди всех продуктов BI при оценке качественных характеристик. Производительность также проблема, 14% от всех пользователей отозвались, что испытывают весьма низкую производительность продукта, это второе по величине значение среди всех BI продуктов (прим мое. - при оценке по показателю "процент пользователей, жалующихся на низкую производительность"). Производительность - это главное ограничение SAP AC для его дальнейшего распространения и внедрения, по отзывам реф. пользователей. Также, реф. пользователи при оценке работы службы поддержки SAP, относят ее к нижней трети по уровню сред всех BI систем в обзоре.
- Привязка к облаку : большинство компаний сейчас рассматривают и используют облачные сервисы в качестве средств аналитики и обработки данных, но значительная часть - нет. Для этой части, SAP AC не является подходящим выбором, хотя он и может подключаться к локальным бизнес-приложениям SAP и к некоторым не-SAP источникам данных. У SAP есть альтернатива для локального развертывания аналитики - SAP Lumira - но она будет поддерживаться с 2024 года (здесь не оч. понял что имеется в виду, SAP Lumira вроде как есть уже). Судя по отзывам касательно SAP Lumira, оценки данного ПО весьма низкие и процент отказов от использования (переход на другое ПО) - наибольший. В итоге пользователи SAP бизнес-приложений, и испытывающие необходимость в локальном развертывании средств BI, в большинстве своем рассматривают внедрение сторонних продуктов.

Microsoft

Microsoft предлагает средство в подготовки данных, средство исследования данных, интерактивных дашбордов и расширенной аналитики в своем едином продукте - Power BI. Он доступен в облачном сервисе через подписку, и для локального развертывания с помощью Power BI Report Server (прим мое - его мы развернули, он доступен бесплатно в составе подписки на SQL Server EE SA, которая у нас есть).
Несмотря на то, что PBI изначально был создан как средство для самостоятельной аналитики (self-service BI), сейчас реф пользователи используют его для децентрализованной (61%) и централизованного, быстрого и гибкого BI (54%).
Microsoft - Лидер (прим мое, да, в отчете Gartner именно так, с большой буквы). Она обладает весьма комплексной и перспективной дорожной картой (мое прим. в отчете вместо "перспективной" использовано определение "visonary", оч. часто используется в отчете, переводится как возможность видеть, представлять, воображать дальнейшее развитие, тренды, запросы, тенденции развития чего либо), нацеленной на глобальное распространение и повсеместную доступность. В то же время, она продолжает демонстрировать высокую и глобальную ориентированность на потребности пользователей, обеспечивая высокий уровень удовлетворения ожиданий пользователей.

Сильные стороны
- Низкий уровень цен и высокие продажи : Microsoft значительно обрушила ценовое давление на рынок средств аналитики и BI благодаря ее низкой стоимости пользовательской лицензии и остальной ценовой политики. Благодаря тому, что у многих организаций уже есть подписка EE SA, то даже есть PBI еще не используется, он по умолчанию появляется в списке приоритетно рассматриваемых систем. Ценовая политики - это второй важнейший фактор выбора для реф. пользователей.
- Легкое применение сложных видов аналитики: Реф пользователи продолжают отзываться о PBI как о достаточно легком в применении средстве BI, верхняя треть рейтинга по данном показателю. "Вау"-эффект производимый "первыми 5ю минутами" использования и сильное пользовательское сообщество, приводят к такой высокой оценке.
PBI поддерживает как сложные модели данных, так и продвинутые аналитические средства. По сравнения с прошлым годом Microsoft переместилась в верхнюю треть рейтинга по части продвинутости аналитических средств.
- Комплексное и перспективное развитие : M. инвестирует в широкий набор перспективных технологий и интегрирует их с PBI. Инвестиции направляются в "дополненную аналитику" (augmented analytics, аналитика, дополняемая данными с помощью средств машинного обучения) и
AutoML функционал облака Azure. В облаке Azure становятся доступны средства ИИ: анализ текста, изображений, машинного обучения, и эти средства будут доступны с помощью PBI для использования людьми с минимальными познаниями в data-science. Также интегрируют такие важные вещи как поддержка регулярной регламентированной отчетности.

Слабые стороны
- Различие между между функционалом облачной и локальной версии : в локальной версии доступны не все возможности, можно обмениваться отчетами, но не дашбордами, отсутствие средств машинного обучения. Также реф пользователи отзываются, что коннекторы к данным поддерживаются и развиваются неравномерно, у некоторых есть проблемы. Также, в случае облачного развертывания существует жесткая привязка к облаку Azure, невозможно выбрать другое облако.
- Интеграция Mode 1 и Mode 2 аналитики (прим мое - Mode 1 - это классические средства регламентированного промышленного централизованного BI , типа Cognos и SQL Server Reporting Services, Mode 2 - средства самостоятельного BI, гибкой, децентрализованной аналитики) PBI в первую очередь ориентирован на Mode 2, локально разворачиваемый SQL Server Reporting Services - на Mode 1, и в итоге потребителям приходится разворачивать оба ПО, для реализации обоих подходов, разработка соответственно ведется в обоих средствах параллельно.
- Множество продуктов : Хотя ядром Power BI является соответствующий продукт, его дорожная карта подразумевает использование дополнительных продуктов. Так, для полноценного использования такого перспективного средства, как "разговорная/диалоговая" аналитика (мое прим - conversational analytics, когда система отвечает на запросы в виде естественной речи, и автоматически генерирует соответствующие показатели, графики и таблицы по устному запросу), необходимо использовать персонального цифрового ассистента Cortana, другой продукт Microsoft. Сквозная интеграция всех этих продуктов "под ключ" - приоритет развития для Microsoft.