June 15, 2022

Реестр цифровых кейсов Счетной палаты пополнился десятью новыми позициями

Реестр цифровых кейсов Счетной палаты, который уже почти два года ведет Департамент цифровой трансформации, пополнился десятью новыми позициями.

Данный реестр включает в себя краткие описания цифровых проектов, реализованных направлениями аудита с использованием инструментов дата-аналитики, визуализации данных, текстового анализа, искусственного интеллекта, их презентации, ссылки на демонстрационные материалы, техническую информацию. Из 59 кейсов, содержащихся сейчас в реестре, 10 — новые. Они были реализованы в первом полугодии 2022 г.

Над новыми цифровыми кейсами департаменты направлений работали вместе с сотрудниками Федерального казенного учреждения «Центр экспертно-аналитических и информационных технологий Счетной палаты Российской Федерации» (ФКУ «ЦЭАИТ СП»). При реализации новых кейсов были использованы не только возможности аналитической платформы PolyAnalyst, но и ряд специальных инструментов, — прежде всего, интерактивная среда для работы с блокнотами, кодом и данными JupyterLab и средство разметки данных Label Studio.

О полезных возможностях этих инструментов Департамент цифровой трансформации расскажет в следующем выпуске «Цифровых проектов».

Кратко о новых цифровых кейсах Счетной палаты, которые были реализованы в первом полугодии 2022 г., и их типологии рассказал главный специалист ФКУ «ЦЭАИТ СП» Роман Некрасов:

— Цифровые кейсы нынешнего полугодия довольно отчетливо разделились на следующие три категории.

Первая, самая многочисленная — кейсы, связанные с консолидацией и обработкой структурированных данных. Визуализация, группировка, коэффициентный анализ, построение карт и т. п. — все то, что, в принципе, можно делать с помощью классических инструментов работы с электронными таблицами, типа Microsoft Excel. Использование PolyAnalyst для решения этих задач на порядок облегчает и ускоряет работу, дает новые пространства свободы и возможностей.

Вторая категория цифровых кейсов — все, что связано с исследованием текстов, текстовой аналитикой. Семантический анализ и автоматизированная обработка текстовых данных — это та область дата-аналитики, которая как будто специально создавалась для решения актуальных задач Счетной палаты. Теперь она стала доступна для применения в повседневной практике инспектором любого направления. Ко второй категории относятся кейсы автоматизированной обработки сотен и тысяч офисных документов, из которых извлекаются либо многочисленные показатели в табличном виде, либо определенный текст. Например, из формы в файле Word извлекались данные о деятельности медицинских организаций, из pdf-файла – критерии эффективности высших органов аудита. Выполнение такой работы вручную потребовало бы больших затрат труда и времени. Аналитические инструменты экономят для инспекций сотни человеко-часов, к тому же снижают вероятность ошибок.

И наконец, третья категория — кейсы, где, наряду с привычным уже PolyAnalyst, сотрудники Счетной палаты начинают использовать дополнительные специальные инструменты для работы с данными. Такие, как JupyterLab, Label Studio, нейронные сети. Речь уже идет, без преувеличения, о том, что сейчас принято называть искусственным интеллектом. В кейсах третьей категории компьютер учится «понимать» тексты нормативно-правовых актов и финансовых документов, распознавать смысл слов и предложений с учетом контекста. Это позволяет повышать точность классификации документов, искать близкие по смыслу показатели, распознавать аудиторские сущности (например, разные наименования одних и тех же мероприятий) и сравнивать их друг с другом. Кейсов третьей категории у нас пока немного, поскольку это, своего рода, высшая лига дата-аналитики. Но к концу года мы сможем рассказать еще о двух-трех подобных кейсах.

Особо хочу подчеркнуть, что, по мере овладения новыми инструментами, инспекторы при осуществлении дата-аналитических подходов все меньше нуждаются в участии IT-специалистов. Большинство новых кейсов были реализованы при очень небольшой нашей помощи. В основном, сотрудники направлений аудита делают уже почти все самостоятельно.

В таблице ниже представлены новые кейсы, внесенные в Реестр цифровых кейсов Счетной палаты в течение первого полугодия 2022 года. Подробные рассказы о них — в дальнейших выпусках «Цифровых проектов».

С текущей версией Реестра цифровых кейсов можно ознакомиться в Системе управления знаниями (СУЗ) Цифровой платформы Счетной палаты по ссылке:
https://wiki.ach.gov.ru/pages/viewpage.action?pageId=44630056
(Для доступа в СУЗ с удаленного компьютера должно быть запущено клиентское приложение для защищенного доступа в корпоративную сеть «Континент АП»).

Скачать Реестр в виде Excel-файла можно из Облака Счетной палаты по ссылке:
https://cloud.ach.gov.ru/s/XqXdzjoqMnSr4MQ.