Реестр цифровых кейсов Счетной палаты пополнился десятью новыми позициями
Реестр цифровых кейсов Счетной палаты, который уже почти два года ведет Департамент цифровой трансформации, пополнился десятью новыми позициями.
Данный реестр включает в себя краткие описания цифровых проектов, реализованных направлениями аудита с использованием инструментов дата-аналитики, визуализации данных, текстового анализа, искусственного интеллекта, их презентации, ссылки на демонстрационные материалы, техническую информацию. Из 59 кейсов, содержащихся сейчас в реестре, 10 — новые. Они были реализованы в первом полугодии 2022 г.
Над новыми цифровыми кейсами департаменты направлений работали вместе с сотрудниками Федерального казенного учреждения «Центр экспертно-аналитических и информационных технологий Счетной палаты Российской Федерации» (ФКУ «ЦЭАИТ СП»). При реализации новых кейсов были использованы не только возможности аналитической платформы PolyAnalyst, но и ряд специальных инструментов, — прежде всего, интерактивная среда для работы с блокнотами, кодом и данными JupyterLab и средство разметки данных Label Studio.
О полезных возможностях этих инструментов Департамент цифровой трансформации расскажет в следующем выпуске «Цифровых проектов».
Кратко о новых цифровых кейсах Счетной палаты, которые были реализованы в первом полугодии 2022 г., и их типологии рассказал главный специалист ФКУ «ЦЭАИТ СП» Роман Некрасов:
— Цифровые кейсы нынешнего полугодия довольно отчетливо разделились на следующие три категории.
Первая, самая многочисленная — кейсы, связанные с консолидацией и обработкой структурированных данных. Визуализация, группировка, коэффициентный анализ, построение карт и т. п. — все то, что, в принципе, можно делать с помощью классических инструментов работы с электронными таблицами, типа Microsoft Excel. Использование PolyAnalyst для решения этих задач на порядок облегчает и ускоряет работу, дает новые пространства свободы и возможностей.
Вторая категория цифровых кейсов — все, что связано с исследованием текстов, текстовой аналитикой. Семантический анализ и автоматизированная обработка текстовых данных — это та область дата-аналитики, которая как будто специально создавалась для решения актуальных задач Счетной палаты. Теперь она стала доступна для применения в повседневной практике инспектором любого направления. Ко второй категории относятся кейсы автоматизированной обработки сотен и тысяч офисных документов, из которых извлекаются либо многочисленные показатели в табличном виде, либо определенный текст. Например, из формы в файле Word извлекались данные о деятельности медицинских организаций, из pdf-файла – критерии эффективности высших органов аудита. Выполнение такой работы вручную потребовало бы больших затрат труда и времени. Аналитические инструменты экономят для инспекций сотни человеко-часов, к тому же снижают вероятность ошибок.
И наконец, третья категория — кейсы, где, наряду с привычным уже PolyAnalyst, сотрудники Счетной палаты начинают использовать дополнительные специальные инструменты для работы с данными. Такие, как JupyterLab, Label Studio, нейронные сети. Речь уже идет, без преувеличения, о том, что сейчас принято называть искусственным интеллектом. В кейсах третьей категории компьютер учится «понимать» тексты нормативно-правовых актов и финансовых документов, распознавать смысл слов и предложений с учетом контекста. Это позволяет повышать точность классификации документов, искать близкие по смыслу показатели, распознавать аудиторские сущности (например, разные наименования одних и тех же мероприятий) и сравнивать их друг с другом. Кейсов третьей категории у нас пока немного, поскольку это, своего рода, высшая лига дата-аналитики. Но к концу года мы сможем рассказать еще о двух-трех подобных кейсах.
Особо хочу подчеркнуть, что, по мере овладения новыми инструментами, инспекторы при осуществлении дата-аналитических подходов все меньше нуждаются в участии IT-специалистов. Большинство новых кейсов были реализованы при очень небольшой нашей помощи. В основном, сотрудники направлений аудита делают уже почти все самостоятельно.
В таблице ниже представлены новые кейсы, внесенные в Реестр цифровых кейсов Счетной палаты в течение первого полугодия 2022 года. Подробные рассказы о них — в дальнейших выпусках «Цифровых проектов».
С текущей версией Реестра цифровых кейсов можно ознакомиться в Системе управления знаниями (СУЗ) Цифровой платформы Счетной палаты по ссылке:
https://wiki.ach.gov.ru/pages/viewpage.action?pageId=44630056
(Для доступа в СУЗ с удаленного компьютера должно быть запущено клиентское приложение для защищенного доступа в корпоративную сеть «Континент АП»).
Скачать Реестр в виде Excel-файла можно из Облака Счетной палаты по ссылке:
https://cloud.ach.gov.ru/s/XqXdzjoqMnSr4MQ.