November 18

Привет! На связи команда «Если быть точным» с открытым выпуском рассылки «Это не показатель».

Мы рассказываем в выпусках о том, что знаем и умеем сами, — как грамотно и красиво визуализировать данные, где искать открытые данные о России и как с ними работать. Нас читают исследователи, аналитики данных, журналисты, редакторы, PR-специалисты и маркетологи — как начинающие, так и опытные.

В этом выпуске мы собрали:

  • загадку об одном из показателей, который отражает динамику возрастной структуры населения;
  • эксперименты с графиками, которые по-разному показывают одни и те же данные;
  • инструкцию для поиска уникальных данных в статистических сборниках Росстата;
  • новости открытых данных за 10–16 ноября.

Это постоянные рубрики нашей рассылки: каждую неделю мы присылаем подписчикам новую дата-загадку, рубрику с графиком, новости статистики, а также лайфхак по работе с данными, код из нашего исследования или колонку о работе над материалами и датасетами. Подпишитесь, чтобы не пропустить!

Оформить подписку можно двумя способами:

Подписаться на закрытый телеграм-канал

Подписаться на Boosty и получать выпуски рассылки на электронную почту

Загадка с демографическим показателем

Демографы часто оперируют различными показателями возрастной структуры населения. Анализ динамики таких показателей позволяет лучше разобраться, как изменения в процессах рождаемости, смертности и миграции влияют на скорость старения населения. Например, падение рождаемости вместе со снижением смертности могут приводить к росту медианного возраста населения.

Перед вами — динамика одного из показателей возрастной структуры населения России. Что это за показатель и почему с 2018 года его динамика становится такой непредсказуемой?

Подсказка:

Показателей возрастной структуры не так много. К ним относятся, например, медианный возраст населения, доля населения в возрасте X лет, доля пожилых, доля трудоспособных, доля детей и несколько других.

Ответ — в конце выпуска.

Как визуализировать данные об экономическом неравенстве

В июле у нас вышло исследование о том, как изменяется экономическое неравенство в России. Сегодня разберем один график из этого текста. И заодно покажем, как разными способами можно визуализировать одни и те же данные.

Один из выводов исследования звучит так: «В 2023 году 60% самых бедных и 70% самых богатых россиян остались в той же доходной группе, что в 2022-м». Как и во всем мире, в России реже всего меняется положение самых богатых и самых бедных — этот феномен называют «липким потолком» и «липким полом». Мы уже рассказывали об этом явлении в одном из материалов, сопроводив описание аналогом пузырьковой диаграммы.

Что на этом графике:

  1. Каждый шарик показывает долю переходов внутри конкретной доходной группы, сумма значений в строке — 100%. То есть в первой (самой бедной) доходной группе больше половины сохранили свое положение, 23% перешли в соседнюю группу, где доходы выше, и только 3,8% перескочили сразу в последнюю (самую богатую) доходную группу.
  2. Самые большие значения — на диагонали. Больше половины в крайних доходных группах и около трети в остальных остались в той же доходной группе, что и были тремя годами ранее.
  3. Зеленым цветом выделены шарики с переходами в группы, где доходы больше, красным — переходы в группы, где доходы меньше.

Если в точности повторить этот график на новых данных, то окажется, что эффект «липкого потолка» и «липкого пола» стал еще заметнее:

В новом тексте есть такое наблюдение: «В целом в 2023 году 54% россиян не поменяли свое положение по сравнению с предыдущим годом». На графике выше это невозможно увидеть по двум причинам:

  1. Значения подсчитаны по строкам (то есть по доходным группам), а не как доля от всех перемещений;
  2. Сложно «на глаз» сложить категории, расположенные на диагонали, в одну группу и соотнести ее с двумя остальными.

Поэтому мы подумали о другом типе визуализации — диаграмме sankey (санкей), которая отлично подходит для визуализации потоков/перемещений/ перераспределения чего угодно, в том числе людей между доходными группами.

Получился такой вариант:

Что на этом графике:

  1. Сохранилась визуализация долей внутри каждой группы: хорошо видно, что в первой и последней группе больше половины никуда не переместились.
  2. Теперь хорошо видно, что чуть больше половины россиян не поменяли своего положения, а тех, кто переместился в группу с доходами выше, больше, чем тех, кто переместился в группу с доходами ниже.

Но потерялась одна деталь: в какие именно группы переходили россияне. Например, из первой группы чаще переходили в третью или четвертую. На предыдущем графике видно, что чаще всего переходят в соседнюю группу, а не перескакивают через одну или две. Самые большие красные и зеленые шарики находятся рядом с диагональю.

Когда мы готовили первый вариант санкея для этого текста, то попытались решить проблему, добавив следующий шаг:

Но в процессе поняли, что получается слишком сложно и нагружено, и отказалась от второго шага. Если бы было важно отразить тезис, что в основном люди переходят в соседнюю группу, мы бы сгруппировали данные таким образом:

Мораль сегодняшних рассуждений: одни и те же данные можно показать несколькими способами, и акценты будут расставлены в разных местах. Поэтому главная задача — понять, на что именно важно обратить внимание сейчас.

Как работать со статистическими сборниками Росстата (и какие уникальные данные там можно найти)

На первый взгляд эти сборники — пережиток прошлой эпохи, некоторые из них лет десять назад даже выходили в бумажном виде.

Да, это особенный источник данных. Сборники Росстата выходят нечасто — раз в два или три года. Часто дублируют другие источники. Обычно содержат данные за два-три предыдущих года и еще за пару «круглых» лет для сравнения. Вдобавок, цифры часто округляют до тысяч. Чтобы построить длинный динамический ряд, нужно обработать данные из нескольких сборников. И самое главное: сборники публикуют в форматах word или pdf, то есть требуется дополнительное время на подготовку данных. Однако пренебрегать этими источниками не стоит.

Прежде всего разберемся, где их найти. Если вы часто посещаете сайт Росстата, то знаете, что отыскать там интересующие данные может быть сложно.

Ссылки на все публикации Росстат размещает на странице «Каталог публикаций». Там три раздела:

1. Информационно-аналитические материалы — бюллетени, срочные справки и оперативные доклады.

Бюллетени — это данные одной или нескольких близких по тематике статистических форм или данные какого-либо выборочного наблюдения. Обычно ежегодные или годовые.

Оперативные доклады — это ежемесячные оперативные данные по социально-демографическим проблемам.

2. Публикации, характеризующие социально-экономическое положение субъектов Российской Федерации — оперативные доклады по регионам России.

3. Статистические издания — тематические сборники данных за несколько последних лет.

Все статистические сборники собраны в третьем разделе. Кроме того, ссылку на сборники можно найти и в разделах «Официальной статистики» — главного раздела Росстата с датасетами по всем проблемам. В большинстве разделов есть подраздел «Официальные публикации», где и даны ссылки на тематические сборники и бюллетени.

Чем полезны сборники

Во-первых, это удобный источник для поиска идей, гипотез и просто для того, чтобы понять, что происходит в стране.

Если вы раньше не работали с российской государственной статистикой и ничего не знаете о социальных проблемах, начните со статсборника «Социальное положение и уровень жизни населения». Это 15 разделов с цифрами обо всем — от демографии до преступности и международных сравнений. Если вы хотите погрузиться в российскую демографическую статистику, начните с «Демографического ежегодника» (выходит раз в два года).

Во-вторых, иногда больше неоткуда взять данные за нулевые годы. Например, данные по заболеваемости ожирением или некоторыми другими заболеваниями за этот период есть только в сборниках «Здравоохранение в России». Росстат по запросу отдает эти данные только с 2010-го года (где предыдущие никто не знает). Большинство сборников содержат данные с 1995-го, а в самых старых выпусках есть и статистика за 1989–1990 годы.

В-третьих, в сборниках иногда есть данные, которых в других местах не найти. В лучшем случае их можно получить по запросу. Например, в 2022-м Росстат перестал раскрывать полную статистику по причинам смерти. Но часть данных еще публикуют в «Демографическом ежегоднике». Кроме того, в сборнике есть данные в разрезе по полу, в других источниках такого разреза нет. Правда, есть опасения, что в этом году сборник либо не выпустят, либо сильно сократят.

В разделе 14 сборника «Социальное положение..» есть данные о количестве заключенных в разрезах по типу колонии. Это уникальные ведомственные данные. Они не входят в Федеральный план статистических работ, поэтому ФСИН не обязан их публиковать. Если что, мы уже «вытащили» эти данные и добавили в наш датасет о заключенных.

В двух словах

  • За прошлую неделю на ЕМИСС обновили 253 показателя, больше всего — Росстат (62), Минпромторг (33) и Минздрав (26). Минприроды с небольшим опозданием опубликовало годовые данные об использовании водных ресурсов. Судя по показателю «Отношение годового забора (добычи) воды из природных водных объектов к запасам водных ресурсов», воды в России внезапно стало больше: в предыдущие годы значение показателя было чуть больше 40%, в 2024-м — 8%. При этом объемы добычи воды почти не изменились. Фокус в том, что отношение считается не к реальным запасам, а к лимитам, которые утверждает Росводресурсы. В 2023-м году лимиты повысили, соотношение уменьшилось.
  • По данным Соцфонда, средняя пенсия по старости на 1 октября составляет 25,2 тысячи рублей. Средняя пенсия неработающих пенсионеров — почти 26 тысяч рублей, а работающих — 22,4 тысячи. Чтобы получать пенсию в 50 тысяч рублей, нужно достичь пенсионного возраста (60 лет для женщин и 65 лет для мужчин), иметь стаж не менее 15 лет и зарабатывать больше 230 тысяч рублей в месяц на протяжении более 20 лет, сообщила эксперт Президентской академии Марина Солодовникова. В России сейчас 40,6 млн пенсионеров, с апреля их число уменьшилось почти на 300 тысяч. Это происходит из-за естественного сокращения численности населения и постепенного повышения пенсионного возраста. 7,4 млн пенсионеров работают.
  • Выпускников медицинских вузов и колледжей обязали проходить отработку под руководством наставников в муниципальных и государственных медучреждениях. Отработка обязательна для всех — и бюджетников, и тех, кто учился на платной основе. Срок будет зависеть от специальности, но не должен превышать трех лет. Выпускники смогут выбрать регион и место работы. Помимо этого, все обучающиеся в ординатуре должны будут заключить договоры о целевом обучении. По мнению экспертов, новый закон поможет снизить кадровый дефицит, но окончательно проблему нехватки специалистов не решит. О том, каких врачей в России не хватает сильнее всего, читайте в нашем исследовании.
  • В РПЦ сообщили, что более 750 частных клиник в 14 регионах добровольно отказались от лицензий на проведение абортов. Это в том числе Вологодская, Курская, Курганская, Липецкая, Магаданская, Тверская области, Адыгея, Бурятия, Ингушетия, Карачаево-Черкесия, Крым, Мордовия, Тыва и Чукотский автономный округ. Правда, в Минздраве Бурятии опровергли информацию: 1З частных клиник имeют лицензию нa пpoвeдeние aбopтoв, только четыре из которых не проводят процедуру по своей инициативе. Ранее губернатор Смоленской области Василий Анохин заявил, что власти региона планируют запретить аборты в частных клиниках.
  • В России с начала года на 20% выросло число ДТП, которые происходят по вине детей в возрасте до десяти лет. На 30% увеличилось число погибших в авариях, случившихся по вине 14–16-летних подростков. В большинстве случаев дети управляли мототехникой. Это в том числе питбайки — спортивные мини-мотоциклы, на которых можно ездить только по бездорожью. Они не регистрируются в ГИБДД, так как имеют двигатель менее 50 куб. см.
  • От 30 до 80% людей с ампутациями испытывают симптомы депрессии, а от 40 до 90% — тревогу, подсчитали в благотворительном фонде «География добра». Эксперты проанализировали 8400 публикаций в СМИ и соцсетях за год и выяснили, что после 2023 года резко выросло число людей, которым нужны протезы и средства реабилитации.

Ответ на загадку

График показывает динамику коэффициента демографической нагрузки — численности нетрудоспособного населения в расчете на 1000 трудоспособных.

В 2018 году началась пенсионная реформа, одной из задач которой было снижение демографической нагрузки. Реформа поступательно увеличивала возраст выхода на пенсию.

Теперь каждый год в категорию трудоспособного населения попадают те, кто до реформы оказался бы в категории пенсионеров. Демографическая нагрузка снижается скачкообразно — спад чередуется с подъемами. Показатель естественным образом растет из-за старения населения, но каждый этап, снижающий пенсионный возраст, снижает и демографическую нагрузку.

Это одна из иллюстраций, как можно менять демографические процессы за счет административных изменений (изменения критериев нетрудоспособности). Подобные истории уже случались: например, в середине 2024 года миграционный прирост (как изменилось население страны из-за приезда или отъезда людей) вырос в три раза. Скорее всего, такой рост произошел из-за нового порядка учета. Он мог привести к двойному подсчету или включению мигрантов, которые раньше в статистику не попадали.

Новые выпуски рассылки «Это не показатель» выходят каждую неделю. Читатели нашего закрытого телеграм-канала и Boosty разгадывают дата-загадки, получают лайфхаки и инструкции по визуализации и работе с данными. А мы благодаря подписчикам можем продолжать работу — сохранять и распространять открытые данные в России. Подписывайтесь!

Чтобы подписаться, выберите удобный способ:

Подписаться на закрытый телеграм-канал

Подписаться на Boosty и получать выпуски рассылки на электронную почту

Стоимость подписки — 500 рублей в месяц.