March 15, 2019

Парт3.1 Мы и они

Мне тут в школе домашки много задают, поэтому с опазданием.

Для начала я хотел показать сколько получает среднестатистический татарстанец. Данные наглым образом стырил с сайта Росстата . Можно конечно долго ругать неинформативность представления средних величин, но тут до кучи недавно чуваки решили, что они неправильно считают среднее и пора бы им методику поменять. В общем, ловите рисуночек.

По оси y - средняя месячная зарплата, по х - дата. Там откуда я все дернул есть данные с 13 по 18 год. Виден рост и пики каждый декабрь, вроде все логично.

Тут хотел бы немного остановиться и на этом примере показать как можно по разному показывать одну и ту же информацию. Где-то видел годную статью по этому поводу, если найду скину.

В общем, смотрим - график такой резвый, растет бодренько. Но если построить его не по границам диапазона, а от нуля как в школе привыкли. То получится вот это:

Как бы тут одно и то же, но в первой картинке наклон больше и воспринимается как будто прям вообще растет в разы.

В общем, я сложил месячные зарплаты, получил годовой доход среднестатистического пролетария и сравнил cо средним годовым доходом депутатов.

Тут как и в предыдущих частях масштабы настолько разные, что пролетарий среднестатистический где-то там, у плинтуса.

Даже если в логарифмических координатах представить, то все равно на 2 порядка отличие (это два нуля в числе). Поэтому так же как и в первой части я нашел среднее моду и с учетом логнормального распределения нашел моду. Единственное отличие - на этот раз я брал доход только депутатов, не добавлял доходы семьи.

Все заколхозил в табличку:

Про всякие эти непонятные слова написано в первой части, повторяться не буду. В общем, мы тут сравниваем числа в двух последних строчках. В предыдущий раз когда мы сравнивали доходы только за 17 год и по всем членам семьи, рассчитанная мода таки хорошо согласовывалась с моими представлениями о доходе населения. Цифры довольно адекватные, порядок хотя бы совпадает.

Единственное 15 год. Сейчас объясню почему так вышло. В общем, моду получается из двух параметров логнормального распределения: мю и сигма. Эти два параметрам имеют явную интерпретацию в реальном мире. Мю характеризует медиану, то есть ту сумму с которой можно поделить количество депутатов на два равных лагеря, кто получает больше, а кто меньше. Сигма - насколько сильно отличаются средний и медианный доходы. То есть если кто-то один, или два, или три... получает существенно больше чем основная масса, то сигма будет большая. Если грубо, то данное число характеризует неравномерность нашего (в данном случае депутатского) общества. Чем больше сигма - тем бедные беднее а богатые богаче.

В 15 году медиана не сильно отличается от других годов и причем она самая маленькая. При этом суммарный доход по всем депутатам и средний доход самые большие. Те ость несколько человек получили овердохрена и "подпортили" статистику. На 97 депутатах что мы рассматриваем, хорошей статистики не получить, нужно БОЛЬШЕ депутатов.

Что-то больно много вышло, другие картинки про бабло будут позже.