Big Data
Обнаружил прикольные туториалы про биг-дату, как анализировать открытые данные от Артура Хачуяна на ютубе.
Выкачал подпищиков паблика своего родного факультета и построил графы связей: https://vk.com/cs_vsu .
На первой картинке — граф дружбы. У девочек оказалось в среднем чуть больше друзей чем у мальчиков, что логично.
А ещё ФКН довольно diversity в плане пола. Сексиму — Нет, хороший факультет.
На второй картинке — кто-как-кого лайкает — граф распространения контента.
В цвет положена гармоническая центральность — то сколько людей лайкает контент на стене, насколько широко расходятся волны лайков по графу.
Чем фиолетовее узел - тем больше лайкают этого человека. Размер узла - число подпищиков.
Тёмно-фиолетовых людей оказывается лайкают больше, чем тех у кого много подпищиков.
Нашли по сути дела самых влиятельных людей ФКНа, в плане распространения контента в ВК.
Парсил ВК АПИ и собирал граф Питоном в простой формат .gml, затем импортил, раскладывал и рендерил граф в Gephi.