<?xml version="1.0" encoding="utf-8" ?><feed xmlns="http://www.w3.org/2005/Atom" xmlns:tt="http://teletype.in/" xmlns:opensearch="http://a9.com/-/spec/opensearch/1.1/"><title>People Analytics</title><subtitle>HR аналитик
People analytics is a data-driven approach to managing people at work
Для связи с автором канала: data@hr-datalab.ru
Юрий (@psych2016)</subtitle><author><name>People Analytics</name></author><id>https://teletype.in/atom/people_analytics</id><link rel="self" type="application/atom+xml" href="https://teletype.in/atom/people_analytics?offset=0"></link><link rel="alternate" type="text/html" href="https://teletype.in/@people_analytics?utm_source=teletype&amp;utm_medium=feed_atom&amp;utm_campaign=people_analytics"></link><link rel="next" type="application/rss+xml" href="https://teletype.in/atom/people_analytics?offset=10"></link><link rel="search" type="application/opensearchdescription+xml" title="Teletype" href="https://teletype.in/opensearch.xml"></link><updated>2026-04-08T04:15:12.495Z</updated><entry><id>people_analytics:a3LP73hTmXa</id><link rel="alternate" type="text/html" href="https://teletype.in/@people_analytics/a3LP73hTmXa?utm_source=teletype&amp;utm_medium=feed_atom&amp;utm_campaign=people_analytics"></link><title>Анализ профилей MMPI образа Мэрилин Монро на основе больших языковых моделей и системы ТЕЗАЛ</title><published>2025-03-16T12:01:25.877Z</published><updated>2025-03-16T12:01:25.877Z</updated><category term="psihodiagnostika" label="психодиагностика"></category><summary type="html">&lt;img src=&quot;https://img2.teletype.in/files/1d/cb/1dcbae56-37b8-4a1e-ab82-a3361df29db0.png&quot;&gt;В этом кратком сообщении я анализирую профили MMPI–I, созданные различными большими языковыми моделями (БЯМ), для Мэрилин Монро, с целью сравнения их с профилем системы ТЕЗАЛ (ТЕЗаурус Автоматизированный Личностный). В своем мини-исследовании опираюсь на статью А. Г. Шмелёва «Патохарактерологический профиль „Мэрилин Монро“ в системах DeepSeek и ТЕЗАЛ», где обсуждается использование БЯМ DeepSeek для создания профилей на основе текстовых данных (текстового запроса в виде инструкции и перечня личностных черт). В ней автор описывает сравнение двух систем (БЯМ и ТЕЗАЛ) для создания патохарактерологических профилей MMPI для экранного образа «Мэрилин Монро» на основе 10 русскоязычных черт личности:</summary><content type="html">
  &lt;p id=&quot;eF8j&quot;&gt;В этом кратком сообщении я анализирую профили &lt;a href=&quot;https://ru.wikipedia.org/wiki/MMPI&quot; target=&quot;_blank&quot;&gt;MMPI–I&lt;/a&gt;, созданные различными &lt;a href=&quot;https://ru.wikipedia.org/wiki/%D0%91%D0%BE%D0%BB%D1%8C%D1%88%D0%B0%D1%8F_%D1%8F%D0%B7%D1%8B%D0%BA%D0%BE%D0%B2%D0%B0%D1%8F_%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D1%8C&quot; target=&quot;_blank&quot;&gt;большими языковыми моделями&lt;/a&gt; (БЯМ), для &lt;a href=&quot;https://ru.wikipedia.org/wiki/%D0%9C%D0%BE%D0%BD%D1%80%D0%BE,_%D0%9C%D1%8D%D1%80%D0%B8%D0%BB%D0%B8%D0%BD&quot; target=&quot;_blank&quot;&gt;Мэрилин Монро&lt;/a&gt;, с целью сравнения их с профилем системы &lt;strong&gt;&lt;a href=&quot;https://bigenc.ru/c/tezal-64f228&quot; target=&quot;_blank&quot;&gt;ТЕЗАЛ&lt;/a&gt;&lt;/strong&gt; (&lt;strong&gt;ТЕЗ&lt;/strong&gt;аурус &lt;strong&gt;А&lt;/strong&gt;втоматизированный &lt;strong&gt;Л&lt;/strong&gt;ичностный). В своем мини-исследовании опираюсь на статью А. Г. Шмелёва &lt;a href=&quot;https://ags.ht.ru/?p=1960&quot; target=&quot;_blank&quot;&gt;«Патохарактерологический профиль „Мэрилин Монро“ в системах DeepSeek и ТЕЗАЛ»&lt;/a&gt;, где обсуждается использование БЯМ DeepSeek для создания профилей на основе текстовых данных (текстового запроса в виде инструкции и перечня личностных черт). В ней автор описывает сравнение двух систем (БЯМ и ТЕЗАЛ) для создания патохарактерологических профилей MMPI для экранного образа «Мэрилин Монро» на основе 10 русскоязычных черт личности: &lt;/p&gt;
  &lt;p id=&quot;ViEw&quot;&gt;РАЗВЕСЁЛЫЙ, ЛЮБВЕОБИЛЬНЫЙ, ПОТЕШНЫЙ, БАЛОВНОЙ, ТРАНЖИРА, РАЗБОЛТАННЫЙ, СМЕШЛИВЫЙ, БЕСПЕЧАЛЬНЫЙ, РАСТОЧИТЕЛЬНЫЙ, УМОРИТЕЛЬНЫЙ. &lt;/p&gt;
  &lt;p id=&quot;svtt&quot;&gt;&lt;strong&gt;Важно!&lt;/strong&gt; Эти черты были выделены участниками вебинара и характеризуют кинематографический образ, а не реальную личность актрисы (ознакомитесь с детальным описанием в &lt;a href=&quot;https://ags.ht.ru/?p=1960&quot; target=&quot;_blank&quot;&gt;исходной статье&lt;/a&gt;).&lt;/p&gt;
  &lt;p id=&quot;KHOk&quot;&gt;&lt;strong&gt;Основные отличия в данном мини-исследовании: &lt;/strong&gt;&lt;br /&gt;1. использование &lt;strong&gt;6 различных БЯМ&lt;/strong&gt;: &lt;strong&gt;ChatGPT-4o&lt;/strong&gt; от компании OpenAI, &lt;strong&gt;DeepSeek&lt;/strong&gt; от одноименной китайской компании, DeepSeek_simple_prompt (данные из статьи Шмелёва А.Г.), &lt;strong&gt;GROK-3&lt;/strong&gt; от компании xAI Илона Маска, &lt;strong&gt;Mistral Large 2&lt;/strong&gt; от французского стартапа Mistral AI, &lt;strong&gt;Qwen2.5-MAX&lt;/strong&gt; от китайской компании Alibaba, &lt;strong&gt;YandexGPT 5 Pro&lt;/strong&gt; от российской компании Яндекс.&lt;br /&gt;2. использование улучшенного промпта, в котором наряду с контекстом и описанием шкал MMPI фиксируется требование к БЯМ возвращать ответ в виде целого числа по шкалам MMPI (Т-баллы). Например, в таком формате:&lt;/p&gt;
  &lt;figure id=&quot;vf4z&quot; class=&quot;m_retina&quot; data-caption-align=&quot;center&quot;&gt;
    &lt;img src=&quot;https://img4.teletype.in/files/bd/2e/bd2eec13-d966-4ff2-96d3-2237cf6bdee6.png&quot; width=&quot;354&quot; /&gt;
    &lt;figcaption&gt;Пример ответа DeepSeek на улучшенный промпт&lt;/figcaption&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;S2IC&quot;&gt;3. использование кроме корреляции Пирсона другой метрики сходства профилей — коэффициентa McCrae’s rpa, а также расчет средней абсолютной ошибки (MAE) как для моделей, так и для оценок всех моделей по каждой шкале MMPI в отдельности. &lt;/p&gt;
  &lt;p id=&quot;tmHY&quot;&gt;Целью было определить, &lt;strong&gt;какая большая языковая модель наиболее близко соответствует профилю ТЕЗАЛ &lt;/strong&gt;(может сгенерировать похожий профиль на основе личностных черт в сравнении со специализированной экспертной системой), используя коэффициент McCrae’s rpa и корреляцию Пирсона.&lt;/p&gt;
  &lt;h3 id=&quot;JNL7&quot;&gt;Краткое описание методологии&lt;/h3&gt;
  &lt;ul id=&quot;hdnk&quot;&gt;
    &lt;li id=&quot;tNvS&quot;&gt;&lt;strong&gt;ТЕЗАЛ&lt;/strong&gt;: Конверсия исходного списка из 10 черт в количественный профиль (факторная система MMPI) с последующей конверсией Тезал-баллов в T-баллы (данные из оригинальной статьи А. Г. Шмелёва).&lt;/li&gt;
    &lt;li id=&quot;57gQ&quot;&gt;&lt;strong&gt;БЯМ&lt;/strong&gt;: Генерация T-баллов на основе тех же черт по каждой шкале MMPI. В тексте запроса к БЯМ нет упоминания, что список качеств выделен для Мэрилин Монро.&lt;/li&gt;
    &lt;li id=&quot;cqIz&quot;&gt;&lt;strong&gt;Расчет сходства профилей&lt;/strong&gt; (профиль ТЕЗАЛ — целевой профиль).&lt;/li&gt;
  &lt;/ul&gt;
  &lt;p id=&quot;CUr7&quot;&gt;&lt;a href=&quot;https://pmc.ncbi.nlm.nih.gov/articles/PMC5929980/&quot; target=&quot;_blank&quot;&gt;Коэффициент McCrae’s rpa&lt;/a&gt; — это метрика сходства двух личностных профилей, полученных на основе многошкальных личностных опросников, например, MMPI, Big5, HEXACO, etc. Она учитывает не только форму (паттерн) профиля, но и его уровень (среднее значение). Это важно, потому что два профиля могут иметь схожую форму, но различаться по общему уровню T-баллов. Например, один профиль может быть выше по всем шкалам, чем другой, и rpa это заметит, в то время как корреляция Пирсона этого не покажет.&lt;/p&gt;
  &lt;pre id=&quot;riZT&quot;&gt;Например, у нас есть два профиля:
profile1 &amp;lt;- c(50, 80, 75, 65, 55)
profile2 &amp;lt;- c(40, 60, 65, 35, 25)
&amp;gt; cor(profile1, profile2)
[1] 0.8096409
&amp;gt; rpa(profile1, profile2, mu = 50, sd = 10, is_zscore = FALSE, plot_profiles = TRUE)
[1] -0.04079085&lt;/pre&gt;
  &lt;figure id=&quot;0FdX&quot; class=&quot;m_retina&quot; data-caption-align=&quot;center&quot;&gt;
    &lt;img src=&quot;https://img2.teletype.in/files/d1/7b/d17be861-270f-4226-b604-b2d492a4df1a.png&quot; width=&quot;386.5&quot; /&gt;
    &lt;figcaption&gt;Высокая корреляция, но низкое сходство  -- разные профили&lt;/figcaption&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;Yl0J&quot;&gt;Иными словами, два профиля могут иметь одинаковую форму и, следовательно, высокую корреляцию, но один может быть «высоко-расположенным», а другой — «утопленным».&lt;/p&gt;
  &lt;h3 id=&quot;cIqb&quot;&gt;Данные&lt;/h3&gt;
  &lt;p id=&quot;ykGU&quot;&gt;Исходные данные представлены в файле &lt;a href=&quot;https://github.com/tukachev/LLM_TEZAL_MMPI_profile/blob/main/LLM_data_profile.csv&quot; target=&quot;_blank&quot;&gt;LLM_data_profile.csv&lt;/a&gt;. Для каждой модели и системы ТЕЗАЛ были получены T-баллы по 10 шкалам MMPI. Также был рассчитан усредненный профиль на основе всех протестированных моделей (&lt;strong&gt;AverageLLM&lt;/strong&gt;). &lt;/p&gt;
  &lt;p id=&quot;VTth&quot;&gt;&lt;em&gt;Примечание: &lt;/em&gt;В тексте далее &lt;em&gt;DeepSeek_simple_prompt&lt;/em&gt; представляет оригинальный результат из статьи, тогда как &lt;em&gt;DeepSeek&lt;/em&gt; — результат модели с использованием улучшенного промпта, но модель DeepSeek в обоих случаях.&lt;/p&gt;
  &lt;p id=&quot;VVqN&quot;&gt;Данные, графики и исходный код анализа на языке R доступны на &lt;a href=&quot;https://github.com/tukachev/LLM_TEZAL_MMPI_profile/&quot; target=&quot;_blank&quot;&gt;Github&lt;/a&gt;.&lt;/p&gt;
  &lt;h3 id=&quot;WCEu&quot;&gt;Таблица сходства профилей&lt;/h3&gt;
  &lt;p id=&quot;UKgF&quot;&gt;Ниже приведены результаты расчета rpa, cor — корреляции Пирсона, MAE (средняя абсолютная ошибка) для каждой модели по сравнению с баллами ТЕЗАЛ:&lt;/p&gt;
  &lt;figure id=&quot;QgvN&quot; class=&quot;m_retina&quot;&gt;
    &lt;img src=&quot;https://img1.teletype.in/files/82/18/82187062-ee02-4b1a-b29a-d78d21a4a3f3.png&quot; width=&quot;289.5&quot; /&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;7bwv&quot;&gt;MAE рассчитывается как среднее абсолютное отклонение значений каждой модели от значений ТЕЗАЛ. Это показывает, насколько в среднем модель отклоняется от ТЕЗАЛ (чем меньше MAE, тем лучше).&lt;/p&gt;
  &lt;p id=&quot;33uc&quot;&gt;В таблице мы видим рейтинг больших языковых моделей (БЯМ) по их соответствию баллам профиля ТЕЗАЛ для Мэрилин Монро, отсортированных по убыванию коэффициента rpa.  YandexGPT 5 Pro лидирует (rpa 0.793, cor 0.849, mae 5.85). Это указывает на лучшее соответствие профиля как по форме, так и по уровню профиля ТЕЗАЛ с минимальными отклонениями по сравнению с другими БЯМ. &lt;/p&gt;
  &lt;p id=&quot;2a4K&quot;&gt;AverageLLM (усреднённый профиль всех моделей) на втором месте.&lt;/p&gt;
  &lt;p id=&quot;Eft4&quot;&gt;Модели, такие как Qwen2.5-MAX, MistralAI и ChatGPT-4o, показали умеренное сходство, в то время как GROK-3 (rpa = 0.633, r = 0.715) оказалась наименее близкой к ТЕЗАЛ.&lt;/p&gt;
  &lt;p id=&quot;ARBH&quot;&gt;В следующей таблице представлены в порядке убывания средние абсолютные ошибки (MAE) для каждой шкалы MMPI, рассчитанные по всем моделям (без учета AverageLLM). Чем выше значение MAE, тем больше среднее отклонение предсказаний моделей от эталонных данных (целевой профиль ТЕЗАЛ):&lt;/p&gt;
  &lt;figure id=&quot;cVWb&quot; class=&quot;m_retina&quot;&gt;
    &lt;img src=&quot;https://img2.teletype.in/files/55/1a/551abe58-a68e-46f2-9197-0ee7f20ec2e1.png&quot; width=&quot;319&quot; /&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;3rSp&quot;&gt;MAE имеет размерность T-шкалы, если разделить на 10 (1 SD = 10 T-баллов), то получим ошибку в стандартных отклонениях (sMAE):&lt;/p&gt;
  &lt;ul id=&quot;HZo2&quot;&gt;
    &lt;li id=&quot;x3dH&quot;&gt;sMAE &amp;gt; 1.0 (больше одного стандартного отклонения на шкале T-баллов) указывает на &lt;strong&gt;существенное отклонение от эталонных или целевых значений&lt;/strong&gt; (например, 1.41 по Pd и 1.14 по Si). Это говорит о том, что модели наименее точно воспроизводят оценки для соответствующих шкал. Вероятно, у моделей сложности с корректным определением поведенческих проявлений антисоциальных черт, социальной дезадаптации и интровертированного поведения и т.п.&lt;/li&gt;
    &lt;li id=&quot;9IGC&quot;&gt;sMAE ≈ 0.5 — 1.0  — &lt;strong&gt;умеренные расхождения &lt;/strong&gt;(например, Hy, HS, Pt). Модели менее уверенно определяют особенности эмоциональной нестабильности, мнительности и тревожности и т.п.&lt;/li&gt;
    &lt;li id=&quot;lP3p&quot;&gt;sMAE &amp;lt; 0.5  — &lt;strong&gt;наиболее точные предсказания&lt;/strong&gt; моделей (например, Ma, D, Pa). Модели лучше справляются с интерпретацией поведенческих проявлений, связанных с депрессивностью, гиперактивностью и импульсивностью и т.п.&lt;br /&gt;&lt;/li&gt;
  &lt;/ul&gt;
  &lt;h3 id=&quot;WAJn&quot;&gt;Визуализация профилей&lt;/h3&gt;
  &lt;p id=&quot;klDO&quot;&gt;График ниже показывает профили MMPI для всех моделей, с выделением профиля ТЕЗАЛ, YandexGPT-5 и AverageLLM:&lt;/p&gt;
  &lt;figure id=&quot;xODR&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img2.teletype.in/files/1d/cb/1dcbae56-37b8-4a1e-ab82-a3361df29db0.png&quot; width=&quot;1800&quot; /&gt;
  &lt;/figure&gt;
  &lt;h3 id=&quot;CzKJ&quot;&gt;Основные выводы&lt;/h3&gt;
  &lt;ol id=&quot;3nJa&quot;&gt;
    &lt;li id=&quot;YJnL&quot;&gt;&lt;strong&gt;YandexGPT 5 Pro демонстрирует наилучшее соответствие профилю ТЕЗАЛ&lt;/strong&gt;, то есть наиболее точно воспроизводит патохарактерологический профиль кинематографического образа Мэрилин Монро, основанный на заданных 10 русскоязычных личностных чертах. &lt;/li&gt;
    &lt;li id=&quot;fgp0&quot;&gt;&lt;strong&gt;AverageLLM как надежная альтернатива&lt;/strong&gt; — усредненный профиль всех протестированных БЯМ (AverageLLM) занял второе место по сходству с профилем ТЕЗАЛ. Агрегирование результатов нескольких моделей может служить эффективным подходом для получения профиля, близкого к эталонному, даже если отдельные модели демонстрируют вариативность в точности. Ансамблевый подход, где объединение выводов нескольких моделей, является ресурсоемким и дорогим решением. Я попробовал только один из способов агрегирования, но можно использовать другие статистические методы агрегации — медиану или усечённое среднее (trimmed mean). Оставляю за читателями сделать самостоятельно такие расчеты, поскольку данные и код открыты.&lt;/li&gt;
    &lt;li id=&quot;CHF9&quot;&gt;&lt;strong&gt;Сложности с отдельными шкалами MMPI.&lt;/strong&gt; Анализ средних абсолютных ошибок (MAE) по каждой шкале MMPI выявил области, где модели испытывают наибольшие трудности. Скорее всего, необходимо улучшать промпт или проводить дополнительное обучение БЯМ на данных, для решения такой задачи — генерирования личностного профиля в одной из факторных систем на основе входного списка личностных черт. Полученный результат лишь показывает, &lt;strong&gt;ограниченность практического применения БЯМ для решения подобной задачи в сравнении со специализированной системой ТЕЗАЛ&lt;/strong&gt;, валидность которой для применения в качестве инструмента автоматизированной интерпретации результатов психологического тестирования имеет эмпирические свидетельства, полученных в том числе экспертно-статистическими методами.&lt;/li&gt;
    &lt;li id=&quot;eKpS&quot;&gt;Впечатляющий результат БЯМ заставляет задуматься, &lt;strong&gt;нет ли у них зачатков «ментальной модели реальности»? :) &lt;/strong&gt;&lt;/li&gt;
  &lt;/ol&gt;

</content></entry><entry><id>people_analytics:cyceB4rvxKt</id><link rel="alternate" type="text/html" href="https://teletype.in/@people_analytics/cyceB4rvxKt?utm_source=teletype&amp;utm_medium=feed_atom&amp;utm_campaign=people_analytics"></link><title>Классифицируем отзывы сотрудников о работодателе с помощью R, rollama и Ollama</title><published>2025-01-31T19:58:28.741Z</published><updated>2025-02-01T18:40:44.579Z</updated><category term="people-analytics" label="people_analytics"></category><summary type="html">&lt;img src=&quot;https://img1.teletype.in/files/c4/c2/c4c23b50-7bf4-4945-9cd3-38b11db14d5c.png&quot;&gt;Анализ отзывов сотрудников помогает HR-менеджерам выявлять ключевые проблемы в компании, оценивать уровень удовлетворенности персонала и находить точки роста. Использование локальных моделей LLM (Large Language Models) позволяет анализировать данные без отправки конфиденциальной информации во внешние сервисы, что особенно важно при работе с чувствительными данными сотрудников.</summary><content type="html">
  &lt;p id=&quot;PM44&quot;&gt;Анализ отзывов сотрудников помогает HR-менеджерам выявлять ключевые проблемы в компании, оценивать уровень удовлетворенности персонала и находить точки роста. Использование локальных моделей LLM (Large Language Models) позволяет анализировать данные без отправки конфиденциальной информации во внешние сервисы, что особенно важно при работе с чувствительными данными сотрудников.&lt;/p&gt;
  &lt;h3 id=&quot;dHw7&quot;&gt;📌Почему стоит использовать локальные LLM для анализа отзывов?&lt;/h3&gt;
  &lt;ul id=&quot;hgue&quot;&gt;
    &lt;li id=&quot;vFHh&quot;&gt;&lt;strong&gt;Безопасность данных &lt;/strong&gt;— отзывы остаются на вашем компьютере, исключая риск утечки информации.&lt;/li&gt;
    &lt;li id=&quot;snKn&quot;&gt;&lt;strong&gt;Быстродействие&lt;/strong&gt; — модели работают локально, без задержек, связанных с интернет-соединением.&lt;/li&gt;
    &lt;li id=&quot;rOdI&quot;&gt;&lt;strong&gt;Гибкость&lt;/strong&gt; — можно использовать различные модели и настраивать их под свои задачи.&lt;/li&gt;
    &lt;li id=&quot;8yUj&quot;&gt;&lt;strong&gt;Экономия&lt;/strong&gt; — не требуется платить за API-запросы, как при использовании облачных сервисов.&lt;/li&gt;
  &lt;/ul&gt;
  &lt;h2 id=&quot;XL7S&quot;&gt;🔧 1. Установка Ollama и rollama&lt;/h2&gt;
  &lt;p id=&quot;nrui&quot;&gt;Прежде чем начать, нужно установить два компонента:&lt;/p&gt;
  &lt;p id=&quot;QoqI&quot;&gt;1. &lt;strong&gt;Ollama&lt;/strong&gt; — это сервер, на котором запускаются модели LLM. &lt;br /&gt;2. &lt;strong&gt;rollama&lt;/strong&gt; — R-пакет для взаимодействия с Ollama.&lt;/p&gt;
  &lt;h3 id=&quot;qdqI&quot;&gt;Шаг 1: Установите Ollama с официального сайта:  &lt;/h3&gt;
  &lt;p id=&quot;CHNh&quot;&gt;&lt;br /&gt;➡ &lt;a href=&quot;https://ollama.com/&quot; target=&quot;_blank&quot;&gt;Скачать Ollama &lt;/a&gt; &lt;br /&gt;После установки запустите Ollama, и он будет работать в фоновом режиме. &lt;br /&gt;❗️&lt;a href=&quot;https://t.me/People_Analytics/606&quot; target=&quot;_blank&quot;&gt;&lt;strong&gt;Простая и понятная инструкция для установки.&lt;/strong&gt;&lt;/a&gt;&lt;/p&gt;
  &lt;h3 id=&quot;V57A&quot;&gt;Шаг 2: Установите пакет rollama в R:&lt;/h3&gt;
  &lt;pre id=&quot;Bsdj&quot; data-lang=&quot;r&quot;&gt;install.packages(&amp;quot;remotes&amp;quot;)
remotes::install_github(&amp;quot;JBGruber/rollama&amp;quot;)&lt;/pre&gt;
  &lt;h3 id=&quot;W2N7&quot;&gt;Шаг 3: Проверьте, работает ли Ollama:&lt;/h3&gt;
  &lt;pre id=&quot;5U2Z&quot; data-lang=&quot;r&quot;&gt;rollama::ping_ollama()&lt;/pre&gt;
  &lt;p id=&quot;9txC&quot;&gt;Если всё установлено правильно, вы увидите сообщение:  &lt;/p&gt;
  &lt;pre id=&quot;HhNJ&quot; data-lang=&quot;r&quot;&gt;# ▶ Ollama (v0.5.7) is running at &amp;lt;http://localhost:11434&amp;gt;!&lt;/pre&gt;
  &lt;h2 id=&quot;gH2m&quot;&gt;📥 2. Загрузка модели LLM&lt;/h2&gt;
  &lt;p id=&quot;ZH5l&quot;&gt;Перед анализом отзывов нужно загрузить языковую модель. Для этого выполните:&lt;/p&gt;
  &lt;pre id=&quot;kfZg&quot; data-lang=&quot;r&quot;&gt;rollama::pull_model(&amp;quot;gemma2:2b&amp;quot;)&lt;/pre&gt;
  &lt;p id=&quot;dDpC&quot;&gt;Модель скачивается один раз, после чего готова к работе. Для этого укажем, что именно ее следует использовать:&lt;/p&gt;
  &lt;pre id=&quot;qfqx&quot; data-lang=&quot;r&quot;&gt;#так указываем, какую модель использовать
options(rollama_model = &amp;quot;gemma2:2b&amp;quot;)&lt;/pre&gt;
  &lt;p id=&quot;n1UM&quot;&gt;Список доступных локально LLM (уже загруженных на ПК):&lt;br /&gt;&lt;/p&gt;
  &lt;pre id=&quot;mrYY&quot; data-lang=&quot;r&quot;&gt;rollama::list_models() 
# A tibble: 3 × 11
# name         model modified_at   size digest parent_model format family families
# &amp;lt;chr&amp;gt;        &amp;lt;chr&amp;gt; &amp;lt;chr&amp;gt;        &amp;lt;dbl&amp;gt; &amp;lt;chr&amp;gt;  &amp;lt;chr&amp;gt;        &amp;lt;chr&amp;gt;  &amp;lt;chr&amp;gt;  &amp;lt;list&amp;gt;  
#   1 mistral:lat… mist… 2025-01-29… 4.11e9 f974a… &amp;quot;&amp;quot;           gguf   llama  &amp;lt;chr&amp;gt;   
#   2 deepseek-r1… deep… 2025-01-29… 4.92e9 28f8f… &amp;quot;&amp;quot;           gguf   llama  &amp;lt;chr&amp;gt;   
#   3 gemma2:2b    gemm… 2025-01-29… 1.63e9 8ccf1… &amp;quot;&amp;quot;           gguf   gemma2 &amp;lt;chr&amp;gt;   
#   # ℹ 2 more variables: parameter_size &amp;lt;chr&amp;gt;, quantization_level &amp;lt;chr&amp;gt;
&lt;/pre&gt;
  &lt;h2 id=&quot;EII4&quot;&gt;📊 3. Классификация отзывов&lt;/h2&gt;
  &lt;p id=&quot;3wBI&quot;&gt;Мы будем использовать модель для автоматического определения тональности отзывов (позитивный, нейтральный, негативный), ориентируясь на:&lt;/p&gt;
  &lt;figure id=&quot;YqXG&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img2.teletype.in/files/d0/b0/d0b061c5-9495-4ef8-b76d-9a2ef005953c.png&quot; width=&quot;695&quot; /&gt;
  &lt;/figure&gt;
  &lt;h3 id=&quot;aqEM&quot;&gt;Простой пример (zero-shot)&lt;/h3&gt;
  &lt;p id=&quot;Vmum&quot;&gt;Допустим, у нас есть отзыв:  &lt;/p&gt;
  &lt;blockquote id=&quot;zHEu&quot;&gt;&amp;quot;Компания предоставляет хорошие условия, но с карьерным ростом тут сложно.&amp;quot;&lt;/blockquote&gt;
  &lt;p id=&quot;Kun8&quot;&gt;Мы можем запросить у модели классификацию:&lt;/p&gt;
  &lt;pre id=&quot;nNMr&quot; data-lang=&quot;r&quot;&gt;library(tibble)
library(purrr)
q &amp;lt;- tribble(
  ~role,    ~content,
  &amp;quot;system&amp;quot;, &amp;quot;Ты определяешь категорию текста. Отвечай только одним словом.&amp;quot;,
  &amp;quot;user&amp;quot;, &amp;quot;text: Компания предоставляет хорошие условия, но с карьерным ростом тут сложно.\ncategories: положительный, нейтральный, негативный&amp;quot;
)&lt;/pre&gt;
  &lt;pre id=&quot;wSx8&quot; data-lang=&quot;r&quot;&gt;result &amp;lt;- rollama::query(q, output = &amp;quot;text&amp;quot;)
&lt;/pre&gt;
  &lt;p id=&quot;UtiH&quot;&gt;&lt;strong&gt;Ожидаемый результат:&lt;/strong&gt; &amp;quot;нейтральный&amp;quot;&lt;br /&gt;&lt;strong&gt;Ответ модели:&lt;/strong&gt;&lt;/p&gt;
  &lt;pre id=&quot;PT59&quot; data-lang=&quot;r&quot;&gt;&amp;gt; result &amp;lt;- rollama::query(q, output = &amp;quot;text&amp;quot;)
                        
── Answer from gemma2:2b ─────────────────────────────────────────────────────────────────────
негативный
&lt;/pre&gt;
  &lt;p id=&quot;zY75&quot;&gt;Zero-shot не всегда дает необходимый результат.&lt;/p&gt;
  &lt;p id=&quot;K8wY&quot;&gt;Пробуем &lt;strong&gt;one-shot&lt;/strong&gt;:&lt;/p&gt;
  &lt;pre id=&quot;vvwq&quot; data-lang=&quot;r&quot;&gt;q &amp;lt;- tribble(
  ~role,    ~content,
  &amp;quot;system&amp;quot;, &amp;quot;Ты определяешь категорию текста. Отвечай только одним словом.&amp;quot;,
  &amp;quot;user&amp;quot;, &amp;quot;text: Зарплата высокая, коллектив дружный.\ncategories: положительный, нейтральный, негативный&amp;quot;,
  &amp;quot;assistant&amp;quot;, &amp;quot;сategory: положительный&amp;quot;,
  &amp;quot;user&amp;quot;, &amp;quot;text: Компания предоставляет хорошие условия, но с карьерным ростом тут сложно.\ncategories: положительный, нейтральный, негативный&amp;quot;
)&lt;/pre&gt;
  &lt;p id=&quot;mArE&quot;&gt;&lt;br /&gt;&lt;strong&gt;Ожидаемый результат: &lt;/strong&gt;&amp;quot;нейтральный&amp;quot;&lt;br /&gt;&lt;strong&gt;Ответ модели:&lt;/strong&gt;&lt;/p&gt;
  &lt;pre id=&quot;ELwA&quot; data-lang=&quot;r&quot;&gt;&amp;gt; result &amp;lt;- rollama::query(q, output = &amp;quot;text&amp;quot;)
                        
── Answer from gemma2:2b ─────────────────────────────────────────────────────────────────────
нейтральный&lt;/pre&gt;
  &lt;h2 id=&quot;xIpY&quot;&gt;&lt;br /&gt;🔍 4. Улучшение точности (few-shot и Chain-of-thought)&lt;/h2&gt;
  &lt;p id=&quot;Cu6Q&quot;&gt;Чтобы повысить точность классификации, можно показать модели несколько примеров:&lt;/p&gt;
  &lt;pre id=&quot;0dgK&quot; data-lang=&quot;r&quot;&gt;q &amp;lt;- tribble(
  ~role,    ~content,
  &amp;quot;system&amp;quot;, &amp;quot;Ты определяешь категорию текста. Отвечай только одним словом.&amp;quot;,
  &amp;quot;user&amp;quot;, &amp;quot;text: Зарплата высокая, коллектив дружный.\ncategories: положительный, нейтральный, негативный&amp;quot;,
  &amp;quot;assistant&amp;quot;, &amp;quot;положительный&amp;quot;,
  &amp;quot;user&amp;quot;, &amp;quot;text: Работаю тут давно, но перспективы роста нет.\ncategories: положительный, нейтральный, негативный&amp;quot;,
  &amp;quot;assistant&amp;quot;, &amp;quot;нейтральный&amp;quot;,
  &amp;quot;user&amp;quot;, &amp;quot;text: Постоянные переработки и низкая оплата.\ncategories: положительный, нейтральный, негативный&amp;quot;,
  &amp;quot;assistant&amp;quot;, &amp;quot;негативный&amp;quot;,
  &amp;quot;user&amp;quot;, &amp;quot;text: Компания предоставляет хорошие условия, но с карьерным ростом тут сложно.\ncategories: положительный, нейтральный, негативный&amp;quot;
)&lt;/pre&gt;
  &lt;pre id=&quot;EJ7G&quot;&gt;result &amp;lt;- rollama::query(q, output = &amp;quot;text&amp;quot;)&lt;/pre&gt;
  &lt;p id=&quot;gS4Z&quot;&gt;&lt;strong&gt;Ожидаемый результат:&lt;/strong&gt; &amp;quot;нейтральный&amp;quot;&lt;br /&gt;&lt;strong&gt;Ответ модели:&lt;/strong&gt;&lt;/p&gt;
  &lt;pre id=&quot;HrCz&quot; data-lang=&quot;r&quot;&gt;&amp;gt; result &amp;lt;- rollama::query(q, output = &amp;quot;text&amp;quot;)
                        
── Answer from gemma2:2b ─────────────────────────────────────────────────────────────────────
нейтральный&lt;/pre&gt;
  &lt;p id=&quot;9AEF&quot;&gt;&lt;br /&gt;Здесь модель учится на примерах, что делает классификацию уже точнее.&lt;/p&gt;
  &lt;h3 id=&quot;8tOQ&quot;&gt;Chain-of-thought (CoT), или подсказка по цепочке рассуждений&lt;/h3&gt;
  &lt;p id=&quot;JU4R&quot;&gt;Этот подход включает в себя как минимум один шаг рассуждения. Структура здесь начинается с подсказки системы, затем появляется подсказка пользователя с текстом для классификации и вопросом для рассуждения.&lt;/p&gt;
  &lt;pre id=&quot;mfD4&quot; data-lang=&quot;r&quot;&gt;q_thought &amp;lt;- tribble(
  ~role,    ~content,
  &amp;quot;system&amp;quot;, &amp;quot;Ты определяешь категорию текста. Размышляй перед тем, как дать ответ.&amp;quot;,
  &amp;quot;user&amp;quot;,   &amp;quot;text: Зарплата высокая, коллектив дружный.\nКакую категорию (положительный, нейтральный или негативный) ты бы назначил? Объясни свой выбор.&amp;quot;,
  &amp;quot;assistant&amp;quot;, &amp;quot;Этот отзыв содержит положительные элементы: высокая зарплата и дружный коллектив — оба фактора указывают на удовлетворенность сотрудника. Категория: положительный.&amp;quot;,
  &amp;quot;user&amp;quot;,   &amp;quot;text: Работаю тут давно, но перспективы роста нет.\nКакую категорию (положительный, нейтральный или негативный) ты бы назначил? Объясни свой выбор.&amp;quot;,
  &amp;quot;assistant&amp;quot;, &amp;quot;Этот отзыв содержит как нейтральные, так и негативные аспекты. Хотя работа стабильная (&amp;#x27;давно&amp;#x27;), отсутствие карьерного роста — минус. Однако в целом эмоциональная окраска отзыва не резкая. Категория: нейтральный.&amp;quot;,
  &amp;quot;user&amp;quot;,   &amp;quot;text: Постоянные переработки и низкая оплата.\nКакую категорию (положительный, нейтральный или негативный) ты бы назначил? Объясни свой выбор.&amp;quot;,
  &amp;quot;assistant&amp;quot;, &amp;quot;Этот отзыв выражает явное недовольство: переработки и низкая оплата — два сильных негативных фактора. Категория: негативный.&amp;quot;,
  &amp;quot;user&amp;quot;,   &amp;quot;text: Рабочая атмосфера замечательная, руководство всегда поддерживает.\nКакую категорию (положительный, нейтральный или негативный) ты бы назначил? Объясни свой выбор.&amp;quot;
)&lt;/pre&gt;
  &lt;pre id=&quot;x1lV&quot;&gt;output_thought &amp;lt;- rollama::query(q_thought, output = &amp;quot;text&amp;quot;)&lt;/pre&gt;
  &lt;p id=&quot;Yune&quot;&gt;&lt;br /&gt;&lt;strong&gt;Ожидаемый результат:&lt;/strong&gt; &amp;quot;положительный&amp;quot;&lt;br /&gt;&lt;strong&gt;Ответ модели:&lt;/strong&gt;&lt;/p&gt;
  &lt;pre id=&quot;ZeT0&quot; data-lang=&quot;r&quot;&gt;&amp;gt; output_thought &amp;lt;- rollama::query(q_thought, output = &amp;quot;text&amp;quot;)
                        
── Answer from gemma2:2b ─────────────────────────────────────────────────────────────────────
Положительный.
 
**Объяснение:**
* **Рабочая атмосфера замечательная**: Это позитивная характеристика, которая указывает на
благоприятные условия для работы.
* **Руководство всегда поддерживает**: Поддержка руководства – важный фактор для
удовлетворенности работника.
В целом, отзыв свидетельствует о положительном опыте работы в компании.&lt;/pre&gt;
  &lt;p id=&quot;XXdR&quot;&gt;&lt;/p&gt;
  &lt;h2 id=&quot;18KW&quot;&gt;🔄 5. Массовая обработка отзывов&lt;/h2&gt;
  &lt;p id=&quot;uxR3&quot;&gt;Если у вас есть список отзывов, можно обработать их векторизированым способом:&lt;/p&gt;
  &lt;pre id=&quot;Aj2D&quot; data-lang=&quot;r&quot;&gt;reviews_df &amp;lt;- tibble::tibble(
  review_id = 1:3,
  review = c(
    &amp;quot;Отличная команда и интересные задачи.&amp;quot;,
    &amp;quot;Руководство не ценит сотрудников.&amp;quot;,
    &amp;quot;Работа стабильная, но скучная.&amp;quot;
  )
)&lt;/pre&gt;
  &lt;pre id=&quot;DzX9&quot; data-lang=&quot;r&quot;&gt;annotated_reviews &amp;lt;- reviews_df %&amp;gt;%
  mutate(
    sentiment = rollama::make_query(
      text = review,
      prompt = &amp;quot;Категории: положительный, нейтральный, негативный&amp;quot;,
      template = &amp;quot;{prefix}{text}\n{prompt}&amp;quot;,
      system = &amp;quot;Определи категорию текста. Отвечай только одним словом из указанных категорий.&amp;quot;,
      prefix = &amp;quot;Текст отзыва: &amp;quot;
    ) %&amp;gt;%
      rollama::query(screen = FALSE, output = &amp;quot;text&amp;quot;)
  )&lt;/pre&gt;
  &lt;p id=&quot;QEWn&quot;&gt;&lt;strong&gt;Пример результата:&lt;/strong&gt;&lt;/p&gt;
  &lt;pre id=&quot;ds8D&quot; data-lang=&quot;r&quot;&gt;&amp;gt; annotated_reviews
# A tibble: 3 × 3
  review_id review                                sentiment         
      &amp;lt;int&amp;gt; &amp;lt;chr&amp;gt;                                 &amp;lt;chr&amp;gt;             
1         1 Отличная команда и интересные задачи. &amp;quot;положительный&amp;quot;
2         2 Руководство не ценит сотрудников.     &amp;quot;негативный&amp;quot;   
3         3 Работа стабильная, но скучная.        &amp;quot;нейтральный&amp;quot;&lt;/pre&gt;
  &lt;h2 id=&quot;6Fuy&quot;&gt;⚙ 6. Настройка модели&lt;/h2&gt;
  &lt;p id=&quot;WZl3&quot;&gt;Если модель отвечает слишком длинно или слишком кратко, или вам не нравятся ответы конкретной LLM, можно настроить её поведение или выбрать другую:&lt;/p&gt;
  &lt;pre id=&quot;fgn2&quot; data-lang=&quot;r&quot;&gt;options(rollama_config = &amp;quot;Делай ответы краткими, но точными.&amp;quot;)
#так указываем, какую модель использовать
options(rollama_model = &amp;quot;gemma2:2b&amp;quot;)
#список локальных LLM
rollama::list_models() 
# A tibble: 3 × 11
# name         model modified_at   size digest parent_model format family families
# &amp;lt;chr&amp;gt;        &amp;lt;chr&amp;gt; &amp;lt;chr&amp;gt;        &amp;lt;dbl&amp;gt; &amp;lt;chr&amp;gt;  &amp;lt;chr&amp;gt;        &amp;lt;chr&amp;gt;  &amp;lt;chr&amp;gt;  &amp;lt;list&amp;gt;  
#   1 mistral:lat… mist… 2025-01-29… 4.11e9 f974a… &amp;quot;&amp;quot;           gguf   llama  &amp;lt;chr&amp;gt;   
#   2 deepseek-r1… deep… 2025-01-29… 4.92e9 28f8f… &amp;quot;&amp;quot;           gguf   llama  &amp;lt;chr&amp;gt;   
#   3 gemma2:2b    gemm… 2025-01-29… 1.63e9 8ccf1… &amp;quot;&amp;quot;           gguf   gemma2 &amp;lt;chr&amp;gt;   
#   # ℹ 2 more variables: parameter_size &amp;lt;chr&amp;gt;, quantization_level &amp;lt;chr&amp;gt;&lt;/pre&gt;
  &lt;h2 id=&quot;HRmv&quot;&gt;✅ Итоги&lt;/h2&gt;
  &lt;p id=&quot;7jER&quot;&gt;Использование локальной LLM через &lt;strong&gt;Ollama&lt;/strong&gt; и пакет &lt;strong&gt;rollama&lt;/strong&gt; в R даёт HR-менеджерам мощный инструмент для анализа отзывов сотрудников, обеспечивая безопасность данных и высокую скорость обработки.&lt;/p&gt;
  &lt;p id=&quot;uzcz&quot;&gt;&lt;strong&gt;Преимущества метода: &lt;/strong&gt;&lt;br /&gt;✔ Полная конфиденциальность (данные не покидают ваш компьютер).  &lt;br /&gt;✔ Высокая скорость обработки без задержек.  &lt;br /&gt;✔ Возможность адаптировать модель под задачи HR.&lt;/p&gt;
  &lt;p id=&quot;VyZO&quot;&gt;Теперь вы можете быстро анализировать с помощью локальной LLM отзывы сотрудников, находить проблемные зоны и принимать решения на основе данных, сохраня конфиденциальность и соблюдая политику информационной безопасноти компании 🚀&lt;/p&gt;
  &lt;h3 id=&quot;Um5a&quot;&gt;Дополнительная информация&lt;/h3&gt;
  &lt;p id=&quot;wF3d&quot;&gt;1. &lt;a href=&quot;https://jbgruber.github.io/rollama/index.html&quot; target=&quot;_blank&quot;&gt;Документация к пакету rollama&lt;/a&gt;&lt;br /&gt;2. &lt;a href=&quot;https://luisdva.github.io/rstats/LLMsR/&quot; target=&quot;_blank&quot;&gt;2024 LLMs/genAI + R roundup&lt;/a&gt;&lt;br /&gt;3. &lt;a href=&quot;https://ercbk.github.io/Data-Science-Notebook/qmd/llms-general.html&quot; target=&quot;_blank&quot;&gt;https://ercbk.github.io/Data-Science-Notebook/qmd/llms-general.html&lt;/a&gt;&lt;br /&gt;4. &lt;a href=&quot;https://blog.devgenius.io/ollama-tidychatmodels-categorizing-text-data-in-r-bbe350c3d8b9&quot; target=&quot;_blank&quot;&gt;Ollama + tidychatmodels: Categorizing Text Data in R&lt;/a&gt;&lt;/p&gt;
  &lt;p id=&quot;jtqC&quot;&gt;Подписывайтесь на канал &lt;a href=&quot;https://t.me/People_Analytics&quot; target=&quot;_blank&quot;&gt;People Analytics&lt;/a&gt;.&lt;/p&gt;

</content></entry><entry><id>people_analytics:KtLon4bRlC_</id><link rel="alternate" type="text/html" href="https://teletype.in/@people_analytics/KtLon4bRlC_?utm_source=teletype&amp;utm_medium=feed_atom&amp;utm_campaign=people_analytics"></link><title>Используем LLM локально на своем ПК</title><published>2025-01-28T21:50:45.573Z</published><updated>2025-01-29T00:03:49.164Z</updated><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://img4.teletype.in/files/f3/74/f3748b1f-d468-4ae0-aea5-345280e45aff.png"></media:thumbnail><category term="hr" label="HR"></category><summary type="html">&lt;img src=&quot;https://img1.teletype.in/files/82/42/82428309-bb29-4ee7-8ba6-a1262acb294d.png&quot;&gt;Я уже писал о том, как начать пользоваться LLM в 2024 году. Обещал, что для 5 способа напишу краткую инструкцию. Вот простая и понятная инструкция по запуску большой языковой модели (LLM), например, gemma2:2b, на вашем компьютере (минимально 12ГБ ОЗУ, но можно и на 8Гб, если использовать модели от 2B до 7B параметрами):</summary><content type="html">
  &lt;p id=&quot;Ghy8&quot;&gt;Я уже писал о том, &lt;a href=&quot;https://t.me/People_Analytics/566&quot; target=&quot;_blank&quot;&gt;как начать пользоваться LLM в 2024 году&lt;/a&gt;. Обещал, что для 5 способа напишу краткую инструкцию. Вот простая и понятная инструкция по запуску большой языковой модели (LLM), например, gemma2:2b, на вашем компьютере (минимально 12ГБ ОЗУ, но можно и на 8Гб, если использовать модели от 2B до 7B параметрами):&lt;/p&gt;
  &lt;p id=&quot;4517&quot;&gt;&lt;strong&gt;1. Установите Ollama (инструмент для запуска LLM)&lt;/strong&gt;&lt;/p&gt;
  &lt;p id=&quot;g2HE&quot;&gt;Ollama позволяет запускать языковые модели на вашем компьютере без подключения к интернету.&lt;/p&gt;
  &lt;figure id=&quot;2rQx&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img1.teletype.in/files/82/42/82428309-bb29-4ee7-8ba6-a1262acb294d.png&quot; width=&quot;1161&quot; /&gt;
    &lt;figcaption&gt;Сайт Ollama&lt;/figcaption&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;rBV4&quot;&gt;&lt;strong&gt;Как это сделать:&lt;/strong&gt;&lt;/p&gt;
  &lt;ul id=&quot;OkJs&quot;&gt;
    &lt;li id=&quot;zzFQ&quot;&gt;Перейдите на официальный сайт &lt;a href=&quot;https://ollama.com/&quot; target=&quot;_blank&quot;&gt;Ollama&lt;/a&gt;.&lt;/li&gt;
    &lt;li id=&quot;N7pq&quot;&gt;На главной странице найдите кнопку &lt;strong&gt;Download&lt;/strong&gt; (Скачать) и скачайте версию для вашей операционной системы (Windows, macOS, Linux).&lt;/li&gt;
    &lt;li id=&quot;fPNR&quot;&gt;Установите программу, следуя инструкциям установщика.&lt;/li&gt;
  &lt;/ul&gt;
  &lt;p id=&quot;3llb&quot;&gt;&lt;strong&gt;2. Откройте терминал&lt;/strong&gt;&lt;/p&gt;
  &lt;p id=&quot;2AQM&quot;&gt;Теперь нужно открыть &lt;strong&gt;терминал&lt;/strong&gt; (это место, где вы будете вводить команды).&lt;/p&gt;
  &lt;pre id=&quot;WS00&quot;&gt;На Windows:
    Нажмите Win + R, введите cmd и нажмите Enter.
На macOS:
    Нажмите Cmd + Space, введите Terminal и выберите его.
На Linux:
    Нажмите Ctrl + Alt + T, чтобы открыть терминал.&lt;/pre&gt;
  &lt;p id=&quot;eQ0c&quot;&gt;&lt;strong&gt;3. Проверьте установку Ollama&lt;/strong&gt;&lt;/p&gt;
  &lt;p id=&quot;PoDS&quot;&gt;Чтобы убедиться, что Ollama установлен правильно, введите в терминале команду:&lt;/p&gt;
  &lt;pre id=&quot;c4qB&quot;&gt;ollama -v&lt;/pre&gt;
  &lt;p id=&quot;ykBf&quot;&gt;Если все установлено правильно, терминал отобразит номер версии программы, например:&lt;/p&gt;
  &lt;pre id=&quot;twn8&quot;&gt;ollama version is 0.5.4&lt;/pre&gt;
  &lt;p id=&quot;8mnI&quot;&gt;&lt;strong&gt;4. Загрузите  большую языковую модель&lt;/strong&gt;&lt;/p&gt;
  &lt;p id=&quot;2QxY&quot;&gt;Теперь, когда Ollama установлен, можно загрузить нужную модель (например, gemma2:2b). Полный список доступных моделей и их размер можно посмотреть в разделе &lt;a href=&quot;https://ollama.com/models&quot; target=&quot;_blank&quot;&gt;Models&lt;/a&gt;.&lt;/p&gt;
  &lt;p id=&quot;b2gv&quot;&gt;В терминале введите команду:&lt;/p&gt;
  &lt;pre id=&quot;trFj&quot;&gt;ollama run gemma2:2b&lt;/pre&gt;
  &lt;p id=&quot;jH2y&quot;&gt;Это начнет скачивание модели с 2 миллиардами параметров (эта версия подходит для компьютеров с &lt;strong&gt;8 Гб ОЗУ&lt;/strong&gt;). Модель весит около &lt;strong&gt;1.6 Гб&lt;/strong&gt;, но убедитесь, что у вас достаточно свободного места на диске.&lt;/p&gt;
  &lt;figure id=&quot;ItTY&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img4.teletype.in/files/b4/95/b4951570-e05c-4f27-aaef-f8d33d2f08fe.png&quot; width=&quot;1268&quot; /&gt;
    &lt;figcaption&gt;Пример процесса скачивания файла модели&lt;/figcaption&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;y9pg&quot;&gt;&lt;strong&gt;5. Запустите модель&lt;/strong&gt;&lt;/p&gt;
  &lt;p id=&quot;0RnM&quot;&gt;После того как модель загрузится, она автоматически запустится локально на вашем компьютере. &lt;/p&gt;
  &lt;figure id=&quot;0si6&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img4.teletype.in/files/f4/08/f40861df-fcd2-4652-b104-f1a16bd4daa4.png&quot; width=&quot;1268&quot; /&gt;
    &lt;figcaption&gt;Пример завершения загрузки модели и начала работы с ней&lt;/figcaption&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;QHBQ&quot;&gt;Вы сможете начать с ней общаться прямо в терминале!&lt;/p&gt;
  &lt;p id=&quot;6XqR&quot;&gt;Например, попробуйте ввести запрос:&lt;/p&gt;
  &lt;pre id=&quot;mih3&quot;&gt;Could you please explain what People Analytics is?&lt;/pre&gt;
  &lt;p id=&quot;R8pW&quot;&gt;&lt;strong&gt;Модель должна ответить:&lt;/strong&gt;&lt;/p&gt;
  &lt;figure id=&quot;2ZKe&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img4.teletype.in/files/3a/f8/3af83cd7-f5cc-4d83-bb4f-26f5968467a0.png&quot; width=&quot;1674&quot; /&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;BDm8&quot;&gt;&lt;strong&gt;Что еще важно знать?&lt;/strong&gt;&lt;br /&gt;Посмотрите в справке основные команды:&lt;/p&gt;
  &lt;figure id=&quot;rbyb&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img3.teletype.in/files/aa/95/aa9553b3-ea05-4d8b-94aa-fe1909519a40.png&quot; width=&quot;1268&quot; /&gt;
    &lt;figcaption&gt;Команды работы с моделями&lt;/figcaption&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;looi&quot;&gt;&lt;strong&gt;Что делать, если нужно больше памяти?&lt;/strong&gt;&lt;/p&gt;
  &lt;p id=&quot;JpIj&quot;&gt;Если вы хотите использовать более крупную модель с большим количеством параметров (например, с 30 или 70 миллиардами параметров), вам понадобится больше видеопамяти (VRAM). Для таких моделей лучше использовать мощные графические процессоры.&lt;/p&gt;
  &lt;p id=&quot;6Az0&quot;&gt;&lt;strong&gt;Преимущества локальной установки&lt;/strong&gt;&lt;/p&gt;
  &lt;ul id=&quot;0QhD&quot;&gt;
    &lt;li id=&quot;JIkP&quot;&gt;&lt;strong&gt;Конфиденциальность:&lt;/strong&gt; Все ваши запросы остаются на вашем компьютере, и данные не отправляются на серверы.&lt;/li&gt;
    &lt;li id=&quot;OkbF&quot;&gt;&lt;strong&gt;Оффлайн доступ: &lt;/strong&gt;Модель будет работать без постоянного интернета.&lt;/li&gt;
    &lt;li id=&quot;OnrU&quot;&gt;&lt;strong&gt;Гибкость:&lt;/strong&gt; Вы можете настроить модель и использовать ее для любых задач, включая программирование, обучение и другие потребности.&lt;/li&gt;
  &lt;/ul&gt;
  &lt;p id=&quot;hRBg&quot;&gt;Теперь вы можете запускать большие языковые модели  на своем компьютере. Это позволяет вам использовать возможности ИИ без необходимости полагаться на облачные сервисы и беспокоиться о конфиденциальности данных.&lt;/p&gt;
  &lt;p id=&quot;fG3h&quot;&gt;Следующий пост я напишу о том, как использовать &lt;strong&gt;локальную LLM в R (RStudio)&lt;/strong&gt;.&lt;/p&gt;

</content></entry><entry><id>people_analytics:eNpQcNcfQ5N</id><link rel="alternate" type="text/html" href="https://teletype.in/@people_analytics/eNpQcNcfQ5N?utm_source=teletype&amp;utm_medium=feed_atom&amp;utm_campaign=people_analytics"></link><title>Почему в визуализации должно быть мало цветов</title><published>2022-08-30T19:06:59.294Z</published><updated>2022-08-30T19:23:36.064Z</updated><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://img3.teletype.in/files/e2/88/e2883bc2-53ae-43e5-ba2c-0605c511b545.png"></media:thumbnail><category term="vizualizaciya-dannyh" label="Визуализация данных"></category><tt:hashtag>визуализация_данных</tt:hashtag><tt:hashtag>цвет</tt:hashtag><tt:hashtag>графики</tt:hashtag><tt:hashtag>предвнимательные_признаки</tt:hashtag><summary type="html">&lt;img src=&quot;https://img1.teletype.in/files/4d/70/4d70ceb4-156b-43d3-95b4-162b2b95c20f.png&quot;&gt;Видно, Бог ‒ художник, иначе зачем столько цветов.</summary><content type="html">
  &lt;tt-tags id=&quot;A6O4&quot;&gt;
    &lt;tt-tag name=&quot;визуализация_данных&quot;&gt;#визуализация_данных&lt;/tt-tag&gt;
    &lt;tt-tag name=&quot;цвет&quot;&gt;#цвет&lt;/tt-tag&gt;
    &lt;tt-tag name=&quot;графики&quot;&gt;#графики&lt;/tt-tag&gt;
    &lt;tt-tag name=&quot;предвнимательные_признаки&quot;&gt;#предвнимательные_признаки&lt;/tt-tag&gt;
  &lt;/tt-tags&gt;
  &lt;p id=&quot;lXwY&quot; data-align=&quot;right&quot;&gt;&lt;em&gt;Видно, Бог ‒ художник, иначе зачем столько цветов.&lt;/em&gt;&lt;/p&gt;
  &lt;p id=&quot;CsGu&quot; data-align=&quot;right&quot;&gt;Из фильма «Игры разума»&lt;/p&gt;
  &lt;p id=&quot;m61Y&quot; data-align=&quot;right&quot;&gt;&lt;em&gt;А наша жизнь то радуга, то зебра,&lt;/em&gt;&lt;/p&gt;
  &lt;p id=&quot;61u9&quot; data-align=&quot;right&quot;&gt;&lt;em&gt;То черно-белая, то краски через край...&lt;/em&gt;&lt;/p&gt;
  &lt;p id=&quot;AiRD&quot; data-align=&quot;right&quot;&gt;Цвета (С) Окулова Мария&lt;/p&gt;
  &lt;p id=&quot;znwx&quot;&gt;При создании визуализации мы хотим, чтобы ключевая идея нашего сообщения была понятна нашей целевой аудитории. Как правило, &lt;strong&gt;мы ограничены во времени в борьбе за внимание аудитории&lt;/strong&gt;, поэтому стараемся выделить самое главное в визуализации – в нашей истории, основанной на данных.&lt;/p&gt;
  &lt;p id=&quot;ypF0&quot;&gt;&lt;strong&gt;Цвет&lt;/strong&gt; – один из многих инструментов, помогающих нам достичь этой цели, и один из лучших, который у нас есть. Эффективность использования цвета объясняется тем, что люди естественным образом видят цветовые различия объектов в визуальном поле, особенно когда один цвет заметно отличается от других.&lt;/p&gt;
  &lt;p id=&quot;QtVY&quot;&gt;В этой теме мы рассмотрим, почему визуальная коммуникация становится намного проще и эффективнее, когда мы &lt;strong&gt;используем цвет экономно и целенаправленно&lt;/strong&gt;.&lt;/p&gt;
  &lt;h3 id=&quot;Vvfz&quot;&gt;Об особенностях зрительного восприятия и признаках, привлекающих внимание&lt;/h3&gt;
  &lt;p id=&quot;MiFJ&quot;&gt;Согласно исследованиям когнитивных психологов, большая часть обработки информации в реальном времени происходит в мозге на автоматизированном (предвнимательном, досознательном) этапе. Процессы сознания развиваются медленнее и охватывают далеко не всю информацию, перерабатываемую мозгом. Британский психолог Энн Трисман предложила аттентивную теорию интеграции признаков, известную также как &lt;strong&gt;концепция двух фаз зрительного восприятия: &lt;/strong&gt;&lt;em&gt;предвнимательной&lt;/em&gt; и &lt;em&gt;фокальной&lt;/em&gt;. В предвнимательной фазе обработка зрительных ощущений происходит одновременно (в отношении всех элементов визуального поля) и автоматически (без фокусировки внимания). В фокальной фазе обработка зрительных ощущений осуществляется с концентрацией внимания и последовательно (в каждый момент времени только в отношении одного элемента визуального поля). На предвнимательной стадии обработки стимулов элементарные предвнимательные признаки (&lt;em&gt;preattentive attributes&lt;/em&gt;) или стимулы, такие как размер, ориентация, цвет обрабатываются автоматически и одновременно, без участия сознания. Иными словами, превнимательная обработка – это непосредственный когнитивный опыт обработки визуального мира &lt;strong&gt;ещё до того, как наш мозг осознает то, что мы видели&lt;/strong&gt;. Это происходит за миллисекунды.&lt;/p&gt;
  &lt;p id=&quot;PxNK&quot;&gt;&lt;strong&gt;Видео «Предвнимание и внимание»&lt;/strong&gt;&lt;/p&gt;
  &lt;figure id=&quot;ZnWy&quot; class=&quot;m_original&quot; data-caption-align=&quot;center&quot;&gt;
    &lt;img src=&quot;https://img1.teletype.in/files/4d/70/4d70ceb4-156b-43d3-95b4-162b2b95c20f.png&quot; width=&quot;574&quot; /&gt;
    &lt;figcaption&gt;Психолог Игорь Уточкин об особенностях зрительного восприятия, фокальном внимании и теории интеграции признаков.&lt;/figcaption&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;cKcI&quot;&gt;&lt;strong&gt;&lt;em&gt;Видео по ссылке&lt;/em&gt;: &lt;/strong&gt;&lt;a href=&quot;https://postnauka.ru/video/53949&quot; target=&quot;_blank&quot;&gt;https://postnauka.ru/video/53949&lt;/a&gt;&lt;/p&gt;
  &lt;p id=&quot;21Uq&quot;&gt;&lt;em&gt;Почему наше зрительное восприятие настолько сильно ограничено? Как разделяются предвнимание и фокальное внимание? В чем заключается теория интеграции признаков, и как она объясняет феномены, связанные со зрительным поиском объектов в окружении?&lt;/em&gt;&lt;/p&gt;
  &lt;figure id=&quot;fxVV&quot; class=&quot;m_original&quot; data-caption-align=&quot;center&quot;&gt;
    &lt;img src=&quot;https://img3.teletype.in/files/a5/3c/a53cb604-7d9b-482c-ad79-6f4f1780cc8e.png&quot; width=&quot;525&quot; /&gt;
    &lt;figcaption&gt;Различные виды предвнимательных признаков (атрибутов, привлекающих внимание) &lt;/figcaption&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;9gwh&quot;&gt;В первую очередь мы видим то, что выделяется. Наш взгляд сразу падает на изменения и различия, такие как уникальные цвета, ориентация, размер, форма, кластеры или отклонения.&lt;/p&gt;
  &lt;h3 id=&quot;nJQq&quot;&gt;Цвет привлекает внимание&lt;/h3&gt;
  &lt;p id=&quot;sCz6&quot;&gt;Оттенок или цвет – это один из самых мощных предвнимательных признаков, который очень эффективен при визуализации данных, но слишком часто им пользуются небрежно, чрезмерно или случайным образом в графиках (например, ограничиваясь вариантом, предложенным используемым инструментом визуализации). Вместо этого &lt;strong&gt;цвет должен применяться целенаправленно для передачи ключевых моментов&lt;/strong&gt; внутри вашей диаграммы.&lt;/p&gt;
  &lt;p id=&quot;10Q1&quot;&gt;Например, автор визуализации хочет привлечь внимание, поэтому решает использовать много цветов:&lt;/p&gt;
  &lt;figure id=&quot;sLnc&quot; class=&quot;m_original&quot;&gt;
    &lt;img src=&quot;https://img4.teletype.in/files/3d/9e/3d9e6116-7001-45f7-9001-a327c91efe32.png&quot; width=&quot;498&quot; /&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;PfnX&quot;&gt;А как на самом деле видят пользователи такие графики с множеством цветов? Примерно вот так:&lt;/p&gt;
  &lt;figure id=&quot;7kSZ&quot; class=&quot;m_original&quot;&gt;
    &lt;img src=&quot;https://img3.teletype.in/files/64/38/6438b671-d931-4d8c-9b6a-a86d330add95.png&quot; width=&quot;526&quot; /&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;OXvs&quot;&gt;Цвет бросается в глаза, это захватывает. Но в то же время может затруднить понимание смысла визуализации. &lt;strong&gt;Чем больше цветов, тем больше сигналов, но и информационного шума тоже больше.&lt;/strong&gt; Выделить то, что действительно важно, становится сложнее. В данном случае цвет не выполняет свою функцию – &lt;strong&gt;разделения сигнала и шума&lt;/strong&gt;, а только усложняет восприятие и зрительный поиск у пользователей. Они задаются вопросами: что означают все эти цвета? Куда смотреть в первую очередь? Иными словами, используйте цвет стратегически. Не используйте цвет, чтобы сделать что-то красочное и запоминающееся радугой цветов, скорее используйте цвет экономно и разумно, чтобы привлечь внимание вашей аудитории туда, где и куда вы хотите.&lt;/p&gt;
  &lt;p id=&quot;bZ3s&quot;&gt;Цвет может направлять внимание, то есть он предоставляет какую-то информацию об объектах в зрительном поле до того, как на них будет направлено внимание, причем эта информация используется для определения того, куда в первую очередь следует направить внимание. Именно этого мы добиваемся при создании визуализации данных – &lt;strong&gt;направление и управление вниманием нашей аудитории в процессе визуальной коммуникации&lt;/strong&gt;.&lt;/p&gt;
  &lt;h3 id=&quot;X1LX&quot;&gt;Цвет сигнализирует, где искать/куда смотреть&lt;/h3&gt;
  &lt;p id=&quot;MkVJ&quot;&gt;Когда цвет используется стратегически, он может помочь пользователям заметить важные детали, которые в противном случае они могли бы не увидеть. Если цвет не несет смысловой нагрузки или цветов очень много, то визуализация будет восприниматься тяжело. Например, решите задачу зрительного поиска – &lt;strong&gt;найдите уникальный цвет:&lt;/strong&gt;&lt;/p&gt;
  &lt;figure id=&quot;dCDE&quot; class=&quot;m_original&quot; data-caption-align=&quot;right&quot;&gt;
    &lt;img src=&quot;https://img2.teletype.in/files/5d/7a/5d7a392c-3aec-4c77-acc4-18cd79d67b4c.png&quot; width=&quot;172&quot; /&gt;
    &lt;figcaption&gt;Ответ: бирюзовый&lt;/figcaption&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;zWMg&quot;&gt;А здесь?&lt;/p&gt;
  &lt;figure id=&quot;HeZa&quot; class=&quot;m_original&quot; data-caption-align=&quot;right&quot;&gt;
    &lt;img src=&quot;https://img4.teletype.in/files/39/7a/397a3a30-ca5c-423b-bfff-183a3fae79d8.png&quot; width=&quot;169&quot; /&gt;
    &lt;figcaption&gt;Ответ: фиолетовый&lt;/figcaption&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;uNmt&quot;&gt;В квадрате ниже цвет уже найти проще за счет группировки (объекты, имеющие одинаковый цвет воспринимаются как связанные или принадлежащие к одной группе):&lt;/p&gt;
  &lt;figure id=&quot;1M0F&quot; class=&quot;m_original&quot; data-caption-align=&quot;right&quot;&gt;
    &lt;img src=&quot;https://img4.teletype.in/files/be/7c/be7c67bd-175d-41e7-be20-3338e78f2a51.png&quot; width=&quot;169&quot; /&gt;
    &lt;figcaption&gt;Ответ: зеленый&lt;/figcaption&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;WrTE&quot;&gt;Другой пример, иллюстрирующий важную функцию цвета – &lt;strong&gt;цветовой акцент&lt;/strong&gt; (внимание на определенной точке данных из всех точек данных). Подсчитайте количество восьмерок в каждом наборе чисел:&lt;/p&gt;
  &lt;figure id=&quot;GG9R&quot; class=&quot;m_original&quot;&gt;
    &lt;img src=&quot;https://img1.teletype.in/files/4a/fd/4afd18d9-611d-45b6-9175-890981f446bd.png&quot; width=&quot;599&quot; /&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;RMJB&quot;&gt;Как вы заметили, вам проще было подсчитать восьмерки в центральном наборе чисел, а в правом – цвет больше несет шум, чем сигнал. В первом наборе найти исходно число значительно труднее и требует определенных усилий, то есть возрастает когнитивная нагрузка на пользователя.&lt;/p&gt;
  &lt;p id=&quot;im3X&quot;&gt;Как использовать цвет для выделения определенной точки данных (среза данных)? Большинство графических форм имеют нейтральный цвет (серый), а точка интереса (категория данных) – &lt;strong&gt;фиолетовый&lt;/strong&gt;, поэтому внимание сразу же сосредотачивается на частях, которые выделяются:&lt;/p&gt;
  &lt;figure id=&quot;UBmI&quot; class=&quot;m_original&quot;&gt;
    &lt;img src=&quot;https://img4.teletype.in/files/75/9f/759f5d17-2307-4941-95b5-8fd285f5234a.png&quot; width=&quot;864&quot; /&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;ISY8&quot;&gt;&lt;strong&gt;Цветовой акцент&lt;/strong&gt; – это то, что помогает сделать визуальный акцент на определенном срезе данных и выделить его из всей совокупности данных. Если для всей визуализации используется серый цвет, то выбирайте, например, &lt;strong&gt;синий&lt;/strong&gt; для создания цветового акцента на необходимой категории данных (или нескольких категориях данных).&lt;/p&gt;
  &lt;p id=&quot;Y1KH&quot;&gt;Пример визуализации с цветовым акцентом:&lt;/p&gt;
  &lt;figure id=&quot;myOc&quot; class=&quot;m_original&quot;&gt;
    &lt;img src=&quot;https://img4.teletype.in/files/b7/95/b795c988-4cc9-4fe5-83b2-a561e082a3a0.png&quot; width=&quot;486&quot; /&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;NeLw&quot;&gt;&lt;strong&gt;Серый цвет – ваш друг.&lt;/strong&gt; Выбор оттенков серого в качестве базового (основного) объясняется тем, что контраст между ним и другими цветами ярче, а при необходимости черно-белой распечатки графика – контраст сохранится. Серый цвет может быть разным:&lt;/p&gt;
  &lt;figure id=&quot;Q6hD&quot; class=&quot;m_original&quot;&gt;
    &lt;img src=&quot;https://img2.teletype.in/files/52/f9/52f9a4f3-eae6-4c02-9a3f-d9190dd25f44.png&quot; width=&quot;435&quot; /&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;q5lR&quot;&gt;Он создает информационную иерархию. Мы воспринимаем информацию, обозначенную серым, как справочные данные или как второстепенную по отношению к представленной в цвете информации.&lt;/p&gt;
  &lt;figure id=&quot;6UgF&quot; class=&quot;m_original&quot;&gt;
    &lt;img src=&quot;https://img1.teletype.in/files/c6/b6/c6b6aa0b-81e4-44a0-ae23-3bd966274768.png&quot; width=&quot;482&quot; /&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;jCrZ&quot;&gt;Серый цвет обеспечивает нам контекст, не отвлекая от основной идеи и не обращая на себя слишком много внимания.&lt;/p&gt;
  &lt;h3 id=&quot;bjCe&quot;&gt;Экономное (разумное) и стратегическое использование цветов&lt;/h3&gt;
  &lt;p id=&quot;7r4Z&quot;&gt;Выделение цветом наиболее эффективно для визуального поиска, когда задействовано всего несколько цветов. &lt;strong&gt;Чем меньше цветов, тем быстрее их можно найти.&lt;/strong&gt; Почему так происходит? Когда на графике много цветов, то они теряют свойства привлекающего признака на предвнимательной стадии обработки зрительной информации.&lt;/p&gt;
  &lt;p id=&quot;w1VG&quot;&gt;Полезным приёмом является увеличение насыщенности цвета интересующей области и уменьшение насыщенности для всего остального. Ключ в том, чтобы понять тип данных, которые мы визуализируем и как цвет может кодировать эти данные и может улучшить понимание графика вашей аудиторией. Каждый раз сомневайтесь при добавлении нового цвета в вашу палитру цветов для графика: зачем мне необходимо показать различия цветом? Можно ли объединить категории данных в одну группу, обозначаемую одним цветом? Эксперты считают, что мы не можем различать более восьми цветов одновременно. Это связано с объемом нашей кратковременной памяти (5–7 цветов будет достаточно).&lt;/p&gt;
  &lt;p id=&quot;SA0j&quot;&gt;&lt;strong&gt;Пример палитры цветов The Economist&lt;/strong&gt;&lt;/p&gt;
  &lt;figure id=&quot;FcLP&quot; class=&quot;m_original&quot;&gt;
    &lt;img src=&quot;https://img4.teletype.in/files/bc/ee/bcee4130-f31a-48ed-89e4-6dd21feb900c.png&quot; width=&quot;436&quot; /&gt;
  &lt;/figure&gt;
  &lt;figure id=&quot;cFeg&quot; class=&quot;m_column&quot; data-caption-align=&quot;center&quot;&gt;
    &lt;img src=&quot;https://img4.teletype.in/files/3b/15/3b154538-f2dc-464b-b801-0313c257b64a.png&quot; width=&quot;488&quot; /&gt;
    &lt;figcaption&gt;Используется всего 5–6 цветов для разных типов графиков из этой общей палитры&lt;/figcaption&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;fnvG&quot;&gt;А если необходимо визуализировать количественные данные? Степень интенсивности конкретного цвета может легко ассоциироваться с количественными значениями – чем она выше, тем больше значение, и наоборот. Нам совершенно не обязательно для каждого количественного значения подбирать цвет, когда разнообразие цветов (все цвета радуги) скорее будет отвлекать, чем помогать. Используйте цветовой круг Иттена для побора цветов, которые хорошо сочетаются друг с другом. Полезный мнемонический приём для легкого запоминания основного правила работы с кругом: «&lt;em&gt;Все цвета друзья своих соседей и любителей их противоположностей» &lt;/em&gt;(Марк Шагал, художник, один из ярких представителей художественного авангарда XX века).&lt;/p&gt;
  &lt;p id=&quot;a15M&quot;&gt;&lt;strong&gt;Выбор цветов ограничивается используемым фоном для графика.&lt;/strong&gt; Цвета могут восприниматься по-разному в зависимости от фона. Для эффективной поддержки визуального поиска цвета фона и других символов и графических элементов так же важны, как и искомый символ (графический элемент). Когда мы визуально ищем объект определенного цвета, наш мозг настраивает наши зрительные системы так, чтобы нейроны, чувствительные к этому оттенку, «кричали громче, чем нейроны, настроенные на другие цвета». Эффект зависит как от других цветных объектов на графике, так и от цвета фона. Прочитайте контекстную вставку о том, как используется цвет для фона в разных компаниях.&lt;/p&gt;
  &lt;p id=&quot;BF0Z&quot;&gt;&lt;em&gt;Какой цвет фона используется крупными медиа и организациями для визуализаций?&lt;/em&gt;&lt;/p&gt;
  &lt;figure id=&quot;Dii5&quot; class=&quot;m_original&quot; data-caption-align=&quot;center&quot;&gt;
    &lt;img src=&quot;https://img1.teletype.in/files/c3/52/c352205c-23f6-49d7-a405-789b7edb03aa.png&quot; width=&quot;703&quot; /&gt;
    &lt;figcaption&gt;Диаграмма рассеяния, показывающая, какие цвета для фона используются крупными медиа и организациями&lt;/figcaption&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;jfIH&quot;&gt;Как только вы станете более уверены в выборе цветов для визуализаций, то использование разных цветов (кроме белого) для фона может показаться привлекательной идеей. Фон для графика – это элемент визуального стиля и «проводник» бренда, повышающий его узнаваемость. Например, легко узнаются графики, которые публикует The Economist или фоновый цвет графиков Financial Times:&lt;/p&gt;
  &lt;p id=&quot;iyfo&quot;&gt;&lt;strong&gt;вариант 1&lt;/strong&gt; &lt;a href=&quot;https://www.datawrapper.de/_/afgI0/&quot; target=&quot;_blank&quot;&gt;https://www.datawrapper.de/_/afgI0/&lt;/a&gt; &lt;/p&gt;
  &lt;p id=&quot;4yYl&quot;&gt;&lt;strong&gt;вариант 2&lt;/strong&gt; &lt;a href=&quot;https://www.datawrapper.de/_/yzuYH/&quot; target=&quot;_blank&quot;&gt;https://www.datawrapper.de/_/yzuYH/&lt;/a&gt;&lt;/p&gt;
  &lt;p id=&quot;U2uW&quot;&gt;В зависимости от фона будут по-разному восприниматься цвета на графиках и визуализация целиком. Фон чаще всего очень яркий и ненасыщенный, чтобы можно было подобрать контрастные цвета для элементов графиков. У многих что-то теплое и светлое (пастельные желтый или оранжевый). Желательно, чтобы фон был ненасыщенным и либо очень ярким (белый, светло-серый, светло-желтый), либо очень тёмным (черный, тёмно-серый). Для большинства графиков я использую светло-светло-серый (&lt;a href=&quot;https://www.color-hex.com/color/fefefe&quot; target=&quot;_blank&quot;&gt;#fefefe&lt;/a&gt;, в модели цвета RGB &lt;strong&gt;#fefefe&lt;/strong&gt; составляет 99.61% красного, 99.61% зеленого и 99.61%), который выглядит как белый, но не такой яркий. &lt;strong&gt;Источник:&lt;/strong&gt; &lt;a href=&quot;https://blog.datawrapper.de/background-color-of-data-visualizations/&quot; target=&quot;_blank&quot;&gt;https://blog.datawrapper.de/background-color-of-data-visualizations/&lt;/a&gt;&lt;/p&gt;
  &lt;p id=&quot;Zw8v&quot;&gt;Количество используемых цветов определяется необходимостью быть последовательным. В некоторых случаях последовательное использование цветов является обязательным для снижения когнитивной нагрузки на вашу аудиторию. Они тратят время на запоминание того, что означает отдельный цвет на графике и ожидают, что этот же цвет будет использоваться в этом же значении далее. Посмотрите ниже &lt;strong&gt;пример непоследовательного применения цветов&lt;/strong&gt;, где одни и те же цвета кодируют совершенно разные категории данных.&lt;/p&gt;
  &lt;figure id=&quot;iLnx&quot; class=&quot;m_original&quot; data-caption-align=&quot;center&quot;&gt;
    &lt;img src=&quot;https://img2.teletype.in/files/d7/9a/d79a7d37-3c3c-433d-96bb-da82900434b0.png&quot; width=&quot;459&quot; /&gt;
    &lt;figcaption&gt;Пример непоследовательного применения цветов&lt;/figcaption&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;p8s8&quot;&gt;Таким образом, отдельные цвета должны представлять отдельные данные, а одинаковые цвета должны обозначать одинаковые данные. Старайтесь не вводить вашу аудиторию в заблуждение резкой сменой цветов и того, что они обозначают. Цвет и тематика не должны вызывать повышенной когнитивной нагрузки или когнитивного диссонанса.&lt;/p&gt;
  &lt;p id=&quot;CqLl&quot;&gt;Следует также не забывать о том, что &lt;strong&gt;не все люди видят цвета одинаково!&lt;/strong&gt; Помните о людях с особенностями цветоощущения!&lt;/p&gt;
  &lt;figure id=&quot;lhtG&quot; class=&quot;m_original&quot;&gt;
    &lt;img src=&quot;https://img4.teletype.in/files/f7/4c/f74ca768-38d3-4a46-858a-90c59d8371bb.png&quot; width=&quot;345&quot; /&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;fJEd&quot;&gt;Цвета вызывают у нас определенные эмоции и ассоциации, поэтому это также влияет на то, какие цвета войдут в вашу основную палитру для графика. В разных культурах цвет несет разную коннотативную нагрузку.&lt;/p&gt;
  &lt;p id=&quot;6Uoh&quot;&gt;&lt;strong&gt;Цвет настроения синий&lt;/strong&gt;&lt;/p&gt;
  &lt;figure id=&quot;6ak1&quot; class=&quot;m_original&quot; data-caption-align=&quot;center&quot;&gt;
    &lt;img src=&quot;https://img4.teletype.in/files/30/3c/303c2fc4-14cc-42ad-beeb-0f3c97a69dd3.png&quot; width=&quot;407&quot; /&gt;
    &lt;figcaption&gt;Круговая диаграмма, которая показывает эмоциональное восприятие цвета в разных культурах. &lt;/figcaption&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;nxXK&quot;&gt;Удивительно, насколько по-разному мы воспринимаем мир. К примеру, в Азии и Восточной Европе счастье – красного цвета. Американцы видят его белым, индусы ассоциируют с зеленым, а в Северной Америке –  с желтым цветом. На графике представлены 84 эмоции (ассоциации). &lt;strong&gt;Источник:&lt;/strong&gt; &lt;a href=&quot;https://informationisbeautiful.net/visualizations/colours-in-cultures/&quot; target=&quot;_blank&quot;&gt;https://informationisbeautiful.net/visualizations/colours-in-cultures/&lt;/a&gt;&lt;/p&gt;
  &lt;p id=&quot;8vlG&quot;&gt;Итак, есть несколько важных аспектов &lt;strong&gt;применения цвета для визуализации данных, которые необходимо учитывать:&lt;/strong&gt; &lt;/p&gt;
  &lt;p id=&quot;3hAD&quot;&gt;1. использовать цвет умеренно, &lt;/p&gt;
  &lt;p id=&quot;0pnF&quot;&gt;2. последовательно, &lt;/p&gt;
  &lt;p id=&quot;PWJU&quot;&gt;3. учитывать возможные проблемы восприятия цветов и эмоционального воздействия цвета,&lt;/p&gt;
  &lt;p id=&quot;DXpK&quot;&gt;4. учитывать цвета фона для визуализации.&lt;/p&gt;
  &lt;p id=&quot;UHTd&quot;&gt;&lt;strong&gt;Понравилось? Поддержите автора:&lt;/strong&gt;&lt;/p&gt;
  &lt;figure id=&quot;ilt7&quot; class=&quot;m_column&quot;&gt;
    &lt;iframe src=&quot;https://yoomoney.ru/quickpay/shop-widget?writer=seller&amp;default-sum=300&amp;button-text=14&amp;payment-type-choice=on&amp;successURL=https%3A%2F%2Fteletype.in%2F%40people_analytics&amp;quickpay=shop&amp;account=41001358931204&amp;targets=%D0%9F%D0%B5%D1%80%D0%B5%D0%B2%D0%BE%D0%B4%20%D0%BF%D0%BE%20%D0%BA%D0%BD%D0%BE%D0%BF%D0%BA%D0%B5&amp;&quot;&gt;&lt;/iframe&gt;
    &lt;figcaption&gt;Донаты&lt;/figcaption&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;ECTQ&quot;&gt;&lt;strong&gt;Мой телеграм-канал:&lt;/strong&gt; &lt;a href=&quot;https://t.me/People_Analytics&quot; target=&quot;_blank&quot;&gt;https://t.me/People_Analytics&lt;/a&gt;&lt;br /&gt;&lt;em&gt;People analytics is a data-driven approach to managing people at work || Канал про HR-аналитику: оценка персонала, психометрика, использование R для анализа и визуализации HR-данных.&lt;/em&gt;&lt;/p&gt;

</content></entry><entry><id>people_analytics:bEW7aF9EkkL</id><link rel="alternate" type="text/html" href="https://teletype.in/@people_analytics/bEW7aF9EkkL?utm_source=teletype&amp;utm_medium=feed_atom&amp;utm_campaign=people_analytics"></link><title>Визуализация рейтинга кандидатов</title><published>2022-08-13T01:38:01.942Z</published><updated>2022-08-14T22:40:50.538Z</updated><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://img4.teletype.in/files/34/e7/34e7a71f-5445-493d-af26-e68a9c161fc8.png"></media:thumbnail><category term="r" label="R"></category><tt:hashtag>визуализация_данных</tt:hashtag><tt:hashtag>рейтинги</tt:hashtag><tt:hashtag>точечные_графики</tt:hashtag><tt:hashtag>график_улей</tt:hashtag><tt:hashtag>r</tt:hashtag><summary type="html">&lt;img src=&quot;https://img3.teletype.in/files/e4/1d/e41dab90-06e9-4e19-82f6-dc388738e847.png&quot;&gt;Сейчас завершается приёмная кампания в вузы. Как правило, результаты конкурсных испытаний представлены на сайтах учебных заведений в виде таблиц, в которых заявители (поступающие на ту или иную специальность) расположены порядке убывания их конкурсного балла. Таблицы — один из распространенных способов представления данных. </summary><content type="html">
  &lt;tt-tags id=&quot;8BPd&quot;&gt;
    &lt;tt-tag name=&quot;визуализация_данных&quot;&gt;#визуализация_данных&lt;/tt-tag&gt;
    &lt;tt-tag name=&quot;рейтинги&quot;&gt;#рейтинги&lt;/tt-tag&gt;
    &lt;tt-tag name=&quot;точечные_графики&quot;&gt;#точечные_графики&lt;/tt-tag&gt;
    &lt;tt-tag name=&quot;график_улей&quot;&gt;#график_улей&lt;/tt-tag&gt;
    &lt;tt-tag name=&quot;r&quot;&gt;#r&lt;/tt-tag&gt;
  &lt;/tt-tags&gt;
  &lt;p id=&quot;xv8K&quot;&gt;Сейчас завершается приёмная кампания в вузы. Как правило, результаты конкурсных испытаний представлены на сайтах учебных заведений в виде таблиц, в которых заявители (поступающие на ту или иную специальность) расположены порядке убывания их конкурсного балла. Таблицы — один из распространенных способов представления данных. &lt;/p&gt;
  &lt;p id=&quot;n8RT&quot;&gt;Для примера рассмотрим таблицу с конкурсными баллами абитуриентов, поступающих на одно из направлений подготовки (специальность) в магистратуре УрФУ &lt;strong&gt;&lt;a href=&quot;https://magister.urfu.ru/ru/ratings&quot; target=&quot;_blank&quot;&gt;[1]&lt;/a&gt;&lt;/strong&gt;. Отличный повод, чтобы рассказать о визуализации рейтингов кандидатов, хоть и на примере абитуриентов, но это не имеет принципиального значения. &lt;/p&gt;
  &lt;p id=&quot;jQ18&quot;&gt;Так выглядит таблица в разделе «Конкурсные списки»:&lt;/p&gt;
  &lt;figure id=&quot;bmoN&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img3.teletype.in/files/e4/1d/e41dab90-06e9-4e19-82f6-dc388738e847.png&quot; width=&quot;1305&quot; /&gt;
    &lt;figcaption&gt;&lt;strong&gt;Конкурсный балл&lt;/strong&gt; — сумма баллов за вступительное компьютерное тестирование (от 0 до 100 баллов) и индивидуальные достижения абитуриента (от 0 до 20 баллов).&lt;/figcaption&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;Ueq7&quot;&gt;Конечно, не забываем, когда хорошо работают таблицы, а когда графики &lt;strong&gt;&lt;a href=&quot;https://revealthedata.com/blog/all/tablica-ili-grafik-kak-ubedit-zakazchika/&quot; target=&quot;_blank&quot;&gt;[2]&lt;/a&gt;&lt;/strong&gt;. Таблицу можно сделать более удобной и наглядной, убрав всё лишнее &lt;strong&gt;&lt;a href=&quot;https://www.storytellingwithdata.com/blog/2020/9/24/what-is-a-table&quot; target=&quot;_blank&quot;&gt;[3]&lt;/a&gt;&lt;/strong&gt;. Я люблю таблицы, а красивые и аккуратные таблицы — ещё больше. Данный пост не о таблицах (о них в другой раз), а о графиках. &lt;/p&gt;
  &lt;p id=&quot;i8VA&quot;&gt;Мы можем по-разному визуализировать распределение конкурсного рейтинг-балла, а каждый вариант визуализации будет рассказывать свою историю на основе одних и тех же данных, но с разным уровнем детализации и для решения разных задач. Например, можно построить гистограмму распределения конкурсного балла, либо показать распределение в виде пугающих многих ящика с усами (боксплота):&lt;/p&gt;
  &lt;figure id=&quot;qaUe&quot; class=&quot;m_original&quot; data-caption-align=&quot;center&quot;&gt;
    &lt;img src=&quot;https://img3.teletype.in/files/a0/f6/a0f6189a-5089-4f24-9c2d-c5abf9aa445b.png&quot; width=&quot;400&quot; /&gt;
    &lt;figcaption&gt;Классическая гистограмма&lt;/figcaption&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;4bzw&quot;&gt;Ящик с усами (боксплот), пугающий всех своей &amp;quot;непонятностью&amp;quot;:&lt;/p&gt;
  &lt;figure id=&quot;wMmQ&quot; class=&quot;m_original&quot; data-caption-align=&quot;center&quot;&gt;
    &lt;img src=&quot;https://img3.teletype.in/files/26/2d/262d090c-c9d9-4734-9789-cc0bef76b7fb.png&quot; width=&quot;400&quot; /&gt;
    &lt;figcaption&gt;Ящик с усами&lt;/figcaption&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;7FhD&quot;&gt;Помимо боксплотов и различных графиков «семейства» гистограмм, существует много других одномерных графиков. Ранее я писал про преимущества точечных графиков &lt;strong&gt;&lt;a href=&quot;https://t.me/People_Analytics/336&quot; target=&quot;_blank&quot;&gt;[4]&lt;/a&gt;&lt;/strong&gt;. Попробуем представить результаты конкурсных испытаний по одному из произвольных направлений магистратуры в виде точечного графика — &lt;strong&gt;графика-«улей» &lt;/strong&gt;(&lt;em&gt;bee swarm plot&lt;/em&gt; — одномерный точечный график). График-«улей» отражает &lt;em&gt;не только плотность распределения значений выборки, но и то, как расположены сами эти значения&lt;/em&gt; (точки).&lt;em&gt; Каждая точка на графике — индивидуальный результат конкретного абитуриента (кандидата).&lt;/em&gt; При этом точки, представляющие одинаковые результаты (равные конкурсные баллы), не перекрываются на самом графике:&lt;/p&gt;
  &lt;figure id=&quot;EBxG&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img3.teletype.in/files/e3/ce/e3ce798b-2a03-470a-a09a-78d4613868f8.png&quot; width=&quot;975&quot; /&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;tK8R&quot;&gt;Кроме этого, мы можем использовать цвет для кодирования других данных. Например, &lt;strong&gt;зеленые точки&lt;/strong&gt; — заявители, набравшие проходной балл, &lt;strong&gt;коричневые &lt;/strong&gt;— абитуриенты с полупроходным баллом, &lt;strong&gt;серые &lt;/strong&gt;— те, кто не проходит по конкурсу, так как набрали балл ниже проходного. Также мы можем другим цветом (&lt;strong&gt;красным&lt;/strong&gt;) «подсветить» индивидуальный конкурсный балл конкретного абитуриента.&lt;/p&gt;
  &lt;blockquote id=&quot;yWga&quot;&gt;&lt;em&gt;Проходной балл — показатель, от которого зависят шансы абитуриента на поступление и находится в прямой зависимости от плана набора на специальность, количества поданных заявлений, суммы конкурсных баллов каждого из абитуриентов. В случае, если число лиц с одинаковыми баллами (полупроходной балл) превышает количество вакантных мест, часть абитуриентов зачисляется, а часть нет. Приёмная комиссия определяет абитуриентов, у которых есть преимущественное право на зачисление при равном количестве баллов.&lt;/em&gt;&lt;/blockquote&gt;
  &lt;p id=&quot;IF4A&quot;&gt;&lt;strong&gt;Точки создают впечатление индивидуальности&lt;/strong&gt;, чего не могут достичь рейтинг-таблица с конкурсными баллами, гистограмма или боксплот. График-улей позволяет нам сосредоточиться на индивидуальности, когда мы видим каждого человека, а не объединяем людей в столбики или линии, показывая, например, 5-числовую сводку Тьюки (двух крайних значений: максимального и минимального, нижнего и верхнего квартилей и медианы)&lt;strong&gt;&lt;a href=&quot;https://en.wikipedia.org/wiki/Five-number_summary&quot; target=&quot;_blank&quot;&gt;[6]&lt;/a&gt;&lt;/strong&gt;. Наша визуализация в первую очередь рассказывает о людях, а не о данных. У нас получился своеобразный стоп-кадр, или &lt;a href=&quot;https://ru.wikipedia.org/wiki/Фотофиниш&quot; target=&quot;_blank&quot;&gt;фотофиниш&lt;/a&gt;  130 участников, показывающий насколько сильной была «борьба» за 24 бюджетных места. Если вы когда-нибудь участвовали в конкурсе, то знаете, что это не утренняя гимнастика с бегом на месте, когда:&lt;/p&gt;
  &lt;p id=&quot;weub&quot;&gt;«&lt;em&gt;Не страшны дурные вести&lt;br /&gt;Начинаем бег на месте&lt;br /&gt;В выигрыше даже начинающий&lt;br /&gt;Красота, — среди бегущих&lt;br /&gt;Первых нет и отстающих&lt;br /&gt;Бег на месте общепримиряющий&lt;/em&gt;» &lt;/p&gt;
  &lt;p id=&quot;rO7H&quot;&gt;(В. Высоцкий, Утренняя гимнастика, 1978)&lt;/p&gt;
  &lt;p id=&quot;LRz5&quot;&gt;За каждой точкой на графике &lt;em&gt;—&lt;/em&gt; своя судьба и переживания: от горечи поражения до радости победы. Напомню &lt;strong&gt;третью заповедь HR-аналитика &lt;a href=&quot;https://t.me/People_Analytics/150&quot; target=&quot;_blank&quot;&gt;[5]&lt;/a&gt;: &lt;/strong&gt;&lt;/p&gt;
  &lt;blockquote id=&quot;Ys8j&quot;&gt;&lt;strong&gt;«Numbers matter, but remember that there are people behind the numbers»&lt;/strong&gt; [«Числа имеют значение, но помните, что за числами стоят люди»]. &lt;/blockquote&gt;
  &lt;p id=&quot;3SHn&quot;&gt;Поэтому я часто предлагал коллегам исправить те или иные графики. Например, для визуализации результатов оценочных мероприятий мы использовали одномерные точечные графики, которые очень нравились ЛПР за их наглядность и возможность сравнения. В HR-аналитике, как и в оценке персонала, не следует забывать об индивидуальном подходе. Особенно, когда мы визуализируем HR-данные.&lt;/p&gt;
  &lt;h3 id=&quot;9jEt&quot;&gt;&lt;strong&gt;Ссылки:&lt;/strong&gt;&lt;/h3&gt;
  &lt;ol id=&quot;gTfk&quot;&gt;
    &lt;li id=&quot;yHBX&quot;&gt;&lt;a href=&quot;https://magister.urfu.ru/ru/ratings&quot; target=&quot;_blank&quot;&gt;https://magister.urfu.ru/ru/ratings&lt;/a&gt;&lt;/li&gt;
    &lt;li id=&quot;lAem&quot;&gt;&lt;a href=&quot;https://revealthedata.com/blog/all/tablica-ili-grafik-kak-ubedit-zakazchika/&quot; target=&quot;_blank&quot;&gt;https://revealthedata.com/blog/all/tablica-ili-grafik-kak-ubedit-zakazchika/&lt;/a&gt;&lt;/li&gt;
    &lt;li id=&quot;ZCVv&quot;&gt;&lt;a href=&quot;https://www.storytellingwithdata.com/blog/2020/9/24/what-is-a-table&quot; target=&quot;_blank&quot;&gt;https://www.storytellingwithdata.com/blog/2020/9/24/what-is-a-table&lt;/a&gt;&lt;/li&gt;
    &lt;li id=&quot;aQ3D&quot;&gt;&lt;a href=&quot;https://t.me/People_Analytics/336&quot; target=&quot;_blank&quot;&gt;https://t.me/People_Analytics/336&lt;/a&gt;&lt;/li&gt;
    &lt;li id=&quot;2Qn7&quot;&gt;&lt;a href=&quot;https://t.me/People_Analytics/150&quot; target=&quot;_blank&quot;&gt;https://t.me/People_Analytics/150&lt;/a&gt;&lt;/li&gt;
    &lt;li id=&quot;LDYB&quot;&gt;&lt;a href=&quot;https://en.wikipedia.org/wiki/Five-number_summary&quot; target=&quot;_blank&quot;&gt;https://en.wikipedia.org/wiki/Five-number_summary&lt;/a&gt;&lt;/li&gt;
  &lt;/ol&gt;
  &lt;h3 id=&quot;mXaZ&quot;&gt;Код на языке R для воспроизведения графиков:&lt;/h3&gt;
  &lt;p id=&quot;gLwZ&quot;&gt;Исходный файл с данными в формате RDS: &lt;a href=&quot;https://disk.yandex.ru/d/psKfaC6T64yx_A&quot; target=&quot;_blank&quot;&gt;https://disk.yandex.ru/d/psKfaC6T64yx_A&lt;/a&gt;&lt;/p&gt;
  &lt;pre id=&quot;Nt0q&quot; data-lang=&quot;r&quot;&gt;library(tidyverse)
library(glue)
library(ragg)
library(ggbeeswarm)
library(showtext)
# Загружаем данные
rating &amp;lt;- readRDS(&amp;quot;rating.Rds&amp;quot;) # https://disk.yandex.ru/d/psKfaC6T64yx_A
# Гистограмма
ggplot(rating) + 
  geom_histogram(aes(x = &amp;#x60;Сумма конкурсных баллов&amp;#x60;), binwidth = 10) +
  scale_x_continuous(breaks = seq(45,110,10)) + 
  labs(title = &amp;quot;Распределение конкурсного рейтинг-балла&amp;quot;,
       x = &amp;quot;Конкурсный балл&amp;quot;, y = &amp;quot;Частота&amp;quot;) 
# Боксплот
ggplot(rating) + 
  geom_boxplot(aes(y = &amp;#x60;Сумма конкурсных баллов&amp;#x60;)) + 
  scale_x_discrete( ) +
  scale_y_continuous(breaks = seq(45,110,10)) + 
  labs(title = &amp;quot;Распределение конкурсного рейтинг-балла&amp;quot;,
       y = &amp;quot;Конкурсный балл&amp;quot;) +
  coord_flip()
# График-улей
cut_point &amp;lt;- 90 # Полупроходной балл
applicants &amp;lt;- 130
vacancies &amp;lt;- 24
font_add_google(&amp;quot;Istok Web&amp;quot;, family = &amp;quot;Istok Web&amp;quot;)
font &amp;lt;- &amp;quot;Istok Web&amp;quot;
set.seed(123)
ggplot(rating, aes(x = &amp;quot;&amp;quot;, y = &amp;#x60;Сумма конкурсных баллов&amp;#x60;)) +
  geom_hline(yintercept = cut_point, color = &amp;quot;#fb8072&amp;quot;) +
  geom_beeswarm(size = 6, cex = 5,
                colour = rating$col,
                priority = &amp;quot;random&amp;quot;) +
  scale_y_continuous(breaks = c(seq(30, 110,5))) +
  coord_flip() + 
  labs(
    y = &amp;quot;Сумма конкурсных баллов&amp;quot;,
    title = glue(
      &amp;quot;Распределение конкурсного рейтинг-балла\nдля {applicants} заявителей на {vacancies} бюджетных места&amp;quot;),
    subtitle = &amp;quot;&amp;quot;,
    caption = &amp;quot;Источник данных: https://magister.urfu.ru/ru/ratings/\nВизуализация: Юрий Тукачев, 2022&amp;quot;
    
  ) +
  theme_light(base_size = 20, base_family = font) +
  theme(
    panel.background = element_blank(),
    axis.title.y = element_blank(),
    axis.ticks.y = element_blank(),
    panel.border = element_blank(),
    panel.grid = element_blank(),
    axis.title = element_text(size = 18),
    text = element_text(
      family = font,
      color = &amp;quot;#53565A&amp;quot;,
      size = 18
    ),
    plot.title.position = &amp;quot;plot&amp;quot;,
    plot.caption.position = &amp;quot;plot&amp;quot;,
    plot.caption = element_text(
      color = &amp;quot;gray50&amp;quot;,
      size = 13,
      hjust = 1
    ),
    plot.margin = margin(25, 25, 10, 25),
    plot.subtitle = element_markdown(hjust = 0,
                                     # size = rel(0.95), 
                                     family = font),
    plot.title = element_text(
      size = rel(1.3),
      family = font,
      face = &amp;quot;bold&amp;quot;,
      color = &amp;quot;gray20&amp;quot;
    )
  )
# Сохраняем график-улей
ggsave(
  here(&amp;quot;ratings.png&amp;quot;),
  device = agg_png,
  width = 6.5,
  height = 6,
  dpi = 120,
  scale = 1.25
)&lt;/pre&gt;
  &lt;p id=&quot;v39J&quot;&gt;&lt;/p&gt;
  &lt;p id=&quot;czV8&quot;&gt;&lt;strong&gt;Мой телеграм-канал:&lt;/strong&gt; &lt;a href=&quot;https://t.me/People_Analytics&quot; target=&quot;_blank&quot;&gt;https://t.me/People_Analytics&lt;/a&gt;&lt;br /&gt;&lt;em&gt;People analytics is a data-driven approach to managing people at work || Канал про HR-аналитику: оценка персонала, психометрика, использование R для анализа и визуализации HR-данных.&lt;/em&gt;&lt;/p&gt;

</content></entry><entry><id>people_analytics:uHvMrH_lhSM</id><link rel="alternate" type="text/html" href="https://teletype.in/@people_analytics/uHvMrH_lhSM?utm_source=teletype&amp;utm_medium=feed_atom&amp;utm_campaign=people_analytics"></link><title>Аналитика для хантинга аналитиков</title><published>2022-07-02T01:46:10.205Z</published><updated>2022-07-02T21:45:17.840Z</updated><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://img1.teletype.in/files/8a/5e/8a5e501e-e418-4be5-9c83-a11a90768a4b.png"></media:thumbnail><category term="people-analytics" label="people_analytics"></category><tt:hashtag>аналитика</tt:hashtag><tt:hashtag>зарплаты</tt:hashtag><tt:hashtag>дашборд</tt:hashtag><tt:hashtag>визуализация_данных</tt:hashtag><tt:hashtag>рынок_кандидатов</tt:hashtag><tt:hashtag>it</tt:hashtag><tt:hashtag>ggplot2</tt:hashtag><tt:hashtag>r</tt:hashtag><summary type="html">&lt;img src=&quot;https://img4.teletype.in/files/fa/4b/fa4b3bce-55aa-43d6-80a0-dea735b51253.png&quot;&gt;Ранее я уже писал об интерактивном дашборде &quot;Анализ рынка вакансий аналитики и BI&quot; – совместный проект Романа Бунина и Николая Валиотти. Сейчас авторы сделали его в виде карточек по разным направлениям аналитики – удобно сравнить разные профессии (см. Карточки на Табло Паблик). Необходимо учитывать, что это вакансии для Москвы и Питера по данным HH, а зарплаты указаны средними &quot;чистыми&quot;. </summary><content type="html">
  &lt;tt-tags id=&quot;NicW&quot;&gt;
    &lt;tt-tag name=&quot;аналитика&quot;&gt;#аналитика&lt;/tt-tag&gt;
    &lt;tt-tag name=&quot;зарплаты&quot;&gt;#зарплаты&lt;/tt-tag&gt;
    &lt;tt-tag name=&quot;дашборд&quot;&gt;#дашборд&lt;/tt-tag&gt;
    &lt;tt-tag name=&quot;визуализация_данных&quot;&gt;#визуализация_данных&lt;/tt-tag&gt;
    &lt;tt-tag name=&quot;рынок_кандидатов&quot;&gt;#рынок_кандидатов&lt;/tt-tag&gt;
    &lt;tt-tag name=&quot;it&quot;&gt;#it&lt;/tt-tag&gt;
    &lt;tt-tag name=&quot;ggplot2&quot;&gt;#ggplot2&lt;/tt-tag&gt;
    &lt;tt-tag name=&quot;r&quot;&gt;#r&lt;/tt-tag&gt;
  &lt;/tt-tags&gt;
  &lt;p id=&quot;LxSB&quot;&gt;Ранее я &lt;a href=&quot;https://t.me/People_Analytics/110&quot; target=&quot;_blank&quot;&gt;уже писал&lt;/a&gt; об интерактивном &lt;strong&gt;дашборде &amp;quot;&lt;a href=&quot;https://revealthedata.com/examples/hh/&quot; target=&quot;_blank&quot;&gt;Анализ рынка вакансий аналитики и BI&lt;/a&gt;&amp;quot;&lt;/strong&gt; – совместный проект &lt;a href=&quot;https://t.me/revealthedata&quot; target=&quot;_blank&quot;&gt;Романа Бунина&lt;/a&gt; и &lt;a href=&quot;https://t.me/leftjoin&quot; target=&quot;_blank&quot;&gt;Николая Валиотти&lt;/a&gt;. Сейчас авторы сделали его &lt;a href=&quot;https://t.me/revealthedata/491&quot; target=&quot;_blank&quot;&gt;в виде карточек&lt;/a&gt; по разным направлениям аналитики – удобно сравнить разные профессии (см. &lt;a href=&quot;https://public.tableau.com/views/_16292721203710/sheet0?:language=en-US&amp;publish=yes&amp;:display_count=n&amp;:origin=viz_share_link&quot; target=&quot;_blank&quot;&gt;Карточки на Табло Паблик&lt;/a&gt;). Необходимо учитывать, что это вакансии для Москвы и Питера по данным HH, а зарплаты указаны средними &amp;quot;чистыми&amp;quot;. &lt;/p&gt;
  &lt;figure id=&quot;tBJQ&quot; class=&quot;m_retina&quot;&gt;
    &lt;img src=&quot;https://img4.teletype.in/files/fa/4b/fa4b3bce-55aa-43d6-80a0-dea735b51253.png&quot; width=&quot;259.5&quot; /&gt;
    &lt;figcaption&gt;&lt;a href=&quot;https://public.tableau.com/views/_16292721203710/sheet0?:language=en-US&amp;publish=yes&amp;:display_count=n&amp;:origin=viz_share_link&quot; target=&quot;_blank&quot;&gt;Карточки на Табло Паблик&lt;/a&gt;&lt;/figcaption&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;y2M0&quot;&gt;Не так давно я нашёл &lt;strong&gt;исследование &amp;quot;&lt;a href=&quot;https://vc.ru/hr/136050-analitika-dlya-hantinga-analitikov-produktovyh-marketingovyh-i-data-scientists&quot; target=&quot;_blank&quot;&gt;Аналитика для хантинга аналитиков (продуктовых, маркетинговых и data scientists)&lt;/a&gt;&amp;quot; &lt;/strong&gt;от команды хантинг-агентства NEW.HR.&lt;/p&gt;
  &lt;p id=&quot;m3Ei&quot;&gt;Данный материал-лонгрид (!) уже основывается на данных, полученных авторами напрямую у кандидатов из разных продуктовых IT и Digital-компаний и не находящихся в активном поиске работы (Москва, либо удаленный формат работы в московских компаниях). &lt;strong&gt;В исследовании рассматривается &lt;/strong&gt;(см. ссылки 1 и 2):&lt;/p&gt;
  &lt;ul id=&quot;a0qu&quot;&gt;
    &lt;li id=&quot;5wTB&quot;&gt;&lt;strong&gt;сколько денег хотят аналитики&lt;/strong&gt;, которые не ищут работу и как можно повлиять на их мотивацию&lt;/li&gt;
    &lt;li id=&quot;nIXa&quot;&gt;&lt;strong&gt;что может влиять на стоимость аналитиков&lt;/strong&gt; (факторы, повышающие ценность на рынке труда)&lt;/li&gt;
    &lt;li id=&quot;dpH1&quot;&gt;основные &lt;strong&gt;компетенции аналитиков&lt;/strong&gt; разного уровня&lt;/li&gt;
    &lt;li id=&quot;UOAc&quot;&gt;какие &lt;strong&gt;типовые задачи&lt;/strong&gt; решают аналитики разных специализаций и &lt;strong&gt;какими инструментами пользуются&lt;/strong&gt; и т.п.&lt;/li&gt;
  &lt;/ul&gt;
  &lt;p id=&quot;wU8C&quot;&gt;Меня больше заинтересовали графики, которых много, они также есть в самой презентации, состоящей из &lt;strong&gt;83 &lt;/strong&gt;слайдов с оглавлением 😱:&lt;/p&gt;
  &lt;figure id=&quot;Yl5N&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img1.teletype.in/files/45/59/4559b991-38c3-4a42-b6cc-ee9fcf090a61.png&quot; width=&quot;1153&quot; /&gt;
    &lt;figcaption&gt;Превью отчёта NEWHR.ru&lt;/figcaption&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;VJBm&quot;&gt;В отчёте представлено сравнение максимальных и минимальных значений зарплатных ожиданий аналитиков (кандидатов, не находящихся в активном поиске работы) в виде сгруппированной столбчатой диаграммы:&lt;/p&gt;
  &lt;figure id=&quot;HRe0&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img1.teletype.in/files/80/e7/80e7e890-680e-471e-a922-76799655c2fa.png&quot; width=&quot;1123&quot; /&gt;
    &lt;figcaption&gt;Зарплатные ожидания маркетинговых аналитиков&lt;/figcaption&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;lTkG&quot;&gt;&lt;strong&gt;Как изящно визуализировать разницу между двумя показателями?&lt;/strong&gt; Традиционный excel-style – выбрать сгруппированную столбчатую диаграмму (grouped bar chart). Столбчатые диаграммы могут быть не всегда идеальным вариантом визуализации данных, особенно когда у вас есть значения, которые очень близки друг к другу, то становится очень сложно визуализировать разницу между столбцами.&lt;/p&gt;
  &lt;p id=&quot;dfIy&quot;&gt;Точечный график это одна из моих любимых альтернатив сгруппированной столбчатой диаграмме. Точечные графики предложил Уильям Кливленд (Cleveland W.), один из пионеров исследований в области визуализации данных. В своей работе, написанной в соавторстве с Робертом Макгиллом (Robert McGill), У. Кливленд &lt;strong&gt;экспериментально показал, что столбиковые диаграммы, используемые для изображения сгруппированных значений количественных переменных, визуально плохо воспринимаются людьми&lt;/strong&gt; (см. Cleveland W. S., McGill R. (1984) Graphical perception: theory, experimentation, and application to the development of graphical methods. Journal of the American Statistical Association 79(387): 531-554). В качестве альтернативы и были предложены точечные диаграммы. Точечный график использует точки, соответствующие значениям данных, иногда соединяемые линиями или стрелками. &lt;/p&gt;
  &lt;p id=&quot;hrB4&quot;&gt;Разновидность точечного графика – &lt;strong&gt;диаграмма гантелей &lt;/strong&gt;(dumbbell chart) или иногда называемой диаграммой разрыва (gap chart), можно также встретить название &amp;quot;диаграмма ДНК&amp;quot; (в силу похожести на спираль ДНК):&lt;/p&gt;
  &lt;figure id=&quot;SOxI&quot; class=&quot;m_original&quot;&gt;
    &lt;img src=&quot;https://img2.teletype.in/files/5c/ee/5cee04af-e527-4501-af80-279c5147b8c4.png&quot; width=&quot;472&quot; /&gt;
    &lt;figcaption&gt;Диаграмма ДНК&lt;/figcaption&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;dgrC&quot;&gt;Диаграмма гантелей – точечная диаграмма,  в которой две точки соединены линией, что означает изменение (размах, диапазон, разницу) между двумя точками данных для каждого измерения. Точки данных соответствуют одной оси, а группы – другой, которые не обязательно должны быть упорядочены определенным образом, хотя сортировка может значительно улучшить восприятие визуализации. По сравнению с обычной столбчатой диаграммой гантельная диаграмма относительно более визуально привлекательна и выглядят намного чище, так как требует меньше чернил и меньше места (см. &lt;a href=&quot;http://infographer.ru/tufte1/&quot; target=&quot;_blank&quot;&gt;data-ink ratio&lt;/a&gt; или соотношение данных и чернил, предложенное Эдвардом Тафти). См. также &lt;a href=&quot;https://www.storytellingwithdata.com/blog/2018/8/21/august-swdchallenge-recap-the-dot-plot&quot; target=&quot;_blank&quot;&gt;50 примеров точечных графиков&lt;/a&gt; для вдохновения.&lt;/p&gt;
  &lt;p id=&quot;OCiH&quot;&gt;Попробуем по-другому визуально представить зарплатные ожидания маркетинговых аналитиков. &lt;/p&gt;
  &lt;figure id=&quot;nlbV&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img4.teletype.in/files/7d/e6/7de6b629-01f3-4e4e-b0df-5a5d72547455.png&quot; width=&quot;1280&quot; /&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;sbe6&quot;&gt;Для этого воспользуемся данными из этой таблицы в PDF-отчёте:&lt;/p&gt;
  &lt;figure id=&quot;X70k&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img2.teletype.in/files/56/40/564043b9-1f33-4144-9c3b-3f4bd8d4b42e.png&quot; width=&quot;1079&quot; /&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;HOIH&quot;&gt;Мы могли бы вручную скопировать данные из таблицы, но техника &amp;quot;копи-паст&amp;quot;– не инструмент настоящих аналитиков. Всё будем делать с помощью R, тем более, что есть специализированный пакет &lt;strong&gt;tabulizer&lt;/strong&gt;для извлечения текста/данных из PDF. &lt;/p&gt;
  &lt;pre id=&quot;2UOt&quot; data-lang=&quot;r&quot;&gt;# Извлекаем таблицу с мин и макс ЗП ожиданиями из PDF-файла презентации
# remotes::install_github(c(&amp;quot;ropensci/tabulizerjars&amp;quot;, &amp;quot;ropensci/tabulizer&amp;quot;))
library(tabulizer)
library(tidyverse)
library(glue)
library(ggtext)
library(showtext)
library(here)
library(ragg)

# Загружаем PDF-файл презентации
pdf_link &amp;lt;-
  &amp;quot;https://vacancy.newhr.ru/data/data/salary/HeadHunting_analytics_salary_IT-Digital_2020_from%20New.HR.pdf&amp;quot;
out &amp;lt;- extract_tables(pdf_link)

# Сохраняем исходник
# saveRDS(out, &amp;quot;data_source.Rds&amp;quot;) # сохраняем исходник
# out &amp;lt;- readRDS(&amp;quot;data_source.Rds&amp;quot;) # загружаем локально исходник

header &amp;lt;- out[[1]][3, 2:6]
temp_table &amp;lt;- as.data.frame(out[[1]][4:20, 2:7])

#менеджеры и аналитики
tbl_01 &amp;lt;- temp_table[1:4,]
names(tbl_01) &amp;lt;- c(&amp;quot;jobs&amp;quot;, header)
tbl_01$&amp;#x60;Head | Chief&amp;#x60;[1] &amp;lt;- tbl_01$Lead[1]
tbl_01$group &amp;lt;- &amp;quot;Аналитики&amp;quot;
tbl_01$group[1] &amp;lt;- &amp;quot;Менеджеры&amp;quot;

# разработчики
tbl_02 &amp;lt;- temp_table[5:16, 2:5]
names(tbl_02) &amp;lt;- c(&amp;quot;jobs&amp;quot;, header[-c(1, 5)])
tbl_02$group &amp;lt;- &amp;quot;Разработчики&amp;quot;

# CTO
tbl_03 &amp;lt;- temp_table[17, 1:2]
names(tbl_03) &amp;lt;- c(&amp;quot;jobs&amp;quot;, &amp;quot;Head | Chief&amp;quot;)
tbl_03$group &amp;lt;- &amp;quot;Директор&amp;quot;

data_final &amp;lt;- bind_rows(list(tbl_01, tbl_02, tbl_03))
data_final &amp;lt;- data_final %&amp;gt;%
  pivot_longer(-c(jobs, group), names_to = &amp;quot;exp&amp;quot;, values_to = &amp;quot;wage&amp;quot;) %&amp;gt;%
  na.omit() %&amp;gt;%
  separate(wage, into = c(&amp;quot;min&amp;quot;, &amp;quot;max&amp;quot;), sep = &amp;quot;-&amp;quot;) %&amp;gt;%
  mutate_at(c(&amp;quot;min&amp;quot;, &amp;quot;max&amp;quot;), as.numeric) %&amp;gt;% 
  mutate(
    dif = max - min,
    percent =  round((max - min)/min * 100),
    percent_text = paste0(&amp;quot;+&amp;quot;, percent, &amp;quot;%&amp;quot;))
 data_final$exp &amp;lt;- factor(data_final$exp, levels = header)
 data_final&lt;/pre&gt;
  &lt;p id=&quot;22OC&quot;&gt;Мы извлекли исходную таблицу с данными из PDF-отчёта, дополнив её несколькими расчетными столбцами (разница между макс и мин ЗП в абсолютных и % значениях):&lt;/p&gt;
  &lt;figure id=&quot;GKXR&quot; class=&quot;m_original&quot;&gt;
    &lt;img src=&quot;https://img4.teletype.in/files/fc/ae/fcaef713-87ca-4e87-8ca4-02113f582cac.png&quot; width=&quot;1025&quot; /&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;BDOT&quot;&gt;Теперь можно визуализировать данные по отдельным категориям аналитиков. &lt;/p&gt;
  &lt;pre id=&quot;DU0l&quot; data-lang=&quot;r&quot;&gt;# Загрузим шрифт для графика
font_add_google(&amp;quot;Istok Web&amp;quot;, family = &amp;quot;Istok Web&amp;quot;)
font &amp;lt;- &amp;quot;Istok Web&amp;quot;&lt;/pre&gt;
  &lt;pre id=&quot;Oucv&quot; data-lang=&quot;r&quot;&gt;data_final %&amp;gt;%
  filter(jobs == &amp;quot;Маркетинговые&amp;quot;) %&amp;gt;%
  ggplot(aes(exp, min)) +
  geom_segment(aes(
    y = min,
    x = exp,
    yend = max,
    xend = exp
  ), size = 1.5,
  color = &amp;quot;gray&amp;quot;) +
  geom_point(stat = &amp;#x27;identity&amp;#x27;, color = &amp;quot;#003f7d&amp;quot;, size = 10)  +
  geom_point(aes(exp, max),
             stat = &amp;#x27;identity&amp;#x27;,
             color = &amp;quot;#ff8e00&amp;quot;,
             size = 10) +
  geom_text(aes(exp, min - 10, label = min),
            size = 5, 
            color = &amp;quot;#003f7d&amp;quot;,
            family = font, 
            show.legend = FALSE) + 
  geom_text(aes(exp, max + 10, label = max),
            size = 5,
            color = &amp;quot;#ff8e00&amp;quot;,
            family = font,
            show.legend = FALSE) + 
  geom_text(aes(exp, (min + dif/2), label = glue(&amp;quot;+{dif}&amp;quot;)),
            size = 4, vjust = -0.35,
            color = &amp;quot;gray70&amp;quot;,
            family = font,
            show.legend = FALSE) + 
  scale_y_continuous(breaks = seq(0, 600, 25), limits = c(50,275)) +
  labs(
    title = glue(&amp;quot;Зарплатные ожидания маркетинговых аналитиков&amp;quot;),
    subtitle = glue(&amp;quot;&amp;lt;b style=&amp;#x27;color:#003f7d;&amp;#x27;&amp;gt;Минимальная&amp;lt;/b&amp;gt; и &amp;lt;b style=&amp;#x27;color:#ff8e00;&amp;#x27;&amp;gt;максимальная&amp;lt;/b&amp;gt; заработная плата после удержания налогов&amp;quot;),
    y = &amp;quot;Заработная плата, тыс. рублей&amp;quot;,
    x = &amp;quot;Грейд&amp;quot;,
    caption = glue(&amp;quot;Источник данных: newhr.ru\nВизуализация: Юрий Тукачев, июнь 2022&amp;quot;)
  ) +
  coord_flip() +
  theme_minimal(base_size = 18, base_family = &amp;quot;Josefin Slab&amp;quot;) + 
theme(
  panel.grid.major.y = element_blank(), 
  panel.grid.minor.x = element_blank(),
  panel.border = element_blank(),
  axis.title = element_text(size = 18),
  text = element_text(
    family = font,
    color = &amp;quot;#53565A&amp;quot;,
    size = 20
  ),
  panel.background = element_blank(),
  plot.title.position = &amp;quot;plot&amp;quot;,
  plot.caption.position = &amp;quot;plot&amp;quot;,
  plot.caption = element_text(
    color = &amp;quot;gray&amp;quot;,
    size = 14,
    hjust = 1
  ),
  plot.margin = margin(25, 25, 10, 25),
  plot.subtitle = element_markdown(
    hjust = 0,
    size = rel(0.9),
    family = font
  ),
  plot.title = element_text(
    size = rel(1.3),
    lineheight = 0.7,
    family = font,
    face = &amp;quot;bold&amp;quot;,
    color = &amp;quot;gray20&amp;quot;
  )
)
&lt;/pre&gt;
  &lt;p id=&quot;RPe6&quot;&gt;В результате получаем диаграмму гантелей:&lt;/p&gt;
  &lt;figure id=&quot;ETe7&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img2.teletype.in/files/1d/c7/1dc72cbb-9fde-4c73-8bf7-5c9f8f75c418.png&quot; width=&quot;3375&quot; /&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;oDIZ&quot;&gt;Не забываем сохранить:&lt;/p&gt;
  &lt;pre id=&quot;rHY9&quot;&gt;ggsave(
  here(&amp;quot;salary.png&amp;quot;),
  device = agg_png,
  bg = &amp;quot;white&amp;quot;,
  width = 7.5,
  height = 4.5,
  dpi = 300,
  scale = 1.5
)&lt;/pre&gt;
  &lt;p id=&quot;gsaG&quot;&gt;Итоговый график можно &lt;a href=&quot;https://disk.yandex.ru/d/6T2edT0HCadzmw&quot; target=&quot;_blank&quot;&gt;скачать по ссылке&lt;/a&gt;.&lt;/p&gt;
  &lt;p id=&quot;84Qe&quot;&gt;&lt;strong&gt;🔗 Ссылки:&lt;/strong&gt;&lt;/p&gt;
  &lt;p id=&quot;3MAr&quot;&gt;1. &lt;strong&gt;статья:&lt;/strong&gt; &lt;a href=&quot;https://vc.ru/hr/136050-analitika-dlya-hantinga-analitikov-produktovyh-marketingovyh-i-data-scientists&quot; target=&quot;_blank&quot;&gt;https://vc.ru/hr/136050-analitika-dlya-hantinga-analitikov-produktovyh-marketingovyh-i-data-scientists&lt;/a&gt;&lt;/p&gt;
  &lt;p id=&quot;aMq0&quot;&gt;2. &lt;strong&gt;презентация: &lt;/strong&gt;&lt;a href=&quot;https://vacancy.newhr.ru/data/data/salary/HeadHunting_analytics_salary_IT-Digital_2020_from%20New.HR.pdf&quot; target=&quot;_blank&quot;&gt;https://vacancy.newhr.ru/data/data/salary/HeadHunting_analytics_salary_IT-Digital_2020_from%20New.HR.pdf&lt;/a&gt;&lt;/p&gt;
  &lt;p id=&quot;KYgY&quot;&gt;🔗 &lt;strong&gt;Что еще интересного по теме зарплат в IT?&lt;/strong&gt;&lt;/p&gt;
  &lt;ul id=&quot;4qjl&quot;&gt;
    &lt;li id=&quot;Qluj&quot;&gt;&lt;a href=&quot;https://habr.com/ru/post/672248/&quot; target=&quot;_blank&quot;&gt;&lt;strong&gt;⚡️ Как изменился рынок труда в IT и Digital в России&lt;/strong&gt;&lt;/a&gt; &lt;strong&gt;за последние 4 месяца&lt;/strong&gt;&lt;/li&gt;
    &lt;li id=&quot;kpvh&quot;&gt;&lt;strong&gt;&lt;a href=&quot;https://t.me/revealthedata/656&quot; target=&quot;_blank&quot;&gt;Вакансии аналитиков&lt;/a&gt; март-май 2022&lt;/strong&gt;&lt;/li&gt;
    &lt;li id=&quot;Tfkw&quot;&gt;&lt;a href=&quot;https://career.habr.com/salaries&quot; target=&quot;_blank&quot;&gt;Калькулятор зарплат Хабр Карьеры&lt;/a&gt; можно узнать текущую зарплату любого специалиста из ИТ-отрасли&lt;/li&gt;
    &lt;li id=&quot;QuHo&quot;&gt;&lt;a href=&quot;https://habr.com/ru/company/ods/blog/572264/&quot; target=&quot;_blank&quot;&gt;Анализ вакансий и зарплат&lt;/a&gt; в Data Science&lt;/li&gt;
    &lt;li id=&quot;YGlx&quot;&gt;Работа DS: &lt;a href=&quot;https://dyakonov.org/2021/06/21/ds/&quot; target=&quot;_blank&quot;&gt;зарплаты, занятость и желания&lt;/a&gt;&lt;/li&gt;
    &lt;li id=&quot;EpKb&quot;&gt;Один из крупнейших форумов для разработчиков Stack Overflow опубликовал &lt;a href=&quot;https://insights.stackoverflow.com/survey/2021&quot; target=&quot;_blank&quot;&gt;ежегодное исследование рынка ИТ&lt;/a&gt;&lt;/li&gt;
    &lt;li id=&quot;ahNa&quot;&gt;Удалёнка vs офис: &lt;a href=&quot;https://habr.com/ru/company/habr_career/blog/574442/&quot; target=&quot;_blank&quot;&gt;где и как разработчикам выгоднее работать&lt;/a&gt;&lt;/li&gt;
    &lt;li id=&quot;CnrV&quot;&gt;&lt;a href=&quot;https://habr.com/ru/article/569026/&quot; target=&quot;_blank&quot;&gt;Зарплаты айтишников в первой половине 2021&lt;/a&gt;: +6,2% за счёт регионов&lt;/li&gt;
    &lt;li id=&quot;5Q4y&quot;&gt;&lt;a href=&quot;https://habr.com/ru/article/649423/&quot; target=&quot;_blank&quot;&gt;Зарплаты айтишников во втором полугодии 2021&lt;/a&gt;: +17% за счет поддержки и администрирования в регионах&lt;/li&gt;
    &lt;li id=&quot;slrN&quot;&gt;&lt;a href=&quot;https://vacancy.newhr.ru/data/data/salary/Normalresearch.ru_Analysts_2019.pdf&quot; target=&quot;_blank&quot;&gt;Исследование рынка аналитиков&lt;/a&gt;: решения, основанные на данных (2019) &lt;/li&gt;
    &lt;li id=&quot;scH1&quot;&gt;&lt;a href=&quot;https://vc.ru/hr/293852-analitika-dlya-hantinga-i-rekomendacii-po-naymu-it-specialistov&quot; target=&quot;_blank&quot;&gt;Аналитика для хантинга и рекомендации&lt;/a&gt; по найму ИТ-специалистов&lt;/li&gt;
    &lt;li id=&quot;Cjhc&quot;&gt;Опрос &amp;quot;&lt;a href=&quot;https://forms.gle/8Ncum18qaFRg7NLn7&quot; target=&quot;_blank&quot;&gt;Зарплата моей мечты&lt;/a&gt;&amp;quot;, результаты можно увидеть на &lt;a href=&quot;https://app.powerbi.com/view?r=eyJrIjoiNzBmZDU4MTMtODBkMy00MDYwLTlmMWMtNTJmNjQwNzFjYTgyIiwidCI6IjQ3OTNhOTZhLTA2N2EtNDJhOC05OWRkLWU3YTdiNDk2NDAzOCIsImMiOjl9&quot; target=&quot;_blank&quot;&gt;интерактивном дашборде в Power BI&lt;/a&gt;&lt;/li&gt;
  &lt;/ul&gt;
  &lt;p id=&quot;isie&quot;&gt;&lt;strong&gt;Основной канал:&lt;/strong&gt; &lt;a href=&quot;https://t.me/People_Analytics&quot; target=&quot;_blank&quot;&gt;https://t.me/People_Analytics&lt;/a&gt;&lt;/p&gt;

</content></entry><entry><id>people_analytics:JcAwh3pUjfo</id><link rel="alternate" type="text/html" href="https://teletype.in/@people_analytics/JcAwh3pUjfo?utm_source=teletype&amp;utm_medium=feed_atom&amp;utm_campaign=people_analytics"></link><title>People analytics: дайджест дайджестов: Что посмотреть/послушать/почитать на выходных?</title><published>2022-06-06T00:55:18.555Z</published><updated>2025-01-14T08:03:42.677Z</updated><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://img2.teletype.in/files/1e/0c/1e0cbd17-1e81-48ce-bd58-97e66ed5985e.png"></media:thumbnail><category term="people-analytics" label="people_analytics"></category><summary type="html">&lt;img src=&quot;https://img2.teletype.in/files/55/e1/55e1cf8d-26d2-4659-84a3-ebeb194b7177.png&quot;&gt;Роль People Analytics возрастает сильнее, чем когда-либо. Независимо от того, являетесь ли вы новичком в области People Analytics или опытным профессионалом, данная библиотека ресурсов будет вам полезна. Список из 90+ полезных ресурсов по People Analytics от лидера в этой области – Эрика ван Вульпена. Статьи, отчеты, примеры данных,  видео и другие материалы помогут вам улучшить свои знания и инициативы в области HR-аналитики. За исключением книг и некоторых академических ресурсов, остальное в репозитории находится в свободном доступе. Скачать библиотеку можно после заполнения простой формы по ссылке (https://www.aihr.com/blog/people-analytics-resource-library).</summary><content type="html">
  &lt;h2 id=&quot;JZ0d&quot;&gt;1. Библиотека ресурсов People Analytics&lt;/h2&gt;
  &lt;figure id=&quot;qb1b&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img2.teletype.in/files/55/e1/55e1cf8d-26d2-4659-84a3-ebeb194b7177.png&quot; width=&quot;800&quot; /&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;le2J&quot;&gt;Роль People Analytics возрастает сильнее, чем когда-либо. Независимо от того, являетесь ли вы новичком в области People Analytics или опытным профессионалом, данная библиотека ресурсов будет вам полезна. Список из 90+ полезных ресурсов по People Analytics от лидера в этой области – Эрика ван Вульпена. Статьи, отчеты, примеры данных,  видео и другие материалы помогут вам улучшить свои знания и инициативы в области HR-аналитики. За исключением книг и некоторых академических ресурсов, остальное в репозитории находится в свободном доступе. Скачать библиотеку можно после заполнения простой формы по ссылке (&lt;a href=&quot;https://www.aihr.com/blog/people-analytics-resource-library&quot; target=&quot;_blank&quot;&gt;https://www.aihr.com/blog/people-analytics-resource-library&lt;/a&gt;).&lt;/p&gt;
  &lt;figure id=&quot;ferM&quot; class=&quot;m_retina&quot;&gt;
    &lt;img src=&quot;https://img2.teletype.in/files/1b/c3/1bc35d11-268d-41df-915e-a2efce09f395.png&quot; width=&quot;300&quot; /&gt;
  &lt;/figure&gt;
  &lt;h2 id=&quot;dzHo&quot;&gt;2. Сборник дайджестов&lt;/h2&gt;
  &lt;h2 id=&quot;F9Lm&quot;&gt;Подборка материалов #01&lt;/h2&gt;
  &lt;p id=&quot;nHfW&quot;&gt;❶ Видео-подкаст Ясен HR — &amp;quot;Смыслы в HR начинаются после цифр (&lt;a href=&quot;https://www.youtube.com/watch?v=4BJgj6lJHNk&amp;t=2179s&quot; target=&quot;_blank&quot;&gt;https://www.youtube.com/watch?v=4BJgj6lJHNk&amp;amp;t=2179s&lt;/a&gt;)&amp;quot; (гость подкаста Егор Ворогушин, директор проектов VK Цифровые технологии о том, что такое HR-аналитика, когда она не нужна, а в каких компаниях &amp;quot;взлетит&amp;quot;, в каких HR-процессах этично использовать искусственный интеллект и как решать проблему очистки данных | Источник: Блог Formatta  (&lt;a href=&quot;https://www.facebook.com/formatta.ru/&quot; target=&quot;_blank&quot;&gt;https://www.facebook.com/formatta.ru/&lt;/a&gt;)&lt;/p&gt;
  &lt;p id=&quot;VoOH&quot;&gt;❷ Саша Бараков из Data Nature в статье &amp;quot;DASHBOARD, DASHBOARD -СКОЛЬКО ТЕБЕ ЖИТЬ ОСТАЛОСЬ? (&lt;a href=&quot;http://datanature.ru/dashboardsdead&quot; target=&quot;_blank&quot;&gt;http://datanature.ru/dashboardsdead&lt;/a&gt;) &amp;quot; про то, как он видит будущее развитие BI-систем | Источник:  Reveal the Data (&lt;a href=&quot;https://t.me/revealthedata/386&quot; target=&quot;_blank&quot;&gt;https://t.me/revealthedata/386&lt;/a&gt;)&lt;/p&gt;
  &lt;p id=&quot;EgpW&quot;&gt;❸  Статья в ответ &amp;quot;Дашборд умер, да здравствует дашборд!&amp;quot; (&lt;a href=&quot;https://revealthedata.com/blog/all/the-dashboard-is-dead-long-live-the-dashboard/&quot; target=&quot;_blank&quot;&gt;https://revealthedata.com/blog/all/the-dashboard-is-dead-long-live-the-dashboard/&lt;/a&gt;) от Романа Бунина на статью Саши Баракова | Источник: Reveal the Data&lt;br /&gt; (&lt;a href=&quot;https://t.me/revealthedata/386&quot; target=&quot;_blank&quot;&gt;https://t.me/revealthedata/386&lt;/a&gt;)&lt;/p&gt;
  &lt;p id=&quot;xls3&quot;&gt;❹ Схема принятия решения при визуализации данных  (&lt;a href=&quot;https://www.techprevue.com/decision-tree-perfect-visualisation-data/&quot; target=&quot;_blank&quot;&gt;https://www.techprevue.com/decision-tree-perfect-visualisation-data/&lt;/a&gt;)| Источник: Журналистика данных&lt;br /&gt; (&lt;a href=&quot;https://t.me/digitalfan&quot; target=&quot;_blank&quot;&gt;https://t.me/digitalfan&lt;/a&gt;)&lt;/p&gt;
  &lt;p id=&quot;Lfp3&quot;&gt;❺ Статья &amp;quot;Регрессия к среднему: введение с примерами (&lt;a href=&quot;https://habr.com/ru/company/piter/blog/647545/&quot; target=&quot;_blank&quot;&gt;https://habr.com/ru/company/piter/blog/647545/&lt;/a&gt;)&amp;quot; |Источник: Хабр&lt;/p&gt;
  &lt;p id=&quot;v0qn&quot;&gt;❻ Подкаст на тему &amp;quot;Что такое психометрика? (&lt;a href=&quot;https://aeryabinin.fireside.fm/16&quot; target=&quot;_blank&quot;&gt;https://aeryabinin.fireside.fm/16&lt;/a&gt;) &amp;quot; Разбираемся с Дмитрием Аббакумовым | Источник: Обучение между делом&lt;br /&gt; (&lt;a href=&quot;https://aeryabinin.fireside.fm/&quot; target=&quot;_blank&quot;&gt;https://aeryabinin.fireside.fm/&lt;/a&gt;)&lt;/p&gt;
  &lt;p id=&quot;62fl&quot;&gt;❼ Исследование: Аналитики: кто они, чем занимаются и сколько зарабатывают? (&lt;a href=&quot;https://vacancy.newhr.ru/data/data/salary/Normalresearch.ru_Analysts_2019.pdf&quot; target=&quot;_blank&quot;&gt;https://vacancy.newhr.ru/data/data/salary/Normalresearch.ru_Analysts_2019.pdf&lt;/a&gt;) | Источник: Data-Driven Education (&lt;a href=&quot;https://t.me/DataEd&quot; target=&quot;_blank&quot;&gt;https://t.me/DataEd&lt;/a&gt;)&lt;/p&gt;
  &lt;figure id=&quot;Uvzo&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img2.teletype.in/files/9c/e2/9ce2879f-fee8-4b0e-92b1-2458da1dd4a1.png&quot; width=&quot;1280&quot; /&gt;
  &lt;/figure&gt;
  &lt;h2 id=&quot;JX9o&quot;&gt;&lt;strong&gt;Подборка материалов #02&lt;/strong&gt;&lt;/h2&gt;
  &lt;p id=&quot;I9bt&quot;&gt;❶ Визуализация на Flourish  Удовольствие от работы (&lt;a href=&quot;https://public.flourish.studio/visualisation/7300656/&quot; target=&quot;_blank&quot;&gt;https://public.flourish.studio/visualisation/7300656/&lt;/a&gt;): где работают счастливчики, которые кайфуют от своей работы и считают её важной? (английский) | Источник: Call me data (&lt;a href=&quot;https://t.me/callmedata&quot; target=&quot;_blank&quot;&gt;https://t.me/callmedata&lt;/a&gt;) &lt;br /&gt;❷ Бесплатное пособие для полного погружения в Machine Learning  (&lt;a href=&quot;https://academy.yandex.ru/dataschool/book&quot; target=&quot;_blank&quot;&gt;https://academy.yandex.ru/dataschool/book&lt;/a&gt;) от Школы анализа данных Яндекса: материалы пригодятся как начинающим ML-специалистам, так и разработчикам, аналитикам, исследователям, которые хотят получить системное представление об ML и отдельных алгоритмах | Источник: Яндекс&lt;br /&gt;❸ Вебинар HR аналитика в Tableau  (&lt;a href=&quot;https://www.youtube.com/watch?v=zssNyRr114o&quot; target=&quot;_blank&quot;&gt;https://www.youtube.com/watch?v=zssNyRr114o&lt;/a&gt;)(английский)  | Источник: YouTube&lt;br /&gt;❹ Исследования в оценке персонала (&lt;a href=&quot;https://t.me/digital_assessment/111&quot; target=&quot;_blank&quot;&gt;https://t.me/digital_assessment/111&lt;/a&gt;)  (декабрь и январь 2021) | Источник: Digital Assessment&lt;br /&gt; (&lt;a href=&quot;https://t.me/digital_assessment&quot; target=&quot;_blank&quot;&gt;https://t.me/digital_assessment&lt;/a&gt;)&lt;/p&gt;
  &lt;p id=&quot;Gd3v&quot;&gt;❺ Что такое визуализация данных: (&lt;a href=&quot;https://revealthedata.com/blog/all/chto-takoe-vizualizaciya-dannyh-kakaya-ona-byvaet-i-ne-byvaet/&quot; target=&quot;_blank&quot;&gt;https://revealthedata.com/blog/all/chto-takoe-vizualizaciya-dannyh-kakaya-ona-byvaet-i-ne-byvaet/&lt;/a&gt;) какая она бывает и не бывает | Источник: Reveal the Data&lt;br /&gt; (&lt;a href=&quot;https://t.me/revealthedata&quot; target=&quot;_blank&quot;&gt;https://t.me/revealthedata&lt;/a&gt;)&lt;/p&gt;
  &lt;p id=&quot;V8gv&quot;&gt;❻ Статья Алдара Николаева Why in your employees’ motivation the most interesting is not their motivation? (&lt;a href=&quot;https://medium.com/@aldarnikolaev/why-in-your-employees-motivation-the-most-interesting-is-not-their-motivation-abe99ec4a082&quot; target=&quot;_blank&quot;&gt;https://medium.com/@aldarnikolaev/why-in-your-employees-motivation-the-most-interesting-is-not-their-motivation-abe99ec4a082&lt;/a&gt;) Почему в мотивации ваших сотрудников интересна не их мотивация? Подход, основанный на данных (с кодом python) – английский | Источник: Medium&lt;br /&gt; (&lt;a href=&quot;https://medium.com/&quot; target=&quot;_blank&quot;&gt;https://medium.com/&lt;/a&gt;)&lt;/p&gt;
  &lt;p id=&quot;vSbP&quot;&gt;❼ Углубленное сравнение инструментов BI систем (&lt;a href=&quot;https://www.reddit.com/r/PowerBI/comments/s3o6hi/the_most_indepth_comparison_of_bi_tools_followup/&quot; target=&quot;_blank&quot;&gt;https://www.reddit.com/r/PowerBI/comments/s3o6hi/the_most_indepth_comparison_of_bi_tools_followup/&lt;/a&gt;) в гугл-таблице (&lt;a href=&quot;https://docs.google.com/spreadsheets/d/1zx6fgkiircU-p9ghbc_ssjbboJXynvCN_peFPVXVmCY/edit#gid=632026672&quot; target=&quot;_blank&quot;&gt;https://docs.google.com/spreadsheets/d/1zx6fgkiircU-p9ghbc_ssjbboJXynvCN_peFPVXVmCY/edit#gid=632026672&lt;/a&gt;) | Источник: Reddit&lt;/p&gt;
  &lt;figure id=&quot;OBwG&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img2.teletype.in/files/d2/7f/d27fa9f4-84a4-491e-977f-db64df214144.png&quot; width=&quot;924&quot; /&gt;
  &lt;/figure&gt;
  &lt;h2 id=&quot;eMLo&quot;&gt;&lt;strong&gt;Подборка материалов #03&lt;/strong&gt;&lt;/h2&gt;
  &lt;p id=&quot;OpB0&quot;&gt;❶ Важная статья (&lt;a href=&quot;https://blog.datawrapper.de/10-ways-to-use-fewer-colors-in-your-data-visualizations/&quot; target=&quot;_blank&quot;&gt;https://blog.datawrapper.de/10-ways-to-use-fewer-colors-in-your-data-visualizations/&lt;/a&gt;) о главных секретах визуализации данных | Источник: Чартомойка (&lt;a href=&quot;https://t.me/chartomojka&quot; target=&quot;_blank&quot;&gt;https://t.me/chartomojka&lt;/a&gt;) &lt;br /&gt;❷ Статья How to Calculate and Reduce New Hire Turnover at Your Company (&lt;a href=&quot;https://www.aihr.com/blog/new-hire-turnover/&quot; target=&quot;_blank&quot;&gt;https://www.aihr.com/blog/new-hire-turnover/&lt;/a&gt;) | Источник: AIHR&lt;br /&gt;❸ Визуализация доли мужчин и женщин в разных индустриях (&lt;a href=&quot;https://twitter.com/geokaramanis/status/1365295603975135238?s=21&quot; target=&quot;_blank&quot;&gt;https://twitter.com/geokaramanis/status/1365295603975135238?s=21&lt;/a&gt;) (сферах деятельности). Сделано в R | Источник: Настенька и графики&lt;br /&gt; (&lt;a href=&quot;https://t.me/nastengraph&quot; target=&quot;_blank&quot;&gt;https://t.me/nastengraph&lt;/a&gt;)&lt;/p&gt;
  &lt;p id=&quot;trg7&quot;&gt;❹ Статья Как сделать презентацию PowerPoint в R с помощью RMarkdown (&lt;a href=&quot;https://appsilon.com/r-markdown-powerpoint-presentation/&quot; target=&quot;_blank&quot;&gt;https://appsilon.com/r-markdown-powerpoint-presentation/&lt;/a&gt;) | Источник: Блог Appsilon&lt;br /&gt; (&lt;a href=&quot;https://appsilon.com/&quot; target=&quot;_blank&quot;&gt;https://appsilon.com/&lt;/a&gt;)&lt;/p&gt;
  &lt;p id=&quot;bOj7&quot;&gt;❺ Статья Децильный метод или сокращение дисперсии (&lt;a href=&quot;https://medium.com/statistics-experiments/%D0%B4%D0%B5%D1%86%D0%B8%D0%BB%D1%8C%D0%BD%D1%8B%D0%B9-%D0%BC%D0%B5%D1%82%D0%BE%D0%B4-%D0%B8%D0%BB%D0%B8-%D1%81%D0%BE%D0%BA%D1%80%D0%B0%D1%89%D0%B5%D0%BD%D0%B8%D0%B5-%D0%B4%D0%B8%D1%81%D0%BF%D0%B5%D1%80%D1%81%D0%B8%D0%B8-c06758059727&quot; target=&quot;_blank&quot;&gt;https://medium.com/statistics-experiments/%D0%B4%D0%B5%D1%86%D0%B8%D0%BB%D1%8C%D0%BD%D1%8B%D0%B9-%D0%BC%D0%B5%D1%82%D0%BE%D0%B4-%D0%B8%D0%BB%D0%B8-%D1%81%D0%BE%D0%BA%D1%80%D0%B0%D1%89%D0%B5%D0%BD%D0%B8%D0%B5-%D0%B4%D0%B8%D1%81%D0%BF%D0%B5%D1%80%D1%81%D0%B8%D0%B8-c06758059727&lt;/a&gt;) | Источник: Medium&lt;br /&gt;❻ Материалы воркшопа Татьяны Балтыжаковой Визуализируй это: визуализация данных в R (&lt;a href=&quot;https://baltti.github.io/workshop-DH21/ggplot2-tutorial-DH.html&quot; target=&quot;_blank&quot;&gt;https://baltti.github.io/workshop-DH21/ggplot2-tutorial-DH.html&lt;/a&gt;) | Источник: google &lt;br /&gt;❼ Серия из 4 небольших видео-лекций Разработка профессиональных тестов знаний (&lt;a href=&quot;https://www.youtube.com/watch?v=juh1EMVInj0&amp;list=PL0LOwHD1Gbh9mTN9492VOSdHmOYKDyv44&quot; target=&quot;_blank&quot;&gt;https://www.youtube.com/watch?v=juh1EMVInj0&amp;amp;list=PL0LOwHD1Gbh9mTN9492VOSdHmOYKDyv44&lt;/a&gt;) | Источник: YouTube-канал Лаборатории &amp;quot;Гуманитарные Технологии&amp;quot; (&lt;a href=&quot;https://www.youtube.com/channel/UCaYvUrf7m8vZ8ZbbBfgyJMQ/about&quot; target=&quot;_blank&quot;&gt;https://www.youtube.com/channel/UCaYvUrf7m8vZ8ZbbBfgyJMQ/about&lt;/a&gt;)&lt;/p&gt;
  &lt;figure id=&quot;OUQ2&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img3.teletype.in/files/2b/01/2b018e20-d3ba-4d84-95ae-17e318b81b63.png&quot; width=&quot;960&quot; /&gt;
  &lt;/figure&gt;
  &lt;h2 id=&quot;4cBU&quot;&gt;&lt;strong&gt;Подборка материалов #04&lt;/strong&gt;&lt;/h2&gt;
  &lt;p id=&quot;6ymh&quot;&gt;❶ Статья &amp;quot;Небезопасное поведение работников на производстве и опасных работах, диагностика сотрудников (&lt;a href=&quot;https://ht-lab.ru/knowledge/articles/nebezopasnoe-povedenie-rabotnikov/&quot; target=&quot;_blank&quot;&gt;https://ht-lab.ru/knowledge/articles/nebezopasnoe-povedenie-rabotnikov/&lt;/a&gt;)&amp;quot;. Команда HT Lab провела масштабное #исследование, в котором участвовали 7 000 рабочих и инженерно-технических специалистов нефтехимической отрасли, электроэнергетики и металлургии. Результаты психологического тестирования были сопоставлены с производственными показателями аварийности и данными о нарушениях техники безопасности участников оценки | Источник: &lt;a href=&quot;https://ht-lab.ru&quot; target=&quot;_blank&quot;&gt;https://ht-lab.ru&lt;/a&gt;&lt;br /&gt;❷ Статья (англ) про UX дизайн дашбордов (&lt;a href=&quot;https://medium.com/nightingale/ux-in-interactive-dashboard-design-73af3d6dbaae&quot; target=&quot;_blank&quot;&gt;https://medium.com/nightingale/ux-in-interactive-dashboard-design-73af3d6dbaae&lt;/a&gt;), с идеей того, что пользователи в ваших дашбордах должны видеть то же, что и вы и ничего лишнее их не отвлекало | Источник: Настенька и графики&lt;br /&gt; (&lt;a href=&quot;https://t.me/nastengraph&quot; target=&quot;_blank&quot;&gt;https://t.me/nastengraph&lt;/a&gt;)❸ Видео: Создание интерактивных карт с помощью leaflet. (&lt;a href=&quot;https://t.me/R4marketing/987&quot; target=&quot;_blank&quot;&gt;https://t.me/R4marketing/987&lt;/a&gt;) Видео урок и практическое занятие по работе с пакетом leaflet, который позволяет строить интерактивные карты в R | Источник: R4marketing&lt;br /&gt; (&lt;a href=&quot;https://t.me/R4marketing&quot; target=&quot;_blank&quot;&gt;https://t.me/R4marketing&lt;/a&gt;)❹ Статья &amp;quot;Почему Correlation != Causation&amp;quot;  (&lt;a href=&quot;https://t.me/reliable_ml/27&quot; target=&quot;_blank&quot;&gt;https://t.me/reliable_ml/27&lt;/a&gt;)| Источник: Reliable_ml&lt;br /&gt; (&lt;a href=&quot;https://t.me/reliable_ml&quot; target=&quot;_blank&quot;&gt;https://t.me/reliable_ml&lt;/a&gt;)❺ Книга Кит Йейтс &amp;quot;Математика жизни и смерти: 7 математических принципов, формирующих нашу жизнь&amp;quot; (&lt;a href=&quot;https://book24.ru/~jM7El&quot; target=&quot;_blank&quot;&gt;https://book24.ru/~jM7El&lt;/a&gt;). Семь глав этой книги исследуют подлинные истории из жизни, в которых корректное (или некорректное) применение математики сыграло решающую роль. Читать всем аналитикам и HR, работающих с данными.&lt;br /&gt;❻ Статья Александра Ботвина &amp;quot;Анализ рынка вакансий в энергетике РФ (&lt;a href=&quot;https://telegra.ph/Analiz-rynka-vakansij-v-ehnergetike-RF-03-31&quot; target=&quot;_blank&quot;&gt;https://telegra.ph/Analiz-rynka-vakansij-v-ehnergetike-RF-03-31&lt;/a&gt;)&amp;quot; (с использованием R) | Источник: H0H1: про HR-аналитику&lt;br /&gt; (&lt;a href=&quot;https://t.me/h0h1_hr_analytics&quot; target=&quot;_blank&quot;&gt;https://t.me/h0h1_hr_analytics&lt;/a&gt;)❼ Статья &amp;quot;Матрица компетенций: важный инструмент для мотивации команды (&lt;a href=&quot;https://habr.com/ru/company/agima/blog/659387/&quot; target=&quot;_blank&quot;&gt;https://habr.com/ru/company/agima/blog/659387/&lt;/a&gt;)&amp;quot; | Источник: Хабр&lt;/p&gt;
  &lt;figure id=&quot;Gf9t&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img4.teletype.in/files/fa/3d/fa3d433c-ab55-4bf7-bb9a-f38c0144bf32.png&quot; width=&quot;1280&quot; /&gt;
  &lt;/figure&gt;
  &lt;h2 id=&quot;FEem&quot;&gt;Подборка материалов #05&lt;/h2&gt;
  &lt;p id=&quot;sVi2&quot;&gt;❶ Существует так много способов визуализации данных, а этот визуальный словарь (&lt;a href=&quot;https://public.tableau.com/app/profile/andy.kriebel/viz/VisualVocabulary/VisualVocabulary&quot; target=&quot;_blank&quot;&gt;https://public.tableau.com/app/profile/andy.kriebel/viz/VisualVocabulary/VisualVocabulary&lt;/a&gt;) (Visual Vocabulary) от Andy Kriebel поможет вам в выборе типа графика и создании информативных и значимых визуализаций данных | Источник: Google&lt;br /&gt;❷ Подробное руководство по выбору цветовой палитры (&lt;a href=&quot;https://blog.datawrapper.de/colors-for-data-vis-style-guides&quot; target=&quot;_blank&quot;&gt;https://blog.datawrapper.de/colors-for-data-vis-style-guides&lt;/a&gt;) для вашей инфографики от Лизы Шарлотты Мут из Datawrapper | Источник: Блог Datawrapper&lt;br /&gt; (&lt;a href=&quot;https://blog.datawrapper.de/&quot; target=&quot;_blank&quot;&gt;https://blog.datawrapper.de/&lt;/a&gt;)❸ Сервис по анализу поисковых запросов hh.ru (&lt;a href=&quot;http://wezochy.ru/hh/&quot; target=&quot;_blank&quot;&gt;http://wezochy.ru/hh/&lt;/a&gt;) (статья (&lt;a href=&quot;https://vc.ru/tribuna/410998-analiziruem-poiskovye-zaprosy-hh-ru&quot; target=&quot;_blank&quot;&gt;https://vc.ru/tribuna/410998-analiziruem-poiskovye-zaprosy-hh-ru&lt;/a&gt;) и сайт (&lt;a href=&quot;http://wezochy.ru/hh/&quot; target=&quot;_blank&quot;&gt;http://wezochy.ru/hh/&lt;/a&gt;) сервиса) | Источник: Телеграм-канал Wezochy &lt;br /&gt; (&lt;a href=&quot;https://t.me/wezochy&quot; target=&quot;_blank&quot;&gt;https://t.me/wezochy&lt;/a&gt;)❹ Видео урок и практическое занятие &amp;quot;Построение веб-приложений с помощью Shiny (&lt;a href=&quot;https://t.me/R4marketing/1002&quot; target=&quot;_blank&quot;&gt;https://t.me/R4marketing/1002&lt;/a&gt;)&amp;quot; | Источник: R4marketing&lt;br /&gt; (&lt;a href=&quot;https://t.me/R4marketing&quot; target=&quot;_blank&quot;&gt;https://t.me/R4marketing&lt;/a&gt;)❺ Видео: HR-кейс Ингосстрах | Как снизить текучесть персонала и повысить эффективность в продажах (&lt;a href=&quot;https://www.youtube.com/watch?v=EGGAzhTubg0&quot; target=&quot;_blank&quot;&gt;https://www.youtube.com/watch?v=EGGAzhTubg0&lt;/a&gt;) | Источник: YouTube-канал (&lt;a href=&quot;https://www.youtube.com/channel/UCaYvUrf7m8vZ8ZbbBfgyJMQ&quot; target=&quot;_blank&quot;&gt;https://www.youtube.com/channel/UCaYvUrf7m8vZ8ZbbBfgyJMQ&lt;/a&gt;) Лаборатории &amp;quot;Гуманитарные Технологии&amp;quot;&lt;br /&gt;❻ HR-у на заметку: из цикла дата-публикаций о старости от «Если быть точным» — исследование о том, как быстро стареет Россия (&lt;a href=&quot;https://tochno.st/materials/cherez-25-let-pozhilykh-lyudey-v-rossii-stanet-bolshe-chem-molodykh-glavnye-fakty-o-tom-kak-stareet-nasha-strana&quot; target=&quot;_blank&quot;&gt;https://tochno.st/materials/cherez-25-let-pozhilykh-lyudey-v-rossii-stanet-bolshe-chem-molodykh-glavnye-fakty-o-tom-kak-stareet-nasha-strana&lt;/a&gt;) | Источник: Если быть точным&lt;br /&gt; (&lt;a href=&quot;https://t.me/tochno_st&quot; target=&quot;_blank&quot;&gt;https://t.me/tochno_st&lt;/a&gt;)❼ Статья Ильи Шутова Без «Табла» и жизнь не та… (&lt;a href=&quot;https://habr.com/ru/post/658657/&quot; target=&quot;_blank&quot;&gt;https://habr.com/ru/post/658657/&lt;/a&gt;), в которой рассматриваются альтернативы мышекликовой BI-аналитике | Источник: Хабр&lt;/p&gt;
  &lt;figure id=&quot;6jyZ&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img3.teletype.in/files/ec/03/ec03da8b-4e7e-488c-b6eb-6ed004e5b45e.png&quot; width=&quot;1280&quot; /&gt;
  &lt;/figure&gt;
  &lt;h2 id=&quot;nYzL&quot;&gt;Подборка материалов #06&lt;/h2&gt;
  &lt;p id=&quot;jUEV&quot;&gt;❶ Визуализация &amp;quot;Как изменился режим дня работающего россиянина, 1934/2021 (&lt;a href=&quot;https://journal.tinkoff.ru/zhrat-spat-stat90/&quot; target=&quot;_blank&quot;&gt;https://journal.tinkoff.ru/zhrat-spat-stat90/&lt;/a&gt;)&amp;quot; | Источник: Тинькофф Журнал&lt;br /&gt; (&lt;a href=&quot;https://journal.tinkoff.ru/&quot; target=&quot;_blank&quot;&gt;https://journal.tinkoff.ru/&lt;/a&gt;)&lt;/p&gt;
  &lt;p id=&quot;CGDR&quot;&gt;❷ Статья про коварные ящики с усами (box plot) (&lt;a href=&quot;https://nightingaledvs.com/ive-stopped-using-box-plots-should-you/&quot; target=&quot;_blank&quot;&gt;https://nightingaledvs.com/ive-stopped-using-box-plots-should-you/&lt;/a&gt;) ... и альтернативы им | Источник: Data-comics&lt;br /&gt; (&lt;a href=&quot;https://t.me/datavizcomics&quot; target=&quot;_blank&quot;&gt;https://t.me/datavizcomics&lt;/a&gt;)&lt;/p&gt;
  &lt;p id=&quot;nxjT&quot;&gt;❸ Примеры 5 интерактивных HR дашбордов в PowerBI (&lt;a href=&quot;https://talentcode.ru/dashboard_examples&quot; target=&quot;_blank&quot;&gt;https://talentcode.ru/dashboard_examples&lt;/a&gt;): дашборд рекрутера, дашборд обучения, дашборд эффективности, дашборд C&amp;amp;B, дашборд бюджета расходов на персонала | Источник: TalentCode&lt;br /&gt; (&lt;a href=&quot;https://talentcode.ru/&quot; target=&quot;_blank&quot;&gt;https://talentcode.ru/&lt;/a&gt;)&lt;/p&gt;
  &lt;p id=&quot;KYfj&quot;&gt;❹ Статья Скотт Беринато &amp;quot;Визуализация, которая работает (&lt;a href=&quot;https://hbr-russia.ru/karera/professionalnyy-i-lichnostnyy-rost/a19761/&quot; target=&quot;_blank&quot;&gt;https://hbr-russia.ru/karera/professionalnyy-i-lichnostnyy-rost/a19761/&lt;/a&gt;)&amp;quot; | Источник: HBR Russia&lt;br /&gt; (&lt;a href=&quot;https://hbr-russia.ru/&quot; target=&quot;_blank&quot;&gt;https://hbr-russia.ru/&lt;/a&gt;)&lt;/p&gt;
  &lt;p id=&quot;jEYr&quot;&gt;❺ Исследование о том, как воздух влияет на уровень продуктивности офисных сотрудников (&lt;a href=&quot;https://vc.ru/s/skillaz/425895-kak-vozduh-vliyaet-na-uroven-produktivnosti-ofisnyh-sotrudnikov&quot; target=&quot;_blank&quot;&gt;https://vc.ru/s/skillaz/425895-kak-vozduh-vliyaet-na-uroven-produktivnosti-ofisnyh-sotrudnikov&lt;/a&gt;) | Источник: VC.ru&lt;br /&gt; (&lt;a href=&quot;https://vc.ru/&quot; target=&quot;_blank&quot;&gt;https://vc.ru/&lt;/a&gt;)&lt;/p&gt;
  &lt;p id=&quot;e92i&quot;&gt;❻ Визуализация отношений на работе: кейс применения ONA, показывающий высокоэффективные и низкоэффективные команды (&lt;a href=&quot;https://medium.com/blockchain-and-the-distributed-workforce/visualising-relationships-at-work-c42b467031b&quot; target=&quot;_blank&quot;&gt;https://medium.com/blockchain-and-the-distributed-workforce/visualising-relationships-at-work-c42b467031b&lt;/a&gt;)| Источник: Medium&lt;/p&gt;
  &lt;figure id=&quot;XIFK&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img2.teletype.in/files/1e/47/1e472472-2c80-40b4-9b7b-4d591494dac2.png&quot; width=&quot;1280&quot; /&gt;
  &lt;/figure&gt;
  &lt;h2 id=&quot;T4z4&quot;&gt;Подборка материалов #07&lt;/h2&gt;
  &lt;p id=&quot;TQe6&quot;&gt;❶ Интересный скролителлинг про проблемы рынка труда в Бельгии (&lt;a href=&quot;https://multimedia.tijd.be/arbeidskrapte/&quot; target=&quot;_blank&quot;&gt;https://multimedia.tijd.be/arbeidskrapte/&lt;/a&gt;) (см. график к посту/используйте встроенный переводчик браузера). По оси X на графике количество ищущих работу, по оси Y — открытые вакансии. Получается, что ровно по диагонали спрос равен предложению. График повернут так, что в правой части графика окажутся вакансии, где людей не хватает, а в левой — где их избыток | Источник: Data.csv (&lt;a href=&quot;https://t.me/data_csv/860&quot; target=&quot;_blank&quot;&gt;https://t.me/data_csv/860&lt;/a&gt;)&lt;/p&gt;
  &lt;p id=&quot;C2DI&quot;&gt;❷ Статья Шмелёв А. Г., Взорин Г. Д., Рыбникова К. С. Шестифакторная модель личности на базе психосемантического исследования русскоязычной лексики личностных черт (&lt;a href=&quot;https://orgpsyjournal.hse.ru/2021-11-3/506385145.html&quot; target=&quot;_blank&quot;&gt;https://orgpsyjournal.hse.ru/2021-11-3/506385145.html&lt;/a&gt;). В статье авторы приводят свидетельства валидности теоретической модели «Большой шестёрки» на базе русскоязычной лексики, и валидности системы ТЕЗАЛ для её применения в качестве инструмента автоматизированной интерпретации результатов психологического тестирования и ассессмента в практике управления персоналом | Источник: Форум ЭСПП (&lt;a href=&quot;http://forum.ht-line.ru/&quot; target=&quot;_blank&quot;&gt;http://forum.ht-line.ru/&lt;/a&gt;)&lt;/p&gt;
  &lt;p id=&quot;nNli&quot;&gt;❸ Статья о том, так ли хороши OKR в любой ситуации? (&lt;a href=&quot;https://habr.com/ru/post/671668/&quot; target=&quot;_blank&quot;&gt;https://habr.com/ru/post/671668/&lt;/a&gt;) | Источник: Хабр&lt;/p&gt;
  &lt;p id=&quot;O9v0&quot;&gt;❹ Статья Русское поле BI-инструментов: с какими системами мы будем теперь работать? (&lt;a href=&quot;https://vc.ru/services/446472-russkoe-pole-bi-instrumentov-s-kakimi-sistemami-my-budem-teper-rabotat&quot; target=&quot;_blank&quot;&gt;https://vc.ru/services/446472-russkoe-pole-bi-instrumentov-s-kakimi-sistemami-my-budem-teper-rabotat&lt;/a&gt;) Интересный материал о современных российских BI системах и особенностях их выбора | Источник: vc.ru&lt;/p&gt;
  &lt;p id=&quot;kMW3&quot;&gt;❺ Мокапы дашбордов от Ромы Бунина (&lt;a href=&quot;https://t.me/revealthedata/673&quot; target=&quot;_blank&quot;&gt;https://t.me/revealthedata/673&lt;/a&gt;) – удобный набор графиков для макетирования дашбордов, который сильно ускоряет разработку макетов | Источник: Reveal the Data (&lt;a href=&quot;https://t.me/revealthedata&quot; target=&quot;_blank&quot;&gt;https://t.me/revealthedata&lt;/a&gt;)&lt;/p&gt;
  &lt;p id=&quot;UPmH&quot;&gt;❻ Запись вебинара «Продуктовый подход в HR (&lt;a href=&quot;https://youtu.be/tBMVkNEoZb4&quot; target=&quot;_blank&quot;&gt;https://youtu.be/tBMVkNEoZb4&lt;/a&gt;)» (советы по внедрению + кейсы) | Источник: Teachbase (&lt;a href=&quot;https://teachbase.ru/&quot; target=&quot;_blank&quot;&gt;https://teachbase.ru/&lt;/a&gt;)&lt;/p&gt;
  &lt;p id=&quot;0kKb&quot;&gt;❼ 🔥 Команда Digital Assessment «ЭКОПСИ» провела исследование «Будущее оценки персонала» и опубликовала результаты исследования (&lt;a href=&quot;https://disk.yandex.ru/i/Tp2KJgz6Ut--vg&quot; target=&quot;_blank&quot;&gt;https://disk.yandex.ru/i/Tp2KJgz6Ut--vg&lt;/a&gt;) на выборке 166 организаций см. в PDF-отчёте | Источник: Канал Павла Безручко&lt;/p&gt;
  &lt;figure id=&quot;ecNH&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img4.teletype.in/files/b7/9a/b79abd43-905b-4a79-920c-439e4ba9caf2.png&quot; width=&quot;1244&quot; /&gt;
  &lt;/figure&gt;
  &lt;h2 id=&quot;W1yl&quot;&gt;Подборка материалов #08&lt;/h2&gt;
  &lt;p id=&quot;oRcn&quot;&gt;❶ Служба исследований hh.ru выяснила на основе опроса более 100 HR-менеджеров, как российские компании используют HR‑аналитику (&lt;a href=&quot;https://ekaterinburg.hh.ru/article/30591&quot; target=&quot;_blank&quot;&gt;https://ekaterinburg.hh.ru/article/30591&lt;/a&gt;) и HR‑автоматизацию для подбора персонала | Источник: hh.ru&lt;br /&gt;❷ Статья Ирины Брун (Руководитель R&amp;amp;D компании Formatta) &amp;quot;Тест способностей: решит ли он ваши HR-задачи &amp;quot; (&lt;a href=&quot;https://vc.ru/hr/479839-test-sposobnostey-reshit-li-on-vashi-hr-zadachi&quot; target=&quot;_blank&quot;&gt;https://vc.ru/hr/479839-test-sposobnostey-reshit-li-on-vashi-hr-zadachi&lt;/a&gt;)| Источник: vc.ru&lt;br /&gt;❸ 📚 Книга месяца: Альберто Кайро &amp;quot;Графики лгут. Как стать информационно грамотным человеком в мире данных?&amp;quot; &lt;br /&gt; (&lt;a href=&quot;https://t.me/People_Analytics/349&quot; target=&quot;_blank&quot;&gt;https://t.me/People_Analytics/349&lt;/a&gt;)❹ 📈 Бесплатный каталог инструментов для работы с данными: на одной странице собраны инструменты для работы с данными (&lt;a href=&quot;http://dorozhnij.com/tools&quot; target=&quot;_blank&quot;&gt;http://dorozhnij.com/tools&lt;/a&gt;) с упором в сторителлинг. Сервисы помогают на всех этапах работы — от сбора до финальной публикации исследования. Инструменты проверены на практике, есть как бесплатные, так и платные. Отдельный фильтр помогает найти no-code и zero-code инструменты, что особенно приятно | Источник: Канал Дата-сторителлинг&lt;br /&gt; (&lt;a href=&quot;https://t.me/data_publication&quot; target=&quot;_blank&quot;&gt;https://t.me/data_publication&lt;/a&gt;)❺ 📍 Гайд по профессии аналитика данных (&lt;a href=&quot;https://t.me/data_study/40&quot; target=&quot;_blank&quot;&gt;https://t.me/data_study/40&lt;/a&gt;)| Источник: Аналитика данных / Data Study&lt;br /&gt; (&lt;a href=&quot;https://t.me/data_study&quot; target=&quot;_blank&quot;&gt;https://t.me/data_study&lt;/a&gt;)❻ Видео: ⭐️ Ловите записи Digital-конференции &amp;quot;Визуализация данных&amp;quot;: 1 день (&lt;a href=&quot;https://youtu.be/cqhGVFlY5Qs&quot; target=&quot;_blank&quot;&gt;https://youtu.be/cqhGVFlY5Qs&lt;/a&gt;), 2 день (&lt;a href=&quot;https://youtu.be/ickZoKmzFl4&quot; target=&quot;_blank&quot;&gt;https://youtu.be/ickZoKmzFl4&lt;/a&gt;), 3 день (&lt;a href=&quot;https://youtu.be/6bZe5lYTfp4&quot; target=&quot;_blank&quot;&gt;https://youtu.be/6bZe5lYTfp4&lt;/a&gt;) | Источник: Sibur Digital Community (SDC) &lt;br /&gt; (&lt;a href=&quot;https://t.me/sdc_channel&quot; target=&quot;_blank&quot;&gt;https://t.me/sdc_channel&lt;/a&gt;)❼ 📆  Напоминаю, что 8 сентября стартует курс &amp;quot;HR-аналитика&amp;quot; (&lt;a href=&quot;https://t.me/People_Analytics/347&quot; target=&quot;_blank&quot;&gt;https://t.me/People_Analytics/347&lt;/a&gt;) от 🔥 Яндекс Практикума. Узнать о курсе больше и начать учиться → (&lt;a href=&quot;https://practicum.yandex.ru/promo/hr-analytics/?utm_source=telegram&amp;utm_medium=performance&amp;utm_campaign=Telegram_performance_promo_hr-analytics-People_Analytics&quot; target=&quot;_blank&quot;&gt;https://practicum.yandex.ru/promo/hr-analytics/?utm_source=telegram&amp;amp;utm_medium=performance&amp;amp;utm_campaign=Telegram_performance_promo_hr-analytics-People_Analytics&lt;/a&gt;)&lt;/p&gt;
  &lt;figure id=&quot;JFH0&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img4.teletype.in/files/38/e3/38e3416e-357a-489a-ad19-711147b4d4ab.jpeg&quot; width=&quot;1280&quot; /&gt;
  &lt;/figure&gt;
  &lt;h2 id=&quot;M1MS&quot;&gt;Подборка материалов #09&lt;/h2&gt;
  &lt;p id=&quot;Zswq&quot;&gt;❶  Data Visualization Style Guidelines: подборки гайдлайнов (&lt;a href=&quot;https://docs.google.com/spreadsheets/d/1F1gm5QLXh3USC8ZFx_M9TXYxmD-X5JLDD0oJATRTuIE/edit#gid=1679646668&quot; target=&quot;_blank&quot;&gt;https://docs.google.com/spreadsheets/d/1F1gm5QLXh3USC8ZFx_M9TXYxmD-X5JLDD0oJATRTuIE/edit#gid=1679646668&lt;/a&gt;) различных компаний от Amy Cesal (&lt;a href=&quot;https://medium.com/nightingale/style-guidelines-92ebe166addc&quot; target=&quot;_blank&quot;&gt;https://medium.com/nightingale/style-guidelines-92ebe166addc&lt;/a&gt;) из Data Visualization Society | Источник: Medium.com&lt;br /&gt; (&lt;a href=&quot;https://medium.com/&quot; target=&quot;_blank&quot;&gt;https://medium.com/&lt;/a&gt;)&lt;/p&gt;
  &lt;p id=&quot;n6BY&quot;&gt;❷  📊 Статья Александра Ботвина про статистическую значимость и размер эффекта (&lt;a href=&quot;https://teletype.in/@h0h1_hr_analytics/Lzvjq48KCCy&quot; target=&quot;_blank&quot;&gt;https://teletype.in/@h0h1_hr_analytics/Lzvjq48KCCy&lt;/a&gt;). Одна из важнейших тем в аналитике и одна из тех тем, что переполнена неправильным понимаем, интерпретацией и использованием. Поэтому давайте разбираться, а Александр вам в этом поможет | Источник: Канал H0H1: про HR-аналитику&lt;br /&gt; (&lt;a href=&quot;https://t.me/h0h1_hr_analytics&quot; target=&quot;_blank&quot;&gt;https://t.me/h0h1_hr_analytics&lt;/a&gt;)&lt;/p&gt;
  &lt;p id=&quot;wSbf&quot;&gt;❸ Статья о текучести кадров, или после кого количества уволившихся стоит бить тревогу (&lt;a href=&quot;https://top-career.ru/blog-hranalytics-quit?utm_source=partner_article_panalytics&quot; target=&quot;_blank&quot;&gt;https://top-career.ru/blog-hranalytics-quit?utm_source=partner_article_panalytics&lt;/a&gt;): когда текучесть — это хорошо, а когда плохо? | Источник: Блог top-career.ru&lt;br /&gt;❹ Надеюсь, что вы уже прочитали мою статью о том, почему в визуализации должно быть мало цветов (&lt;a href=&quot;https://teletype.in/@people_analytics/eNpQcNcfQ5N&quot; target=&quot;_blank&quot;&gt;https://teletype.in/@people_analytics/eNpQcNcfQ5N&lt;/a&gt;)? За рамками статьи остался вопрос создания палитры, поэтому начинаю публиковать ссылки на полезные сервисы-генераторы палитр. Например, этот сервис «i want hue (&lt;a href=&quot;https://medialab.github.io/iwanthue/&quot; target=&quot;_blank&quot;&gt;https://medialab.github.io/iwanthue/&lt;/a&gt;)» позволяет генерировать палитры с оптимально различающимися цветами. &lt;br /&gt;❺ 🔥 Подборка бесплатных курсов по визуализации данных (&lt;a href=&quot;https://www.mltut.com/best-free-data-visualization-courses/&quot; target=&quot;_blank&quot;&gt;https://www.mltut.com/best-free-data-visualization-courses/&lt;/a&gt;): Tableau, Excel, R, Python, d3.js | Источник: Настенька и графики&lt;br /&gt; (&lt;a href=&quot;https://t.me/nastengraph&quot; target=&quot;_blank&quot;&gt;https://t.me/nastengraph&lt;/a&gt;)&lt;/p&gt;
  &lt;p id=&quot;ik7N&quot;&gt;❻ Статья про так называемый «тихий уход» (&lt;a href=&quot;https://habr.com/ru/company/getmatch/blog/685588/&quot; target=&quot;_blank&quot;&gt;https://habr.com/ru/company/getmatch/blog/685588/&lt;/a&gt;) («quiet quitting»), когда сотрудники увольнению и выгоранию предпочитают делать только самый минимум по рабочим задачам, а сама работа отходит на 2ое или 3е место | Источник: habr.ru&lt;br /&gt;❼ Статья от Worklytics о 12 метриках, которые используют компании для улучшения культуры и практик виртуальных совещаний (&lt;a href=&quot;https://www.worklytics.co/blog/top-12-metrics-for-effective-meetings&quot; target=&quot;_blank&quot;&gt;https://www.worklytics.co/blog/top-12-metrics-for-effective-meetings&lt;/a&gt;) сотрудников, чтобы онлайн-встречи не приводили к стрессу и выгоранию для команд. В статье приводятся примеры визуализации данных по каждой метрике | Источник: Блог Worklytics&lt;/p&gt;
  &lt;figure id=&quot;1rmo&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img3.teletype.in/files/2d/f2/2df24edd-2f3c-478b-9988-03e23ce02d29.jpeg&quot; width=&quot;1149&quot; /&gt;
  &lt;/figure&gt;
  &lt;h2 id=&quot;GYkk&quot;&gt;Подборка материалов #10&lt;/h2&gt;
  &lt;p id=&quot;GbmN&quot;&gt;❶ Пример физикализации данных: реальный датавиз – распределение учителей по возрасту (&lt;a href=&quot;https://twitter.com/attilabatorfy/status/1586273025644810242?t=OZv60O5krJEPn89Uxu-j1g&amp;s=19&quot; target=&quot;_blank&quot;&gt;https://twitter.com/attilabatorfy/status/1586273025644810242?t=OZv60O5krJEPn89Uxu-j1g&amp;amp;s=19&lt;/a&gt;) в школе Miskol (Болгария). Физикализация данных – демонстрация их с помощью объектов реального мира| Источник: Data-comics&lt;br /&gt; (&lt;a href=&quot;https://t.me/datavizcomics&quot; target=&quot;_blank&quot;&gt;https://t.me/datavizcomics&lt;/a&gt;)&lt;/p&gt;
  &lt;p id=&quot;YWtN&quot;&gt;❷ 📊 Завершающая статья «Логарифмирование и преобразование переменных (&lt;a href=&quot;https://teletype.in/@h0h1_hr_analytics/Thxi-JleA5B&quot; target=&quot;_blank&quot;&gt;https://teletype.in/@h0h1_hr_analytics/Thxi-JleA5B&lt;/a&gt;)» в цикле статистических статей от Александра Ботвина (&lt;a href=&quot;https://t.me/h0h1_hr_analytics/45&quot; target=&quot;_blank&quot;&gt;https://t.me/h0h1_hr_analytics/45&lt;/a&gt;)| Источник: Канал H0H1: про HR-аналитику&lt;br /&gt; (&lt;a href=&quot;https://t.me/h0h1_hr_analytics&quot; target=&quot;_blank&quot;&gt;https://t.me/h0h1_hr_analytics&lt;/a&gt;)&lt;/p&gt;
  &lt;p id=&quot;grEK&quot;&gt;❸ 🔥 Видео: Под капотом Tableau – вебинар Романа Бунина (&lt;a href=&quot;https://www.youtube.com/watch?v=WU8vSVBB7O4&quot; target=&quot;_blank&quot;&gt;https://www.youtube.com/watch?v=WU8vSVBB7O4&lt;/a&gt;) | karpov.courses&lt;br /&gt;&lt;/p&gt;
  &lt;p id=&quot;J4gP&quot;&gt;❹ 👌 Видео: опубликована запись вебинара «Зачем HR-специалисту аналитика (&lt;a href=&quot;https://youtu.be/ofoGKpaaDUI&quot; target=&quot;_blank&quot;&gt;https://youtu.be/ofoGKpaaDUI&lt;/a&gt;)»&lt;br /&gt;&lt;/p&gt;
  &lt;p id=&quot;t0o5&quot;&gt;❺ 📈 Визуализация данных: перевод статьи (&lt;a href=&quot;https://blog.datawrapper.de/quantitative-vs-qualitative-color-scales/&quot; target=&quot;_blank&quot;&gt;https://blog.datawrapper.de/quantitative-vs-qualitative-color-scales/&lt;/a&gt;) Лизы Шарлотты Мут «Неочевидный выбор: количественная или качественная цветовая палитра? (&lt;a href=&quot;https://leftjoin.ru/blog/dataviz/quantitative-vs-qualitative-color-scales/&quot; target=&quot;_blank&quot;&gt;https://leftjoin.ru/blog/dataviz/quantitative-vs-qualitative-color-scales/&lt;/a&gt;)» | Источник: LEFT JOIN (&lt;a href=&quot;https://t.me/leftjoin&quot; target=&quot;_blank&quot;&gt;https://t.me/leftjoin&lt;/a&gt;)&lt;/p&gt;
  &lt;figure id=&quot;1WKf&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img4.teletype.in/files/7a/2a/7a2a5790-f9da-4736-9985-a97ad316ebe9.jpeg&quot; width=&quot;961&quot; /&gt;
  &lt;/figure&gt;
  &lt;h2 id=&quot;9QzM&quot;&gt;Подборка материалов #11&lt;/h2&gt;
  &lt;p id=&quot;HwkE&quot;&gt;❶ 📈 Объявлены победители Information is Beautiful Awards 2022 (&lt;a href=&quot;https://www.informationisbeautifulawards.com/&quot; target=&quot;_blank&quot;&gt;https://www.informationisbeautifulawards.com/&lt;/a&gt;). В номинации «Бизнес-аналитика» золото получила неоднозначная работа The star of our work (&lt;a href=&quot;https://www.informationisbeautifulawards.com/showcase/4880-the-star-of-our-work&quot; target=&quot;_blank&quot;&gt;https://www.informationisbeautifulawards.com/showcase/4880-the-star-of-our-work&lt;/a&gt;) (см. картинку к посту). Странно видеть дата-арт о работе команды в виде «паутины» проектов и изменение числа сотрудников в центре визуализации. Как вам? При этом работа в виде классического HR-дашборда (&lt;a href=&quot;https://www.informationisbeautifulawards.com/showcase/4646-hr-attrition-dashboard&quot; target=&quot;_blank&quot;&gt;https://www.informationisbeautifulawards.com/showcase/4646-hr-attrition-dashboard&lt;/a&gt;) от Pradeep Kumar (&lt;a href=&quot;https://public.tableau.com/app/profile/pradeepkumar.g&quot; target=&quot;_blank&quot;&gt;https://public.tableau.com/app/profile/pradeepkumar.g&lt;/a&gt;), о котором я писал летом (&lt;a href=&quot;https://t.me/People_Analytics/333&quot; target=&quot;_blank&quot;&gt;https://t.me/People_Analytics/333&lt;/a&gt;), получила лишь бронзу ☹️ 🤯&lt;br /&gt;❷ ✅ Новый телегам-канал HR Data  (&lt;a href=&quot;https://t.me/hr_data&quot; target=&quot;_blank&quot;&gt;https://t.me/hr_data&lt;/a&gt;)– канал о том, как использовать data-driven подход в HR, чтобы сделать нашу жизнь лучше. Из последних интересных публикаций: Переработки на рабочем месте (&lt;a href=&quot;https://t.me/hr_data/26&quot; target=&quot;_blank&quot;&gt;https://t.me/hr_data/26&lt;/a&gt;), Гендерный разрыв в заработной плате  (&lt;a href=&quot;https://t.me/hr_data/24&quot; target=&quot;_blank&quot;&gt;https://t.me/hr_data/24&lt;/a&gt;)💁‍♂️🙅‍♀️ и Вовлеченность сотрудников на рабочем месте (&lt;a href=&quot;https://t.me/hr_data/18&quot; target=&quot;_blank&quot;&gt;https://t.me/hr_data/18&lt;/a&gt;) 👀&lt;br /&gt;❸ 🔥 Новости рынка психометрических инструментов: обновилась линейка продуктов компании ЭКОПСИ (&lt;a href=&quot;https://t.me/digital_assessment/207&quot; target=&quot;_blank&quot;&gt;https://t.me/digital_assessment/207&lt;/a&gt;). Обращает на себя внимание новый опросник эмоционального интеллекта REACT (&lt;a href=&quot;https://digital.ecopsy.ru/products/react&quot; target=&quot;_blank&quot;&gt;https://digital.ecopsy.ru/products/react&lt;/a&gt;). Опросник REACT оценивает наиболее доказанную модель эмоционального интеллекта: эмоциональная осознанность, управление эмоциями, понимание эмоций и влияние на эмоции (ипсативный формат, надежность шкал ~ 0.8, критериальная валидность &amp;gt; 0.2) | Источник: Digital Assessment&lt;br /&gt; (&lt;a href=&quot;https://t.me/digital_assessment/&quot; target=&quot;_blank&quot;&gt;https://t.me/digital_assessment/&lt;/a&gt;)❹ 👌 Статистика и R (&lt;a href=&quot;https://t.me/stats_for_science&quot; target=&quot;_blank&quot;&gt;https://t.me/stats_for_science&lt;/a&gt;) — канал посвящен разбору статистических методов и языку программирования R. Гоу изучать R!&lt;br /&gt;❺ 📊 Полезные материалы про DataLens (&lt;a href=&quot;https://t.me/revealthedata/777&quot; target=&quot;_blank&quot;&gt;https://t.me/revealthedata/777&lt;/a&gt;) | Источник: Reveal the Data (&lt;a href=&quot;https://t.me/revealthedata/&quot; target=&quot;_blank&quot;&gt;https://t.me/revealthedata/&lt;/a&gt;)&lt;/p&gt;
  &lt;figure id=&quot;HkZv&quot; class=&quot;m_original&quot;&gt;
    &lt;img src=&quot;https://img3.teletype.in/files/ac/b1/acb1ff1f-382e-4a66-978f-7628151bf7c9.jpeg&quot; width=&quot;767&quot; /&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;nqKj&quot;&gt;👌 Пополняемый сборник всех дайджестов по ссылке (&lt;a href=&quot;https://teletype.in/@people_analytics/JcAwh3pUjfo&quot; target=&quot;_blank&quot;&gt;https://teletype.in/@people_analytics/JcAwh3pUjfo&lt;/a&gt;) или по хэштегу #дайджест. Поддержка канала: нажать кнопку задонатить в шапке канала или сделать перевод любой суммы (&lt;a href=&quot;https://yoomoney.ru/to/41001358931204&quot; target=&quot;_blank&quot;&gt;https://yoomoney.ru/to/41001358931204&lt;/a&gt;) через yoomoney.&lt;/p&gt;

</content></entry><entry><id>people_analytics:hS1Q-lLrpj8</id><link rel="alternate" type="text/html" href="https://teletype.in/@people_analytics/hS1Q-lLrpj8?utm_source=teletype&amp;utm_medium=feed_atom&amp;utm_campaign=people_analytics"></link><title>Более сложные модели IRT: 2PL</title><published>2022-05-27T01:29:30.900Z</published><updated>2022-05-27T01:29:30.900Z</updated><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://img2.teletype.in/files/92/41/92419614-75d6-4e08-ac2e-34b01c49279b.png"></media:thumbnail><category term="psihometrika" label="психометрика"></category><summary type="html">&lt;img src=&quot;https://img2.teletype.in/files/9b/9d/9b9dede6-7c26-47b8-85ab-98e659d369b9.png&quot;&gt;Рубрика #приглашенный_эксперт #психометрика #IRT #R</summary><content type="html">
  &lt;p id=&quot;80h4&quot;&gt;Рубрика #приглашенный_эксперт #психометрика #IRT #R&lt;/p&gt;
  &lt;p id=&quot;sI3b&quot;&gt;Публикую &lt;strong&gt;вторую часть поста&lt;/strong&gt; (см. &lt;a href=&quot;https://t.me/People_Analytics/289&quot; target=&quot;_blank&quot;&gt;первую часть&lt;/a&gt;) в новой рубрике канала #приглашенный_эксперт. Во второй части &lt;a href=&quot;https://www.hse.ru/org/persons/161002806&quot; target=&quot;_blank&quot;&gt;Денис Федерякин&lt;/a&gt; рассматривает более сложные модели IRT.&lt;/p&gt;
  &lt;p id=&quot;iioE&quot;&gt;Двухпараметрическая логистическая модель Алана Бирнбаума (2PL) отличается от модели Раша (1PL), про которую мы &lt;a href=&quot;https://teletype.in/@people_analytics/Re13S-X7wgo&quot; target=&quot;_blank&quot;&gt;говорили в прошлый раз&lt;/a&gt;, добавлением еще одного параметра для каждого задания – &lt;strong&gt;дискриминативности этого задания&lt;/strong&gt;. &lt;strong&gt;Дискриминативность &lt;/strong&gt;– это &amp;quot;чувствительность&amp;quot; задания к изменению в латентной характеристике. Этот параметр называется так, потому что психометрики хотят, чтобы задания &lt;em&gt;дискриминировали&lt;/em&gt; респондентов по уровню способности: нужно, чтобы слабые респонденты задания решали неправильно, а сильные – правильно. Психометрики хотят иметь задания с высокой дискриминативностью в тесте, потому что, когда задания сильно чувствительны к изменению в способности, надежность измерения повышается.&lt;/p&gt;
  &lt;p id=&quot;WfUB&quot;&gt;Если сравнить формулы моделей 1PL и 2PL, становится понятно, что 1PL – это частный случай 2PL, в котором все задания имеют одинаковую дискриминативность (что в практике, конечно же, никогда не происходит). Однако разница между этими моделями в интерпретации гораздо более глубокая, чем эти математические отношения между моделями. Тот факт, что все задания в 1PL имеют одинаковую дискриминативность приводит к тому, что вероятность правильно решить более легкое задание на всем континууме способности (т.е., для всех респондентов) более высокая. Это значит, что иерархия заданий по трудности всегда едина в 1PL. Соответственно, это позволяет строить т.н. &amp;quot;карту конструкта&amp;quot; – от того, какие задания являются самыми легкими, до того, какие являются самыми трудными.&lt;/p&gt;
  &lt;figure id=&quot;ZggD&quot; class=&quot;m_original&quot;&gt;
    &lt;img src=&quot;https://img2.teletype.in/files/9b/9d/9b9dede6-7c26-47b8-85ab-98e659d369b9.png&quot; width=&quot;656&quot; /&gt;
    &lt;figcaption&gt;См. код на R ниже&lt;/figcaption&gt;
  &lt;/figure&gt;
  &lt;pre id=&quot;RdKv&quot; data-lang=&quot;r&quot;&gt;theta = seq(-3,3, .1)
b1 = -0.5
a1 = 1.1
b2 = 0
a2 = 1.7
P1 = 1 / (1 + exp(-1*(a1*(theta - b1))))
P2 = 1 / (1 + exp(-1*(a2*(theta - b2))))
plot(theta, P1, type = &amp;quot;l&amp;quot;, ylim = c(0,1), col=&amp;quot;red&amp;quot;,
     main = &amp;quot;Два задания в 2PL модели&amp;quot;,
     xlab = &amp;quot;Способность (латентный параметр) в логитах&amp;quot;,
     ylab = &amp;quot;Вероятность правильного ответа&amp;quot;)
par(new=TRUE)
plot(theta, P2, type = &amp;quot;l&amp;quot;, ylim = c(0,1), col=&amp;quot;blue&amp;quot;,  xlab = &amp;quot;&amp;quot;, ylab = &amp;quot;&amp;quot;)&lt;/pre&gt;
  &lt;p id=&quot;7BRb&quot;&gt;Теперь, посмотрим на рисунок двух характеристических кривых заданий в 2PL (&lt;strong&gt;характеристическая кривая задания&lt;/strong&gt; – это функция, отражающая вероятность решить данное задание на разных уровнях способности). Из-за то, что задания в рамках 2PL могут отличаться (т.е., практически всегда отличаются) по дискриминативности, их характеристические кривые пересекаются. Это приводит к тому, что до их точки пересечения красное задание легче, чем синее (вероятность его решить выше), а после точки их пересечения – все наоборот. Это приводит к тому, иерархию заданий по трудности в 2PL выстроить невозможно. Даже несмотря на то, что параметр «трудности» все равно есть в 2PL модели, ранжирование задание по нему не имеет смысла, т.к. после каждого пересечения двух характеристических кривых, происходит изменение порядка заданий.&lt;/p&gt;
  &lt;p id=&quot;RcdO&quot;&gt;Конечно же, это математическое различие сказывается и на согласии данных с моделью. Модель 2PL гораздо менее придирчива, чем 1PL к качеству заданий: больше параметров = модель гибче = больше заданий находятся в согласии с ней. Поэтому, когда тест разрабатывается, например, под 1PL модель, требуется гораздо больший запас заданий до апробации, потому что очень много из них будут признаны несогласующимися с ней и выкинуты из теста.&lt;/p&gt;
  &lt;p id=&quot;EGpN&quot;&gt;Такая интерпретационная тонкость определяет, как эти модели применяются в психометрической практике. Так, 1PL модели популярны при моделировании образовательных тестов (и иногда – тестов достижений). Это обосновано интерпретационно, потому что, например, школьник не может решать квадратные уравнения, пока он не знает, как решать линейные. В этом смысле, выстраивание карты конструкта в терминах заданий оправдано, потому что сам по себе предмет измерения имеет упорядоченность в терминах поведенческих проявлений. Однако 2PL чаще применяется при психологических измерениях. В них гораздо труднее выстроить единую карту конструкта, и считать, что, например, в тесте на экстраверсию всем респондентам труднее заговорить с незнакомым человеком на улице, чем на вечеринке у друзей (или наоборот). Таким образом, разработка теста для 1PL больше похожа на стратегическое размещение зданий на карте конструкта – от простых к сложным. Модель 2PL же извлекает из данных некоторую способность, которая просто является чем-то наиболее общим из всех заданий. Однако в самом простом случае все модели IRT все еще являются одномерными – они допускают, что ответы на все заложенные в них задания зависят от одной способности.&lt;/p&gt;
  &lt;p id=&quot;6FcK&quot;&gt;Напоминаю, что сотрудники Института образования НИУ ВШЭ подготовили &lt;strong&gt;цикл программ дополнительного профессионального образования&lt;/strong&gt;, который поможет &lt;a href=&quot;https://ioe.hse.ru/monitoring/psychodpo?_r=8811181649699100.18427&amp;__t=6885776&amp;__r=OK&quot; target=&quot;_blank&quot;&gt;глубже разобраться в психометрике всем желающим&lt;/a&gt;. Эти программы научат не только интерпретации и понимаю структуры психометрических моделей, но и их применению на языке программирования R (см. код выше в тексте второй части).&lt;/p&gt;
  &lt;p id=&quot;1CPh&quot;&gt;Обучение начинается &lt;strong&gt;30 мая 2022 года&lt;/strong&gt; (см. более &lt;a href=&quot;https://ioe.hse.ru/monitoring/psychodpo?_r=8811181649699100.18427&amp;__t=6885776&amp;__r=OK&quot; target=&quot;_blank&quot;&gt;подробную информацию об этом цикле программ повышения квалификации&lt;/a&gt;).&lt;/p&gt;

</content></entry><entry><id>people_analytics:Re13S-X7wgo</id><link rel="alternate" type="text/html" href="https://teletype.in/@people_analytics/Re13S-X7wgo?utm_source=teletype&amp;utm_medium=feed_atom&amp;utm_campaign=people_analytics"></link><title>Что такое современная теория тестирования (Item Response Theory, IRT)?</title><published>2022-05-13T15:02:50.707Z</published><updated>2022-05-13T15:02:50.707Z</updated><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://img4.teletype.in/files/f8/ba/f8ba7bfa-a9fc-4ff1-9ee5-6a76e3ca3a85.png"></media:thumbnail><category term="psihometrika" label="психометрика"></category><summary type="html">&lt;img src=&quot;https://img1.teletype.in/files/48/c3/48c32356-b5b9-438f-a80e-57b939d5e614.png&quot;&gt;Рубрика #приглашенный_эксперт #психометрика #IRT #R</summary><content type="html">
  &lt;p id=&quot;UCeK&quot;&gt;Рубрика #приглашенный_эксперт #психометрика #IRT #R&lt;/p&gt;
  &lt;p id=&quot;iy53&quot;&gt;&lt;em&gt;Публикую первый пост в новой рубрике канала, в которой приглашенный эксперт раскрывает кратко и доступным языком какую-либо тему из области HR-аналитики/Психометрики/Оценки персонала/Анализа и визуализации данных. Приглашенный эксперт рубрики – &lt;a href=&quot;https://www.hse.ru/org/persons/161002806&quot; target=&quot;_blank&quot;&gt;Денис Федерякин&lt;/a&gt;, научный сотрудник Центра психометрики и измерений в образовании Института образования НИУ ВШЭ, рассказывает о том, что такое современная теория тестирования и как глубже разобраться в психометрике всем желающим.&lt;/em&gt;&lt;/p&gt;
  &lt;p id=&quot;kJSX&quot;&gt;&lt;strong&gt;Часто говорят – Психометрика, подразумевают – IRT, говорят – IRT, подразумевают – Психометрика. Однако это совсем разные вещи.&lt;/strong&gt;&lt;/p&gt;
  &lt;p id=&quot;Faeu&quot;&gt;IRT – это группа методов психометрического моделирования вероятности наблюдаемого поведения, которую очень удобно использовать в психологических и образовательных исследованиях, а также для рекомендательных систем и улучшения качества измерительного инструмента. IRT в своем наипростейшем виде подразумевает несколько фундаментальных теоретических допущений.&lt;/p&gt;
  &lt;p id=&quot;rNjZ&quot;&gt;Во-первых, существует некоторый латентный параметр респондента по конструкту – уровень его способности. «Латентный» означает, что этот параметр может быть только &lt;em&gt;вычислен&lt;/em&gt;, и его нельзя пронаблюдать напрямую. Значение этого параметра у каждого респондента своё (свой уровень способности), и это всё, чем различаются респонденты между собой в терминах изучаемого конструкта. Именно этот параметр респондента мы и хотим получить и использовать вместо простой суммы баллов за задания, потому что эта характеристика обладает более мощными математическими свойствами и более надежна.&lt;/p&gt;
  &lt;p id=&quot;OOxS&quot;&gt;Во-вторых, существует латентный параметр задания – уровень его трудности. Этот параметр описывает различия между заданиями точно так же, как параметр способности – различия между респондентами, и обладает теми же свойствами, что и параметр респондента.&lt;/p&gt;
  &lt;p id=&quot;PwHV&quot;&gt;В-третьих, соотношение этих параметров определяет вероятность того, что каждый респондент верно (и, соответственно, неверно) решит каждое из заданий теста. Это соотношение управляется психометрической моделью – уравнением, которое отражает какие-то теоретические допущения о процессе ответа и природе измеряемого конструкта.&lt;/p&gt;
  &lt;figure id=&quot;eGk4&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img1.teletype.in/files/48/c3/48c32356-b5b9-438f-a80e-57b939d5e614.png&quot; width=&quot;2100&quot; /&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;RkEN&quot;&gt;Продолжая описанный пример, возьмем т.н. одномерную дихотомическую логистическую модель Г. Раша. В ней как раз у каждого задания только один параметр (трудность), а у респондента – одна способность. Уравнение этой модели подразумевает, что измеряемый конструкт состоит только из одного континуума способности, у него нет компонентов (он одномерный), задания могут быть решены только полностью неправильно или только полностью правильно (дихотомическая), а вероятность решить одно конкретное задание с возрастанием способности описывается с помощью логистической функции. Из этих допущений вытекает еще несколько (вероятно, более интересных), но про них мы поговорим в следующий раз.&lt;/p&gt;
  &lt;p id=&quot;dPZ4&quot;&gt;Это все касается описания самой базовой модели IRT. Более сложные модели описывают более сложные ситуации измерения. Например, случаи, когда для описания различий между заданиями нужно больше параметров заданий, когда конструкт состоит из нескольких черт, когда задания допускают частично верные решения, и т.д. Параллельно с этим, IRT позволяет решать огромное количество проблем, связанных с тестированием, в глубине изучать качество теста, и повышать его психометрические характеристики.&lt;/p&gt;
  &lt;p id=&quot;ysK0&quot;&gt;Психометрика – это научная дисциплина, которая изучает измерения в социальных науках. Она затрагивает вопросы не только математического моделирования результатов тестирования, но и философские вопросы измерений, построение определений конструктов, их операционализации, анализ качества инструментов измерения, корректность использования результатов измерения, и т.д. Поэтому IRT – это только одна из областей психометрики. А описанная выше модель Раша – это только одна из моделей IRT.&lt;/p&gt;
  &lt;p id=&quot;y9At&quot;&gt;Сотрудники Института образования НИУ ВШЭ подготовили &lt;strong&gt;цикл программ дополнительного профессионального образования&lt;/strong&gt;, который поможет &lt;a href=&quot;https://ioe.hse.ru/monitoring/psychodpo?_r=8811181649699100.18427&amp;__t=6885776&amp;__r=OK&quot; target=&quot;_blank&quot;&gt;глубже разобраться в психометрике всем желающим&lt;/a&gt;. Цикл состоит из двух направлений: (1) программы по разработке и квалифицированному использованию тестов и опросников, и (2) программы по статистическому моделированию результатов измерения.&lt;/p&gt;
  &lt;p id=&quot;lNQX&quot;&gt;Слушатели программ первого направления научатся правильно операционализировать характеристику (психологическую или образовательную), которую они хотят измерить, разрабатывать задания, применять инструменты измерения, квалифицированно выбирать инструмент измерения под конкретные цели, понимать ограничения каждого из инструментов и видеть их сильные и слабые стороны.&lt;/p&gt;
  &lt;p id=&quot;3i05&quot;&gt;Слушатели второго направления получат доступ к иерархии программ, которая плавно и безболезненно введет их в курс сложного психометрического моделирования: от самых основ до самых современных психометрических моделей, способных извлекать из данных тестирования огромное количество информации о респондентах, о заданиях, и о их взаимодействии. Эти программы научат не только интерпретации и понимаю структуры психометрических моделей, но и их применению на языке программирования R.&lt;/p&gt;
  &lt;p id=&quot;efSb&quot;&gt;Слушатели могут выбрать ту программу, которая наиболее полно отвечает их потребностям и проектам, или открывает путь к желаемой работе. Все обучение проходит дистанционно по видеосвязи, но в синхронном режиме. Каждая программа включает два академических часа индивидуальной консультации с преподавателем программы по выбору. При успешном завершении каждой из программ, слушателям вручается удостоверение государственного образца.&lt;/p&gt;
  &lt;p id=&quot;23J1&quot;&gt;Обучение начинается &lt;strong&gt;30 мая 2022 года&lt;/strong&gt; (см. более &lt;a href=&quot;https://ioe.hse.ru/monitoring/psychodpo?_r=8811181649699100.18427&amp;__t=6885776&amp;__r=OK&quot; target=&quot;_blank&quot;&gt;подробную информацию об этом цикле программ повышения квалификации&lt;/a&gt;).&lt;/p&gt;

</content></entry><entry><id>people_analytics:F4zHxSSrMbk</id><link rel="alternate" type="text/html" href="https://teletype.in/@people_analytics/F4zHxSSrMbk?utm_source=teletype&amp;utm_medium=feed_atom&amp;utm_campaign=people_analytics"></link><title>Мои приложения на shiny</title><published>2022-04-19T20:38:06.268Z</published><updated>2022-04-19T20:38:06.268Z</updated><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://img1.teletype.in/files/48/d7/48d7789d-3040-47fe-8fa2-c2087aa82f47.png"></media:thumbnail><category term="r" label="R"></category><summary type="html">&lt;img src=&quot;https://img4.teletype.in/files/f1/09/f109945a-9326-485c-adb6-ba5831aeb1c9.png&quot;&gt;Ссылка на приложение: https://psych.shinyapps.io/corplot/</summary><content type="html">
  &lt;h2 id=&quot;cjYa&quot;&gt;&lt;strong&gt;Корреляция и размер выборки: волнение в океане личностных факторов&lt;/strong&gt;&lt;/h2&gt;
  &lt;p id=&quot;P7xq&quot;&gt;Ссылка на приложение: &lt;a href=&quot;https://psych.shinyapps.io/corplot/&quot; target=&quot;_blank&quot;&gt;https://psych.shinyapps.io/corplot/&lt;/a&gt;&lt;/p&gt;
  &lt;figure id=&quot;LHAs&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img4.teletype.in/files/f1/09/f109945a-9326-485c-adb6-ba5831aeb1c9.png&quot; width=&quot;1096&quot; /&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;PZZV&quot;&gt;Интерактивная анимация в виде shiny-приложения, которая демонстрирует влияние выборочных флуктуаций на корреляционную структуру пунктов личностного опросника (набор данных bfi из пакета psych). Из генеральной совокупности в 2800 человек случайным образом извлекаются выборки испытуемых (слайдер - &amp;#x27;Случайных выборок&amp;#x27;) по N человек в каждой (слайдер - &amp;#x27;Размер выборки&amp;#x27;). На выборке вычислялись корреляции между 10 вопросами - на Экстраверсию (E1-E5) и Нейротизм (N1-N5). Сила связи отражается насыщенностью цвета, направление - цветом (отрицательные связи обозначаются оттенками синего). (см. &lt;a href=&quot;http://forum.ht-line.ru/threads/volnenie-v-okeane-lichnostnyx-faktorov.1562/&quot; target=&quot;_blank&quot;&gt;дискуссию на форуме ЭСПП&lt;/a&gt;).&lt;/p&gt;
  &lt;h2 id=&quot;rqJQ&quot;&gt;Длина тестовой шкалы&lt;/h2&gt;
  &lt;p id=&quot;moXV&quot;&gt;Ссылка на приложение: &lt;a href=&quot;https://psych.shinyapps.io/test_scale/&quot; target=&quot;_blank&quot;&gt;https://psych.shinyapps.io/test_scale/&lt;/a&gt; &lt;/p&gt;
  &lt;figure id=&quot;oMli&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img2.teletype.in/files/1b/53/1b536b00-f02e-4733-bf33-59cc3adfcc3a.png&quot; width=&quot;1079&quot; /&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;ZxO5&quot;&gt;Ещё одна интерактивная визуализацию &amp;quot;Длина тестовой шкалы&amp;quot; к одной из &lt;a href=&quot;http://forum.ht-line.ru/threads/dlina-testovoj-shkaly-granicy-ocenok-i-metod-monte-karlo.2246/#post-19582&quot; target=&quot;_blank&quot;&gt;дискуссий на форуме ЭСПП&lt;/a&gt; про случайное угадывание ответов в тестах знаний (квалификационных тестах). Применяем метод Монте-Карло, то есть метод моделирования (в данном случае распределения тестовых баллов и изучаем влияние артефакта случайного угадывания в зависимости от длины теста. В организациях часто используют тесты для проверки знаний кандидатов или сотрудников. При этом большинство авторов-разработчиков находится в т.н. &amp;quot;интеллектуальной иллюзии&amp;quot;. Например, при составлении вопросов на проверку знаний, интуитивно кажется, что всего 10 вопросов для проверки знаний достаточно. Если человек правильно ответил на 6 или больше вопросов, то это точно НЕ СЛУЧАЙНО: он что-то знает в этой области или хотя бы догадывается. Эта граница &amp;quot;зачета&amp;quot; (больше 5 баллов) -- действительно понимается большинством как истинная. Как вы уже поняли, но это не так. Кажется почти невозможным, что человек СЛУЧАЙНО наберет 6, 7 или 8 баллов из 10 по тесту знаний. Но метод Монте-Карло (метод моделирования с помощью функции случайных чисел) наглядно показывает нам, что для шкалы из 10 заданий с 4 вариантами ответа 6 баллов и более наберут 189 человек из 10 000, отвечавших на вопросы случайным образом (это примерно 2 из 100).&lt;br /&gt;2 из 100 -- это много или мало? А вот это зависит от организационной ситуации применения теста, если быть точным, от цены ошибки в каждом конкретном случае. Одно дело, если мы с помощью такого теста отбираем кассиров и 2 из 100 (1 из 50) принятых на работу у нас оказались профнепригодными. Недостача -- штука неприятная, но, скажем так, терпимая. И совсем другое, когда профнепригодным оказался 1 из 50 операторов атомной станции.&lt;br /&gt;Для тех, кто хочет подробно разобраться в теме, увидеть, какое распределение тестовых баллов получается при случайном прохождении теста респондентами, как оно меняется в зависимости от количества заданий в тесте и числа вариантов ответа, то смотрите мою интерактивную наглядную иллюстрацию (https://psych.shinyapps.io/test_scale/) с применением метода Монте-Карло.&lt;br /&gt;Благодарность профессору А.Г. Шмелеву &lt;a href=&quot;http://forum.ht-line.ru/threads/dlina-testovoj-shkaly-granicy-ocenok-i-metod-monte-karlo.2246/&quot; target=&quot;_blank&quot;&gt;за дискуссию на форуме ЭСПП&lt;/a&gt;. &lt;/p&gt;
  &lt;h2 id=&quot;u5jc&quot;&gt;IQ-шкала: визуализация распределения баллов&lt;/h2&gt;
  &lt;p id=&quot;Gaxj&quot;&gt;Ссылка на приложение: &lt;a href=&quot;https://psych.shinyapps.io/distiqscores/&quot; target=&quot;_blank&quot;&gt;https://psych.shinyapps.io/distiqscores/&lt;/a&gt;&lt;/p&gt;
  &lt;figure id=&quot;nXPt&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img2.teletype.in/files/d5/34/d5345aac-ea69-4288-bfcb-c0bc70f612a9.png&quot; width=&quot;1067&quot; /&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;8zfw&quot;&gt;На фб-странице компании BSSL встретился очень хороший &lt;a href=&quot;https://www.facebook.com/bssl.ru/photos/a.235356926621053.1073741828.227801877376558/797853003704773/?type=3&quot; target=&quot;_blank&quot;&gt;популярный текст &amp;quot;Что такое IQ?&amp;quot;&lt;/a&gt;, в котором доступно рассказывается про IQ баллы. Я решил сделать интерактивную визуализацию к данной статье.&lt;/p&gt;
  &lt;h2 id=&quot;XMCp&quot;&gt;МОНЭКС: анализ и визуализация данных экспертиз в рамках проекта&lt;/h2&gt;
  &lt;p id=&quot;8RYD&quot;&gt;Ссылка на приложение: &lt;a href=&quot;http://monex-online.ru&quot; target=&quot;_blank&quot;&gt;http://monex-online.ru&lt;/a&gt;&lt;/p&gt;
  &lt;figure id=&quot;pItl&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img3.teletype.in/files/ec/d4/ecd4f653-1ba2-4f87-a4f9-212879740189.png&quot; width=&quot;1093&quot; /&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;hWG3&quot;&gt;Проект Многокритериальной ОНлайн-ЭКСпертизы (МОНЭКС) направлен на повышение качества психодиагностических методик, применяемых в Российской Федерации, а также на появление и поддержание действующего на постоянной основе профессионального сообщества высококвалифицированных экспертов в сфере психологической диагностики, выполняющих объективную и независимую оценку качественных и психометрических характеристик психодиагностических методик. В том числе методик, используемых в рамках #оценка_персонала организаций.&lt;/p&gt;

</content></entry></feed>