<?xml version="1.0" encoding="utf-8" ?><feed xmlns="http://www.w3.org/2005/Atom" xmlns:tt="http://teletype.in/" xmlns:opensearch="http://a9.com/-/spec/opensearch/1.1/"><title>Саша</title><author><name>Саша</name></author><id>https://teletype.in/atom/hinvics</id><link rel="self" type="application/atom+xml" href="https://teletype.in/atom/hinvics?offset=0"></link><link rel="alternate" type="text/html" href="https://teletype.in/@hinvics?utm_source=teletype&amp;utm_medium=feed_atom&amp;utm_campaign=hinvics"></link><link rel="next" type="application/rss+xml" href="https://teletype.in/atom/hinvics?offset=10"></link><link rel="search" type="application/opensearchdescription+xml" title="Teletype" href="https://teletype.in/opensearch.xml"></link><updated>2026-05-02T11:24:30.143Z</updated><entry><id>hinvics:2Pg8kJ3asLR</id><link rel="alternate" type="text/html" href="https://teletype.in/@hinvics/2Pg8kJ3asLR?utm_source=teletype&amp;utm_medium=feed_atom&amp;utm_campaign=hinvics"></link><title>Population Stability Index</title><published>2023-10-09T11:13:36.671Z</published><updated>2023-10-09T11:20:51.516Z</updated><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://img1.teletype.in/files/0c/2e/0c2e9864-fd2b-4047-a61d-e6d0e8265e95.png"></media:thumbnail><summary type="html">&lt;img src=&quot;https://img1.teletype.in/files/0e/f2/0ef2c32d-cc20-453f-af16-77dbd743338c.png&quot;&gt;Есть такая штука, называется Population Stability Index (PSI). PSI — это метрика оценивающая стабильность распределения данных. Использовать эту оценку можно по-разному. Этой оценкой активно пользуются в финтехе, как ключевой мерой дрифта признаков. Например, вы обучили модель риска во время экономического роста два года назад, а хотите применять эту модель на более актуальных данных, во время кризиса. Вам нужно оценить, насколько стабильно распределение ключевых признаков между двумя периодами и как это может повлиять на модель скоринга.</summary><content type="html">
  &lt;p id=&quot;LQ4Y&quot;&gt;Есть такая штука, называется Population Stability Index (PSI). PSI — это метрика оценивающая стабильность распределения данных. Использовать эту оценку можно по-разному. Этой оценкой активно пользуются в финтехе, как ключевой мерой дрифта признаков. Например, вы обучили модель риска во время экономического роста два года назад, а хотите применять эту модель на более актуальных данных, во время кризиса. Вам нужно оценить, насколько стабильно распределение ключевых признаков между двумя периодами и как это может повлиять на модель скоринга.&lt;/p&gt;
  &lt;figure id=&quot;usjO&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img1.teletype.in/files/0e/f2/0ef2c32d-cc20-453f-af16-77dbd743338c.png&quot; width=&quot;6000&quot; /&gt;
    &lt;figcaption&gt;Распределение нашего признака в разных выборках&lt;/figcaption&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;zEfb&quot;&gt;Допустим у нас имеется две выборки для некоторой оцениваемой переменной. Одна выборка это данные на которых обучалась модель (данные двух летней давности), вторая — более актуальные данные.&lt;/p&gt;
  &lt;p id=&quot;4d5b&quot;&gt;Как вы можете видеть выше, распределение тренировочной выборки (синий) немного сгладилось в распределении актуальной выборки (зеленый) и имеет более плоскую верхнюю часть кривой. Визуально видно, что распределение меняется, но хочется получить количественный способ измерить сдвиг, а не качественный — угадать, насколько я должен быть обеспокоен. Как раз PSI — это отличный способ измерить это.&lt;/p&gt;
  &lt;figure id=&quot;pp7z&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img4.teletype.in/files/39/50/395011e8-80eb-4d44-b983-523943fefcd9.png&quot; width=&quot;6000&quot; /&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;3pHG&quot;&gt;Диапазон значений тренировочной выборки мы делим на 10 групп и подсчитываем количество значений в каждом сегменте для тренировочной и актуальной выборки, а затем делим на общее значение каждой из выборок, чтобы получить процент по каждому сегменту. В конечном итоге мы получаем распределение как мы могли видеть ранее, но дискретизированное.&lt;/p&gt;
  &lt;p id=&quot;OeDQ&quot;&gt;&lt;code&gt;PSI=∑((Actual - Expected)×ln(Actual/Expected))&lt;/code&gt;&lt;/p&gt;
  &lt;p id=&quot;tM6c&quot;&gt;&lt;/p&gt;
  &lt;figure id=&quot;7znd&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img1.teletype.in/files/c1/0b/c10b4fcf-70c3-4822-97ea-576f2b384cf3.png&quot; width=&quot;1556&quot; /&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;Ac5j&quot;&gt;Мы получаем окончательное значение PSI = 0,153, что указывает на то, что есть вероятность того, что наше распределение меняется. Как оценить ?&lt;/p&gt;
  &lt;h2 id=&quot;ZMXc&quot;&gt;Оценить PSI&lt;/h2&gt;
  &lt;p id=&quot;tOEY&quot;&gt;PSI &amp;lt; 0,1 - Без изменений. Вы можете продолжать использовать существующую модель.&lt;/p&gt;
  &lt;p id=&quot;02m2&quot;&gt;PSI &amp;gt;=0, но менее 0,2 - Имеются несущественные изменения в распределении.&lt;/p&gt;
  &lt;p id=&quot;o7yu&quot;&gt;PSI &amp;gt;=0.2 - Требуется значительное изменение. В идеале, вы больше не должны использовать эту модель.&lt;/p&gt;
  &lt;h2 id=&quot;5lkH&quot;&gt;Материалы&lt;/h2&gt;
  &lt;p id=&quot;pWtZ&quot;&gt;&lt;em&gt;https://www.lexjansen.com/EscapeEscapeHwuss/2017/47_Final_Paper_PDF.pdf&lt;/em&gt;&lt;/p&gt;
  &lt;p id=&quot;LcAv&quot;&gt;https://www.quora.com/What-is-population-stability-index&lt;/p&gt;

</content></entry></feed>