<?xml version="1.0" encoding="utf-8" ?><rss version="2.0" xmlns:tt="http://teletype.in/" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:media="http://search.yahoo.com/mrss/"><channel><title>Саша</title><generator>teletype.in</generator><description><![CDATA[Саша]]></description><image><url>https://img1.teletype.in/files/8b/0e/8b0eeb93-5fcf-444e-b466-321153ab2248.jpeg</url><title>Саша</title><link>https://teletype.in/@hinvics</link></image><link>https://teletype.in/@hinvics?utm_source=teletype&amp;utm_medium=feed_rss&amp;utm_campaign=hinvics</link><atom:link rel="self" type="application/rss+xml" href="https://teletype.in/rss/hinvics?offset=0"></atom:link><atom:link rel="next" type="application/rss+xml" href="https://teletype.in/rss/hinvics?offset=10"></atom:link><atom:link rel="search" type="application/opensearchdescription+xml" title="Teletype" href="https://teletype.in/opensearch.xml"></atom:link><pubDate>Sat, 02 May 2026 11:24:42 GMT</pubDate><lastBuildDate>Sat, 02 May 2026 11:24:42 GMT</lastBuildDate><item><guid isPermaLink="true">https://teletype.in/@hinvics/2Pg8kJ3asLR</guid><link>https://teletype.in/@hinvics/2Pg8kJ3asLR?utm_source=teletype&amp;utm_medium=feed_rss&amp;utm_campaign=hinvics</link><comments>https://teletype.in/@hinvics/2Pg8kJ3asLR?utm_source=teletype&amp;utm_medium=feed_rss&amp;utm_campaign=hinvics#comments</comments><dc:creator>hinvics</dc:creator><title>Population Stability Index</title><pubDate>Mon, 09 Oct 2023 11:13:36 GMT</pubDate><media:content medium="image" url="https://img1.teletype.in/files/0c/2e/0c2e9864-fd2b-4047-a61d-e6d0e8265e95.png"></media:content><description><![CDATA[<img src="https://img1.teletype.in/files/0e/f2/0ef2c32d-cc20-453f-af16-77dbd743338c.png"></img>Есть такая штука, называется Population Stability Index (PSI). PSI — это метрика оценивающая стабильность распределения данных. Использовать эту оценку можно по-разному. Этой оценкой активно пользуются в финтехе, как ключевой мерой дрифта признаков. Например, вы обучили модель риска во время экономического роста два года назад, а хотите применять эту модель на более актуальных данных, во время кризиса. Вам нужно оценить, насколько стабильно распределение ключевых признаков между двумя периодами и как это может повлиять на модель скоринга.]]></description><content:encoded><![CDATA[
  <p id="LQ4Y">Есть такая штука, называется Population Stability Index (PSI). PSI — это метрика оценивающая стабильность распределения данных. Использовать эту оценку можно по-разному. Этой оценкой активно пользуются в финтехе, как ключевой мерой дрифта признаков. Например, вы обучили модель риска во время экономического роста два года назад, а хотите применять эту модель на более актуальных данных, во время кризиса. Вам нужно оценить, насколько стабильно распределение ключевых признаков между двумя периодами и как это может повлиять на модель скоринга.</p>
  <figure id="usjO" class="m_column">
    <img src="https://img1.teletype.in/files/0e/f2/0ef2c32d-cc20-453f-af16-77dbd743338c.png" width="6000" />
    <figcaption>Распределение нашего признака в разных выборках</figcaption>
  </figure>
  <p id="zEfb">Допустим у нас имеется две выборки для некоторой оцениваемой переменной. Одна выборка это данные на которых обучалась модель (данные двух летней давности), вторая — более актуальные данные.</p>
  <p id="4d5b">Как вы можете видеть выше, распределение тренировочной выборки (синий) немного сгладилось в распределении актуальной выборки (зеленый) и имеет более плоскую верхнюю часть кривой. Визуально видно, что распределение меняется, но хочется получить количественный способ измерить сдвиг, а не качественный — угадать, насколько я должен быть обеспокоен. Как раз PSI — это отличный способ измерить это.</p>
  <figure id="pp7z" class="m_column">
    <img src="https://img4.teletype.in/files/39/50/395011e8-80eb-4d44-b983-523943fefcd9.png" width="6000" />
  </figure>
  <p id="3pHG">Диапазон значений тренировочной выборки мы делим на 10 групп и подсчитываем количество значений в каждом сегменте для тренировочной и актуальной выборки, а затем делим на общее значение каждой из выборок, чтобы получить процент по каждому сегменту. В конечном итоге мы получаем распределение как мы могли видеть ранее, но дискретизированное.</p>
  <p id="OeDQ"><code>PSI=∑((Actual - Expected)×ln(Actual/Expected))</code></p>
  <p id="tM6c"></p>
  <figure id="7znd" class="m_column">
    <img src="https://img1.teletype.in/files/c1/0b/c10b4fcf-70c3-4822-97ea-576f2b384cf3.png" width="1556" />
  </figure>
  <p id="Ac5j">Мы получаем окончательное значение PSI = 0,153, что указывает на то, что есть вероятность того, что наше распределение меняется. Как оценить ?</p>
  <h2 id="ZMXc">Оценить PSI</h2>
  <p id="tOEY">PSI &lt; 0,1 - Без изменений. Вы можете продолжать использовать существующую модель.</p>
  <p id="02m2">PSI &gt;=0, но менее 0,2 - Имеются несущественные изменения в распределении.</p>
  <p id="o7yu">PSI &gt;=0.2 - Требуется значительное изменение. В идеале, вы больше не должны использовать эту модель.</p>
  <h2 id="5lkH">Материалы</h2>
  <p id="pWtZ"><em>https://www.lexjansen.com/EscapeEscapeHwuss/2017/47_Final_Paper_PDF.pdf</em></p>
  <p id="LcAv">https://www.quora.com/What-is-population-stability-index</p>

]]></content:encoded></item></channel></rss>