<?xml version="1.0" encoding="utf-8" ?><rss version="2.0" xmlns:tt="http://teletype.in/" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:media="http://search.yahoo.com/mrss/"><channel><title>@rchintsov</title><generator>teletype.in</generator><description><![CDATA[@rchintsov]]></description><link>https://teletype.in/@rchintsov?utm_source=teletype&amp;utm_medium=feed_rss&amp;utm_campaign=rchintsov</link><atom:link rel="self" type="application/rss+xml" href="https://teletype.in/rss/rchintsov?offset=0"></atom:link><atom:link rel="next" type="application/rss+xml" href="https://teletype.in/rss/rchintsov?offset=10"></atom:link><atom:link rel="search" type="application/opensearchdescription+xml" title="Teletype" href="https://teletype.in/opensearch.xml"></atom:link><pubDate>Wed, 15 Apr 2026 05:57:33 GMT</pubDate><lastBuildDate>Wed, 15 Apr 2026 05:57:33 GMT</lastBuildDate><item><guid isPermaLink="true">https://teletype.in/@rchintsov/SynntdyME</guid><link>https://teletype.in/@rchintsov/SynntdyME?utm_source=teletype&amp;utm_medium=feed_rss&amp;utm_campaign=rchintsov</link><comments>https://teletype.in/@rchintsov/SynntdyME?utm_source=teletype&amp;utm_medium=feed_rss&amp;utm_campaign=rchintsov#comments</comments><dc:creator>rchintsov</dc:creator><title>Нахождение выбросов</title><pubDate>Sun, 06 Jan 2019 12:51:00 GMT</pubDate><description><![CDATA[Помню, как-то давно я поднимал в канале ThinkCog тему нахождения выбросов. За мной тогда остался должок: литература и сопутствующая инфа. Возвращаю.]]></description><content:encoded><![CDATA[
  <p>Помню, <a href="https://t.me/thinkcog/7755" target="_blank">как-то давно</a> я поднимал в канале <a href="https://t.me/thinkcog" target="_blank">ThinkCog</a> тему нахождения выбросов. За мной тогда остался должок: литература и сопутствующая инфа. Возвращаю.</p>
  <ol>
    <li><strong>Схиртладзе, Радкевич. Метрология, стандартизация и сертификация</strong> (со стр. 127 и далее)</li>
    <li><strong>Тейлор. Введение в теорию ошибок</strong> (148 и далее, хотя всё интересно). Здесь хорошее объяснение <a href="https://en.wikipedia.org/wiki/Chauvenet%27s_criterion" target="_blank">критерия Шовене</a> (самого простого, который переписать в код - минут 15).</li>
  </ol>
  <p>Сами книги <a href="https://t.me/thinkcog/11480" target="_blank">есть в канале</a> + всегда можно обратиться ко мне.</p>
  <p><strong>По поводу пакетов</strong>: есть и на R, и на Python, но стандартных не нашел. Всё сделано умельцами в своих целях. Отсюда: проверяйте, на чем основан пакет, прежде чем использовать.</p>
  <p><strong>Для Python</strong> из наиболее понравившегося: расширение для sklearn, PyOD и outlier_utils.</p>
  <p><strong>Для R</strong> нашел функцию outlierTest в car, пакеты outliers, Anomalize и AnomalyDetection. Последние два заточены для временных рядов.</p>
  <p>Тема, естественно, поднималась не только на уровне базовой статистики, но и <strong>для машинного обучения</strong>. Поэтому существует целый класс <strong>методов препроцессинга</strong>, которые можно применять, на самом деле, где угодно.</p>
  <p><strong>Ссылки для Python:</strong></p>
  <ul>
    <li>Sklearn с примерами: <a href="https://scikit-learn.org/stable/modules/outlier_detection.html" target="_blank">https://scikit-learn.org/stable/modules/outlier_detection.html</a></li>
    <li>Python Outlier Detection: <a href="https://github.com/yzhao062/pyod" target="_blank">https://github.com/yzhao062/pyod</a></li>
    <li>outlier_utils: <a href="https://pypi.org/project/outlier_utils/" target="_blank">https://pypi.org/project/outlier_utils/</a></li>
    <li>Do it yourself 1: <a href="http://aqibsaeed.github.io/2016-07-17-anomaly-detection/" target="_blank">http://aqibsaeed.github.io/2016-07-17-anomaly-detection/</a></li>
    <li>Do it yourself 2: <a href="https://www.datascience.com/blog/python-anomaly-detection" target="_blank">https://www.datascience.com/blog/python-anomaly-detection</a></li>
  </ul>
  <p><strong>Ссылки для R:</strong></p>
  <ul>
    <li>car: <a href="https://www.r-bloggers.com/outlier-detection-and-treatment-with-r/" target="_blank">https://www.r-bloggers.com/outlier-detection-and-treatment-with-r/</a></li>
    <li>outliers: <a href="https://rexplorations.wordpress.com/2015/09/05/simple-outlier-detection-in-r/" target="_blank">https://rexplorations.wordpress.com/2015/09/05/simple-outlier-detection-in-r/</a></li>
    <li>Anomalize: <a href="https://www.datacamp.com/community/tutorials/detect-anomalies-anomalize-r" target="_blank">https://www.datacamp.com/community/tutorials/detect-anomalies-anomalize-r</a></li>
    <li>AnomalyDetection: <a href="https://www.r-bloggers.com/anomaly-detection-in-r-2/" target="_blank">https://www.r-bloggers.com/anomaly-detection-in-r-2/</a></li>
  </ul>
  <p><strong>Из опыта</strong>: если нужен метод, за который потом отвечать (на защите или просто перед совестью), берите попроще. Всё равно для корректной работы каждый требует настройки.</p>
  <p><strong>Удачной охоты на выбросы! :)</strong></p>

]]></content:encoded></item></channel></rss>