<?xml version="1.0" encoding="utf-8" ?><feed xmlns="http://www.w3.org/2005/Atom" xmlns:tt="http://teletype.in/" xmlns:opensearch="http://a9.com/-/spec/opensearch/1.1/"><title>@rchintsov</title><author><name>@rchintsov</name></author><id>https://teletype.in/atom/rchintsov</id><link rel="self" type="application/atom+xml" href="https://teletype.in/atom/rchintsov?offset=0"></link><link rel="alternate" type="text/html" href="https://teletype.in/@rchintsov?utm_source=teletype&amp;utm_medium=feed_atom&amp;utm_campaign=rchintsov"></link><link rel="next" type="application/rss+xml" href="https://teletype.in/atom/rchintsov?offset=10"></link><link rel="search" type="application/opensearchdescription+xml" title="Teletype" href="https://teletype.in/opensearch.xml"></link><updated>2026-04-15T05:57:34.195Z</updated><entry><id>rchintsov:SynntdyME</id><link rel="alternate" type="text/html" href="https://teletype.in/@rchintsov/SynntdyME?utm_source=teletype&amp;utm_medium=feed_atom&amp;utm_campaign=rchintsov"></link><title>Нахождение выбросов</title><published>2019-01-06T12:51:00.185Z</published><updated>2019-01-06T12:58:48.626Z</updated><summary type="html">Помню, как-то давно я поднимал в канале ThinkCog тему нахождения выбросов. За мной тогда остался должок: литература и сопутствующая инфа. Возвращаю.</summary><content type="html">
  &lt;p&gt;Помню, &lt;a href=&quot;https://t.me/thinkcog/7755&quot; target=&quot;_blank&quot;&gt;как-то давно&lt;/a&gt; я поднимал в канале &lt;a href=&quot;https://t.me/thinkcog&quot; target=&quot;_blank&quot;&gt;ThinkCog&lt;/a&gt; тему нахождения выбросов. За мной тогда остался должок: литература и сопутствующая инфа. Возвращаю.&lt;/p&gt;
  &lt;ol&gt;
    &lt;li&gt;&lt;strong&gt;Схиртладзе, Радкевич. Метрология, стандартизация и сертификация&lt;/strong&gt; (со стр. 127 и далее)&lt;/li&gt;
    &lt;li&gt;&lt;strong&gt;Тейлор. Введение в теорию ошибок&lt;/strong&gt; (148 и далее, хотя всё интересно). Здесь хорошее объяснение &lt;a href=&quot;https://en.wikipedia.org/wiki/Chauvenet%27s_criterion&quot; target=&quot;_blank&quot;&gt;критерия Шовене&lt;/a&gt; (самого простого, который переписать в код - минут 15).&lt;/li&gt;
  &lt;/ol&gt;
  &lt;p&gt;Сами книги &lt;a href=&quot;https://t.me/thinkcog/11480&quot; target=&quot;_blank&quot;&gt;есть в канале&lt;/a&gt; + всегда можно обратиться ко мне.&lt;/p&gt;
  &lt;p&gt;&lt;strong&gt;По поводу пакетов&lt;/strong&gt;: есть и на R, и на Python, но стандартных не нашел. Всё сделано умельцами в своих целях. Отсюда: проверяйте, на чем основан пакет, прежде чем использовать.&lt;/p&gt;
  &lt;p&gt;&lt;strong&gt;Для Python&lt;/strong&gt; из наиболее понравившегося: расширение для sklearn, PyOD и outlier_utils.&lt;/p&gt;
  &lt;p&gt;&lt;strong&gt;Для R&lt;/strong&gt; нашел функцию outlierTest в car, пакеты outliers, Anomalize и AnomalyDetection. Последние два заточены для временных рядов.&lt;/p&gt;
  &lt;p&gt;Тема, естественно, поднималась не только на уровне базовой статистики, но и &lt;strong&gt;для машинного обучения&lt;/strong&gt;. Поэтому существует целый класс &lt;strong&gt;методов препроцессинга&lt;/strong&gt;, которые можно применять, на самом деле, где угодно.&lt;/p&gt;
  &lt;p&gt;&lt;strong&gt;Ссылки для Python:&lt;/strong&gt;&lt;/p&gt;
  &lt;ul&gt;
    &lt;li&gt;Sklearn с примерами: &lt;a href=&quot;https://scikit-learn.org/stable/modules/outlier_detection.html&quot; target=&quot;_blank&quot;&gt;https://scikit-learn.org/stable/modules/outlier_detection.html&lt;/a&gt;&lt;/li&gt;
    &lt;li&gt;Python Outlier Detection: &lt;a href=&quot;https://github.com/yzhao062/pyod&quot; target=&quot;_blank&quot;&gt;https://github.com/yzhao062/pyod&lt;/a&gt;&lt;/li&gt;
    &lt;li&gt;outlier_utils: &lt;a href=&quot;https://pypi.org/project/outlier_utils/&quot; target=&quot;_blank&quot;&gt;https://pypi.org/project/outlier_utils/&lt;/a&gt;&lt;/li&gt;
    &lt;li&gt;Do it yourself 1: &lt;a href=&quot;http://aqibsaeed.github.io/2016-07-17-anomaly-detection/&quot; target=&quot;_blank&quot;&gt;http://aqibsaeed.github.io/2016-07-17-anomaly-detection/&lt;/a&gt;&lt;/li&gt;
    &lt;li&gt;Do it yourself 2: &lt;a href=&quot;https://www.datascience.com/blog/python-anomaly-detection&quot; target=&quot;_blank&quot;&gt;https://www.datascience.com/blog/python-anomaly-detection&lt;/a&gt;&lt;/li&gt;
  &lt;/ul&gt;
  &lt;p&gt;&lt;strong&gt;Ссылки для R:&lt;/strong&gt;&lt;/p&gt;
  &lt;ul&gt;
    &lt;li&gt;car: &lt;a href=&quot;https://www.r-bloggers.com/outlier-detection-and-treatment-with-r/&quot; target=&quot;_blank&quot;&gt;https://www.r-bloggers.com/outlier-detection-and-treatment-with-r/&lt;/a&gt;&lt;/li&gt;
    &lt;li&gt;outliers: &lt;a href=&quot;https://rexplorations.wordpress.com/2015/09/05/simple-outlier-detection-in-r/&quot; target=&quot;_blank&quot;&gt;https://rexplorations.wordpress.com/2015/09/05/simple-outlier-detection-in-r/&lt;/a&gt;&lt;/li&gt;
    &lt;li&gt;Anomalize: &lt;a href=&quot;https://www.datacamp.com/community/tutorials/detect-anomalies-anomalize-r&quot; target=&quot;_blank&quot;&gt;https://www.datacamp.com/community/tutorials/detect-anomalies-anomalize-r&lt;/a&gt;&lt;/li&gt;
    &lt;li&gt;AnomalyDetection: &lt;a href=&quot;https://www.r-bloggers.com/anomaly-detection-in-r-2/&quot; target=&quot;_blank&quot;&gt;https://www.r-bloggers.com/anomaly-detection-in-r-2/&lt;/a&gt;&lt;/li&gt;
  &lt;/ul&gt;
  &lt;p&gt;&lt;strong&gt;Из опыта&lt;/strong&gt;: если нужен метод, за который потом отвечать (на защите или просто перед совестью), берите попроще. Всё равно для корректной работы каждый требует настройки.&lt;/p&gt;
  &lt;p&gt;&lt;strong&gt;Удачной охоты на выбросы! :)&lt;/strong&gt;&lt;/p&gt;

</content></entry></feed>