<?xml version="1.0" encoding="utf-8" ?><feed xmlns="http://www.w3.org/2005/Atom" xmlns:tt="http://teletype.in/" xmlns:opensearch="http://a9.com/-/spec/opensearch/1.1/"><title>sergey</title><author><name>sergey</name></author><id>https://teletype.in/atom/judixel</id><link rel="self" type="application/atom+xml" href="https://teletype.in/atom/judixel?offset=0"></link><link rel="alternate" type="text/html" href="https://teletype.in/@judixel?utm_source=teletype&amp;utm_medium=feed_atom&amp;utm_campaign=judixel"></link><link rel="next" type="application/rss+xml" href="https://teletype.in/atom/judixel?offset=10"></link><link rel="search" type="application/opensearchdescription+xml" title="Teletype" href="https://teletype.in/opensearch.xml"></link><updated>2026-06-26T22:18:03.460Z</updated><entry><id>judixel:eNcIpVfaK</id><link rel="alternate" type="text/html" href="https://teletype.in/@judixel/eNcIpVfaK?utm_source=teletype&amp;utm_medium=feed_atom&amp;utm_campaign=judixel"></link><title>Как монетизировать парсинг?</title><published>2021-02-12T05:20:22.590Z</published><updated>2021-02-12T05:21:10.216Z</updated><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://teletype.in/files/8e/b5/8eb5a5cb-755f-486b-823d-a98562feaf1b.jpeg"></media:thumbnail><tt:hashtag>парсинг</tt:hashtag><tt:hashtag>scraping</tt:hashtag><tt:hashtag>crawling</tt:hashtag><tt:hashtag>data</tt:hashtag><summary type="html">&lt;img src=&quot;https://teletype.in/files/d0/c4/d0c4f8bd-695d-43fb-ab0a-781680d2446e.jpeg&quot;&gt;После многих лет работы с парсингом и работы с людьми, собирающих данные, индексирующих данные, агрегирование данных, сканированием или называйте это как хотите. Я хотел составить простой список идей о том, как каждый может извлечь выгоду из информации, которая уже есть.</summary><content type="html">
  &lt;figure class=&quot;m_original&quot;&gt;
    &lt;img src=&quot;https://teletype.in/files/d0/c4/d0c4f8bd-695d-43fb-ab0a-781680d2446e.jpeg&quot; width=&quot;600&quot; /&gt;
  &lt;/figure&gt;
  &lt;p&gt;&lt;em&gt;После многих лет работы с парсингом и работы с людьми, собирающих данные, индексирующих данные, агрегирование данных, сканированием или называйте это как хотите. Я хотел составить простой список идей о том, как каждый может извлечь выгоду из информации, которая уже есть.&lt;/em&gt;&lt;/p&gt;
  &lt;p&gt;&lt;/p&gt;
  &lt;p&gt;&lt;strong&gt;1.&lt;/strong&gt; &lt;strong&gt;Что парсить? &lt;/strong&gt;&lt;/p&gt;
  &lt;p&gt;Мое базовое определение такое: парсинг - это автоматизированное извлечение контента откуда либо, обычно структурированный контент, с целью переиспользования или проверки на тренды или наличие ценной информации.&lt;/p&gt;
  &lt;p&gt;&lt;/p&gt;
  &lt;p&gt;&lt;strong&gt;2. Зачем парсить?&lt;/strong&gt; &lt;/p&gt;
  &lt;p&gt;Потому что данные стоят денег, а знание это сила. Вы всё это знаете.&lt;br /&gt;Что вы можете не знать - парсинг часто бесплатный. И так, это краткое руководство ответит на два главных вопросах:&lt;br /&gt;  - &lt;u&gt;где получать данные?&lt;/u&gt;&lt;br /&gt;  - &lt;u&gt;что с ними делать? &lt;/u&gt;&lt;/p&gt;
  &lt;p&gt;&lt;/p&gt;
  &lt;hr /&gt;
  &lt;p&gt;&lt;/p&gt;
  &lt;p&gt;Один популярный облачный продукт предлагает парсить эти категории:&lt;/p&gt;
  &lt;ul&gt;
    &lt;li&gt;создание API метода (например, для сайта)&lt;/li&gt;
    &lt;li&gt;машинное обучение  (Google Images)&lt;/li&gt;
    &lt;li&gt;мониторинг цен (Ebay)&lt;/li&gt;
    &lt;li&gt;лидо-генерация (Yelp)&lt;/li&gt;
    &lt;li&gt;исследование рынка (парсинг типов пива и их рейтинг, например)&lt;/li&gt;
    &lt;li&gt;разработка приложений (дома для продажи, аренда)&lt;/li&gt;
    &lt;li&gt;академические исследования (Techcrunch)&lt;/li&gt;
  &lt;/ul&gt;
  &lt;p&gt;&lt;/p&gt;
  &lt;p&gt;Хорошо, но я собираюсь рассказать о том, как на самом деле заработать на этом.&lt;/p&gt;
  &lt;p&gt;Основные категории:&lt;/p&gt;
  &lt;ul&gt;
    &lt;li&gt;дубликаты сайтов&lt;/li&gt;
    &lt;li&gt;предложение парсинга данных как сервиса&lt;/li&gt;
    &lt;li&gt;лидо-генерация&lt;/li&gt;
    &lt;li&gt;парсинг данных для обхода API&lt;/li&gt;
  &lt;/ul&gt;
  &lt;p&gt;&lt;/p&gt;
  &lt;p&gt;Это очевидно. Независимо от того какой вы сайт хотите создать, вероятно он уже есть. Вот некоторые идеи, которые могут быть полезны для переиспользования спарсеных данных:&lt;/p&gt;
  &lt;ul&gt;
    &lt;li&gt;форумы&lt;/li&gt;
    &lt;li&gt;доски с работой&lt;/li&gt;
    &lt;li&gt;блоги&lt;/li&gt;
    &lt;li&gt;q&amp;amp;a сайты&lt;/li&gt;
    &lt;li&gt;сайты с купонами&lt;/li&gt;
    &lt;li&gt;базы знаний/вики сайты&lt;/li&gt;
    &lt;li&gt;социальные сети&lt;/li&gt;
  &lt;/ul&gt;
  &lt;p&gt;Любые сайты с данными, которые вы могли бы воспроизвести и создать лучший интерфейс, приложение и т.д.&lt;/p&gt;
  &lt;p&gt;&lt;/p&gt;
  &lt;hr /&gt;
  &lt;p&gt;&lt;strong&gt;Продажа спарсенных данных как сервис:&lt;/strong&gt;&lt;/p&gt;
  &lt;p&gt;Если вы агрегируете информацию регулярно или быстро, то вы получаете некоторую ценность. Сборка целевой поисковой системы, например, получения данных от топ 10 - 20 поставщиков нишевого продукта и вы, вероятно получите то, чего нигде не существует.&lt;/p&gt;
  &lt;p&gt;Stocks (часто сайты требуют затрат, чтобы спарсить что-либо после определенной даты - но вы можете опубликовать это один раз, а затем предлагать бесплатно)&lt;/p&gt;
  &lt;p&gt;Niche News Aggregation (выберите нишу, например новостные сайты знаменитостей, спарсите 10 лучших)&lt;/p&gt;
  &lt;p&gt;Любой вид нишевого контента для автоматической рассылки для подписчиков, пост в социальных сетях.&lt;br /&gt;(Например, новостная рассылка или бот, который автоматически отправляет твиты, когда дом продается по определенному почтовому индексу)&lt;/p&gt;
  &lt;p&gt;&lt;/p&gt;
  &lt;p&gt;&lt;strong&gt;Места для парсинга:&lt;/strong&gt;&lt;/p&gt;
  &lt;p&gt;Социальные сети, LinkedIn, Facebook, Twitter, публичные базы данных, страховые данные, сведения о судимости, налоговые отчеты, базы данных о гос расходах.&lt;br /&gt;Сайты по продаже недвижимости, авто.&lt;/p&gt;
  &lt;p&gt;&lt;/p&gt;
  &lt;hr /&gt;
  &lt;p&gt;&lt;strong&gt;Парсинг как сервис:&lt;/strong&gt;&lt;/p&gt;
  &lt;p&gt;Звучит как продажа данных как сервис, но отличается во времени. Многие SaaS компании просто парсят или агрегируют контент. Вы тоже могли бы:&lt;/p&gt;
  &lt;ul&gt;
    &lt;li&gt;мониторинг сайтов на наличиние обновлений или изменений&lt;/li&gt;
    &lt;li&gt;proxies&lt;/li&gt;
    &lt;li&gt;данные о продажах (amazon, ebay) или любые типы списков товаров для мониторинга конкурентных цен или исследования рынка и отслеживания запасов&lt;/li&gt;
  &lt;/ul&gt;
  &lt;p&gt;&lt;/p&gt;
  &lt;hr /&gt;
  &lt;p&gt;&lt;strong&gt;Парсинг данных для обхода API:&lt;/strong&gt;&lt;/p&gt;
  &lt;p&gt;На многих сайтах есть API, потому что люди готовы платить за данные - если это так, то спросите себя почему?&lt;br /&gt;API классные, но они стоят денег. Если вам нужно получить данные быстро и легко, при чем практически бесплатно, обойдите API и переходите непосредственно к парсингу.&lt;/p&gt;
  &lt;p&gt;&lt;/p&gt;
  &lt;h2&gt;Заключение (когда начать?)&lt;/h2&gt;
  &lt;ol&gt;
    &lt;li&gt;Начните с того, что знаете. Если вам нравятся старые автомобили, создайте поисковую систему/сайт с перечнем старых автомобилей на продажу. Посмотрите, сможете ли вы автоматизировать и монетизировать это.&lt;br /&gt;Если у вас есть гос расходы или что-то, связанное с законодательством, попробуйте собрать это в одном месте.&lt;/li&gt;
    &lt;li&gt;Прокачивайтесь. Одна из причин почему я люблю парсинг, это весело. Программная часть раздражает, но получать данные весело.&lt;/li&gt;
    &lt;li&gt;Соберите некоторые данные и поместите их в облако слов.&lt;/li&gt;
    &lt;li&gt;Не волнуйтесь.&lt;/li&gt;
  &lt;/ol&gt;
  &lt;p&gt;&lt;/p&gt;
  &lt;p&gt;&lt;/p&gt;
  &lt;tt-tags data-align=&quot;right&quot;&gt;
    &lt;tt-tag name=&quot;парсинг&quot;&gt;#парсинг&lt;/tt-tag&gt;
    &lt;tt-tag name=&quot;scraping&quot;&gt;#scraping&lt;/tt-tag&gt;
    &lt;tt-tag name=&quot;crawling&quot;&gt;#crawling&lt;/tt-tag&gt;
    &lt;tt-tag name=&quot;data&quot;&gt;#data&lt;/tt-tag&gt;
  &lt;/tt-tags&gt;
  &lt;p data-align=&quot;right&quot;&gt;&lt;em&gt;Источник: reddit&lt;/em&gt;&lt;/p&gt;

</content></entry></feed>