plugoShots
March 4

"Данные – новая нефть"? Развеем магию фразы, которой уже 20 (!!!) лет 🛢️📊

🟦 ср · 4 марта ⚡️ #plugoShots в 09:09 №63 | ДАТА-СРЕДА 📊🛢️



"Data is the new oil" –
одна из самых заезженных фраз десятилетия.

Впервые она прозвучала в 2006 году (эту фразу публично произнёс британский дата‑сайентист Клайв Хамби в 2006 году в докладе на конференции Association of National Advertisers – АНА в США). С тех пор её повторили миллион раз: на конференциях, в стратегиях, в питч-деках.

Но вот парадокс: если данные – нефть, почему большинство компаний до сих пор сидят на скважине и не знают, как её бурить?

Разбираем: кто в России реально зарабатывает на данных, и почему большинство компаний до сих пор не знают, что у них "под ногами".


1 | О чём речь: три уровня "данных"

Прежде чем говорить о монетизации – важно разделить, о каких данных мы вообще говорим. Их три уровня:

  1. Сырьё Данные, которые компания собирает, но не использует. Логи, транзакции, поведение пользователей. Лежат на серверах и стоят денег на хранение – но не приносят ничего.
  2. Продукт
    Данные, обработанные в аналитику, скоринг, рекомендации. Уже приносят пользу внутри бизнеса.
  3. Платформы
    Данные как основа для внешних сервисов, API, ИИ-моделей. Вот здесь начинаются реальные деньги.

Большинство российских компаний "застряли" между уровнем 1 и 2. До уровня 3 добрались единицы.


2 | Цифры и факты: кто реально зарабатывает

Российский рынок ИИ и данных – один из самых быстрорастущих в стране:

  • К концу 2024 года объем рынка, напрямую связанного с ИИ, достиг $1,45 млрд (+38% к 2023-му)
  • Прогноз на 2025 год – уже $2,1 млрд (+45% год к году)
    Оценки рынка могут различаться, разница связана с фокусом: “прямой ИИ” против общей выручки или Big Data.

Но вот жёсткая правда про распределение: на ТОП-5 игроков (Яндекс, Сбер, ВК, Т-Технологии, Лаборатория Касперского) – приходится до 95% всей монетизации.

Это означает одно: рынок данных в России – это олигополия. Пять компаний забирают почти всё, остальные – борются за 5%.

Почему?

Потому что монетизация данных требует трёх вещей одновременно:
1) объёма данных, 2) вычислительной инфраструктуры и 3) команды, умеющей превращать данные в продукт.

Все три есть только у гигантов.


3 | Россия и Мир: одна проблема, разные масштабы

Глобально – та же история.

В мире данными по-настоящему зарабатывают: Google (рекламный таргетинг), Amazon (AWS + рекомендации), Visa/Mastercard (транзакционная аналитика для банков), Nielsen и подобные (данные как прямой продукт).

Но в России все же – своя специфика и своё окно возможностей:

  • Так, Минцифры в 2025–2026 годах планирует запустить Национальный сервис запроса данных: бизнес сможет официально запрашивать у государства наборы данных для обучения ИИ.
  • Если получится – это будет тектонический сдвиг: государство впервые начинает относиться к своим данным как к активу, а не архиву.
  • Плюс БРИКС и ЕАЭС: с 2027 года на этих площадках обещают пилотные международные проекты обмена данными с партнёрами.
  • Для тех, кто успеет выстроить инфраструктуру – это огромный рынок.

4 | Почему большинство не зарабатывает: 3 реальные причины

Причина 1: данные есть, понимания нет.
Компании собирают терабайты, но не знают, что именно ценно. Нет ни каталога данных, ни понимания их качества.

Причина 2: инфраструктура стоит денег.
При ключевой ставке 21% инвестиции в data-платформы окупаются слишком долго. Большинство финдиров режут такие бюджеты первыми.

Причина 3: людей нет.
Data scientist, ML-инженер, data product manager – дефицитные и дорогие специалисты. Рынок труда в этом сегменте перегрет.


5 | Что это значит:
три вывода для тех, кто хочет зарабатывать на данных

Начните с инвентаризации.
Не с платформы и не с найма – а с честного ответа: какие данные у вас есть и какова их ценность? Это можно сделать за неделю.

Смотрите на отраслевые и государственные данные.
Когда Минцифры запустит сервис запроса данных – это станет источником сырья для новых продуктов. Готовиться стоит уже сейчас.

Данные + ИИ = AI Factory в миниатюре.
То, о чём говорит NVIDIA на масштабе дата-центров (см. мой вчерашний plugoNews №62) – работает и на уровне среднего бизнеса. Ваши данные + языковая модель = продукт, которого у конкурентов нет.


Мой главный вывод простой: ДАННЫЕ – ЭТО НЕ НЕФТЬ.

Нефть – можно просто продать сырьём.
А вот данные без обработки – не стоят ничего.

Ценность создаётся только тогда, когда на входе – данные, а на выходе – сервисы и решения.


🟦 ср · 4 марта ⚡️ #plugoShots в 09:09 №63 | ДАТА-СРЕДА 📊🛢️

plugoShots — технологические инсайты по будням в 09:09. Больше и чаще — в Телеграме @plugoNews и на plugotarenko.com