"Данные – новая нефть"? Развеем магию фразы, которой уже 20 (!!!) лет 🛢️📊
🟦 ср · 4 марта ⚡️ #plugoShots в 09:09 №63 | ДАТА-СРЕДА 📊🛢️
"Data is the new oil" –
одна из самых заезженных фраз десятилетия.
Впервые она прозвучала в 2006 году (эту фразу публично произнёс британский дата‑сайентист Клайв Хамби в 2006 году в докладе на конференции Association of National Advertisers – АНА в США). С тех пор её повторили миллион раз: на конференциях, в стратегиях, в питч-деках.
Но вот парадокс: если данные – нефть, почему большинство компаний до сих пор сидят на скважине и не знают, как её бурить?
Разбираем: кто в России реально зарабатывает на данных, и почему большинство компаний до сих пор не знают, что у них "под ногами".
1 | О чём речь: три уровня "данных"
Прежде чем говорить о монетизации – важно разделить, о каких данных мы вообще говорим. Их три уровня:
- Сырьё Данные, которые компания собирает, но не использует. Логи, транзакции, поведение пользователей. Лежат на серверах и стоят денег на хранение – но не приносят ничего.
- Продукт
Данные, обработанные в аналитику, скоринг, рекомендации. Уже приносят пользу внутри бизнеса. - Платформы
Данные как основа для внешних сервисов, API, ИИ-моделей. Вот здесь начинаются реальные деньги.
Большинство российских компаний "застряли" между уровнем 1 и 2. До уровня 3 добрались единицы.
2 | Цифры и факты: кто реально зарабатывает
Российский рынок ИИ и данных – один из самых быстрорастущих в стране:
- К концу 2024 года объем рынка, напрямую связанного с ИИ, достиг $1,45 млрд (+38% к 2023-му)
- Прогноз на 2025 год – уже $2,1 млрд (+45% год к году)
Оценки рынка могут различаться, разница связана с фокусом: “прямой ИИ” против общей выручки или Big Data.
Но вот жёсткая правда про распределение: на ТОП-5 игроков (Яндекс, Сбер, ВК, Т-Технологии, Лаборатория Касперского) – приходится до 95% всей монетизации.
Это означает одно: рынок данных в России – это олигополия. Пять компаний забирают почти всё, остальные – борются за 5%.
Почему?
Потому что монетизация данных требует трёх вещей одновременно:
1) объёма данных, 2) вычислительной инфраструктуры и 3) команды, умеющей превращать данные в продукт.
Все три есть только у гигантов.
3 | Россия и Мир: одна проблема, разные масштабы
В мире данными по-настоящему зарабатывают: Google (рекламный таргетинг), Amazon (AWS + рекомендации), Visa/Mastercard (транзакционная аналитика для банков), Nielsen и подобные (данные как прямой продукт).
Но в России все же – своя специфика и своё окно возможностей:
- Так, Минцифры в 2025–2026 годах планирует запустить Национальный сервис запроса данных: бизнес сможет официально запрашивать у государства наборы данных для обучения ИИ.
- Если получится – это будет тектонический сдвиг: государство впервые начинает относиться к своим данным как к активу, а не архиву.
- Плюс БРИКС и ЕАЭС: с 2027 года на этих площадках обещают пилотные международные проекты обмена данными с партнёрами.
- Для тех, кто успеет выстроить инфраструктуру – это огромный рынок.
4 | Почему большинство не зарабатывает: 3 реальные причины
Причина 1: данные есть, понимания нет.
Компании собирают терабайты, но не знают, что именно ценно. Нет ни каталога данных, ни понимания их качества.
Причина 2: инфраструктура стоит денег.
При ключевой ставке 21% инвестиции в data-платформы окупаются слишком долго. Большинство финдиров режут такие бюджеты первыми.
Причина 3: людей нет.
Data scientist, ML-инженер, data product manager – дефицитные и дорогие специалисты. Рынок труда в этом сегменте перегрет.
5 | Что это значит:
три вывода для тех, кто хочет зарабатывать на данных
→ Начните с инвентаризации.
Не с платформы и не с найма – а с честного ответа: какие данные у вас есть и какова их ценность? Это можно сделать за неделю.
→ Смотрите на отраслевые и государственные данные.
Когда Минцифры запустит сервис запроса данных – это станет источником сырья для новых продуктов. Готовиться стоит уже сейчас.
→ Данные + ИИ = AI Factory в миниатюре.
То, о чём говорит NVIDIA на масштабе дата-центров (см. мой вчерашний plugoNews №62) – работает и на уровне среднего бизнеса. Ваши данные + языковая модель = продукт, которого у конкурентов нет.
Мой главный вывод простой: ДАННЫЕ – ЭТО НЕ НЕФТЬ.
Нефть – можно просто продать сырьём.
А вот данные без обработки – не стоят ничего.
Ценность создаётся только тогда, когда на входе – данные, а на выходе – сервисы и решения.
🟦 ср · 4 марта ⚡️ #plugoShots в 09:09 №63 | ДАТА-СРЕДА 📊🛢️
plugoShots — технологические инсайты по будням в 09:09. Больше и чаще — в Телеграме @plugoNews и на plugotarenko.com