September 14, 2023

Большие данные или Правильные данные?

Термин "большие данные" прочно вошел в оборот и используется практически повсеместно. Даже государство обратило на них свое внимание1.

Ежедневно огромные объемы данных передаются по компьютерным сетям и накапливаются самыми разнообразными компаниями - старыми и новыми, большими и маленькими, производственными и цифровыми. Все они участвуют в гонке за фрагментами эксклюзивной информации, которые создадут им конкурентные преимущества:

  • Массивы социальных, метеорологических и правительственных данных обрабатываются с целью извлечения информации для оптимизации цепочек поставок.
  • Невообразимые объемы пользовательских данных перерабатываются с целью индентификации пользователей по их кликам на веб сайтах.
  • Огромные количества текстовых сообщений анализируются в попытке создания алгоритмов, способных поддерживать диалог с пользователями.

Однако реальность такова, что этот ажиотаж вокруг больших данных часто оказывается обманчивым, а убежденность в их исключительной важности - вводящей в заблуждение. В некоторых случаях извлечение полезной информации требует обработки огромного количества данных. Однако ключевым является факт, что размер данных не столь критичен по сравнению с их "правильностью".

Что такое правильные данные2

"Правильные" данные - фрагменты информации, необходимые для выполнения некоей простой работы, от которой зависит успешность бизнеса.

  • На примере Uber, который считается примером успешного использования больших данных можно увидеть, что в действительности его успех не является функцией обработки больших данных.
  • Uber без сомнений собирает и обрабатывает большое количество данных, которые позволили ей выйти на новые рынки и создать новые рабочие места, но успех этой компании - результат совершенно иного, результат использования небольших правильных данных, необходимых чтобы выполнить очень простую работу - направить автомобиль к клиенту.

Правильные данные могут быть большими или маленькими, но главное, что они являются критическими элементами данных, которые влияют на конкурентные преимущества.

Как получить правильные данные

«Потери создают возможности»

(Бен Эделман, Гарвардская школа бизнеса).

Чтобы определить правильные данные надо проанализировать бизнес и ответить на следующие три вопроса:

1) Какие решения ведут к потерям

  • Большинство бизнесов имеет разнообразные источники потерь. Определение решений, ведущих к потерям поможет найти правильные данные.

2) Какие решения можно автоматизировать чтобы сократить потери

  • Существуют решения, в которых люди вне конкуренции, однако, когда дело касается простых, повторяющихся, операционных решений – компьютер будет бесспорно на первом месте.

3) Какие для этого необходимы данные

  • Если мы понимаем неэффективность и определили какие решения к ней ведут, можно задаться вопросом – какую информацию можно использовать, чтобы сделать эти решения безупречными. Это и есть искомые «правильные» данные.

Замечательно, если правильные данные получены в результате обработки больших данных. Еще лучше, если создано новое приложение, позволяющее получить правильные данные непосредственно из взаимодействия с клиентами и контрагентами.

1  "Как государство ведет войну за большие данные" // Форбс Россия

2  Maxwell Wessel "You Don’t Need Big Data — You Need the Right Data" // HBR, NOVEMBER 03, 2016