July 30, 2019

02. ДАННЫЕ, ИНФОРМАЦИЯ, ЗНАНИЯ. В чем разница и насколько это важно.

Ценность информации

Фундаментальное понимание разницы между данными, информацией и знаниями поможет всегда правильно обрабатывать различные объемы. От этого зависит что вы будете получать в результате анализа и где будут храниться ключевые результаты.

При правильной организации активов всегда возможно быстро разобраться что и где находится. Точно так же как и с персональными финансами - всегда стоит разделять личные расходы и те что связаны с работой или бизнесом. Если все совместить в одно место, вы не сможете сделать даже элементарного анализа. Какие данные и структура на входе аналитической машины, такие же и на выходе. Если изначально существует путаница, то в результате обработки она еще больше исказит реальную информацию.

Значимость и стоимость информации повышается экстремально если она качественна.

Многие используют термины “данные, информация и знания” как синонимы. На самом деле, они имеют совершенно разные значения и предназначения.

Вкратце, определения следующие.

  • Данные - совокупность фактов зафиксированных в цифровом или ином виде для постоянного хранения и последующей обработки. Как пример, ежемесячные цифровые показатели личных расходов на транспорт: $150 в январе и $300 в феврале.
  • Информация - появляется в результате обработки данных и представлена в виде сводных данных по какому либо запросу. Например, после анализа данных о расходах, вы получите информацию что в начале года есть расходы на транспорт.
  • Знания - обработанная информация, которая многократно проверена и может использоваться повторно для принятия решений. Например - в начале года расходы на транспорт самые большие.

Часто, именно слово “информация” является общим значением когда говорят и о данных, и о самой информации и о знаниях. Мы также будем использовать “информация” для общего обозначения всех составляющих.

Лирическое отступление

Ниже приведен отрывок из популярного романа Харуки Мураками “Страна чудес без тормозов и Конец Света”. В книге упоминаются возможности использования человеческого мозга в будущем для шифрования и передачи данных. Этот отрывок поможет воспринимать все составляющие информации с большим уважением.

— Возражений нет. Стирку я выполню здесь. Обработанные данные заберу с собой и уже дома сделаю шаффлинг. Это потребует отдельной и очень серьезной подготовки. А уже то, что получится, принесу вам.

— Результат мне нужен через трое суток ровно в полдень. Во что бы то ни стало.

— Это нормальный срок. Я успею.

— Запомни: опаздывать нельзя ни в коем случае, — напирал он. — Просто не представляешь, что будет, опоздай ты хоть на минуту.

— Мир развалится на куски? — улыбнулся я.

— В каком‑то смысле, — очень серьезно ответил он.

— Не беспокойтесь. За свою практику я еще ни разу не опоздал. А сейчас, если можно, приготовьте мне термос с горячим кофе и побольше воды со льдом. И чего‑нибудь перекусить. Чувствую, поработать придется не час и не два.

Я не ошибся: поработать действительно пришлось всерьез. Сами цифровые комбинации не представляли особой сложности, но ступеней детерминирования оказалось куда больше, чем я ожидал, из‑за чего моя стирка получилась страшно долгой и запутанной.

Если излагать популярно, все происходит так. Я загружаю предоставленные мне данные в правое полушарие мозга (назовем его «правый мозг»), пропускаю их через систему знаков, никак не связанную с этими данными, затем переправляю в левый мозг — и уже в принципиально ином виде выгружаю, записывая полученные цифры на бумагу. Грубо говоря, это и есть «стирка». Ключ кодировки у каждого конвертора — свой. Принципиальное отличие такого ключа от таблицы случайных чисел в том, что он представляет собой диаграмму. Иначе говоря, ключ к расшифровке конкретных данных спрятан в совершенно индивидуальной схеме разделения мозга на левый и правый (что, конечно, всего лишь удобная фигура речи: на самом деле, наш мозг на половинки не делится).

Пока эти линии разрыва не совпадут с абсолютной точностью, вернуть закодированные данные в исходный вид невозможно. Кракеры, тем не менее, похищают эти данные из компьютерной сети и пытаются их прочесть, выстраивая «временные мосты». Производят анализ данных, создают трехмерные голограммы наших мозгов и стараются воспроизвести эти линии разрыва искусственным путем. Иногда им это удается, иногда нет. Мы совершенствуем способы защиты — они развивают технологии нападения. Мы охраняем информацию — они ее крадут. Классический сюжет о ворах и полицейских.

Завладев чужими секретами, кракеры продают их на черном рынке и получают фантастическую прибыль. Что хуже всего — самую важную часть краденого они оставляют у себя и с огромной выгодой используют в интересах своей корпорации.

В обиходе нашу организацию называют Системой, а корпорацию кракеров — Фабрикой. Изначально Система создавалась как частный консорциум, но со временем ее общественное значение возросло, и она получила полугосударственный статус. Как, например, компания «Белл» в США. Мы, рядовые конверторы, работаем по частному найму — как те же налоговые эксперты или адвокаты, — а для этого необходима государственная лицензия. Однако заказы мы можем принимать лишь непосредственно от Системы или же от агента, официально уполномоченного Системой. Это жесткое правило ввели для того, чтобы наши технологии не попадали в лапы кракеров. Нарушитель несет суровое наказание и теряет лицензию. Хотя лично я не вижу в этом правиле особого смысла. Потому что конверторы, у которых отбирают лицензию, чаще всего тут же заглатываются Фабрикой, уходят в подполье и становятся кракерами.

Как организована Фабрика, я не знаю. Говорят, в свое время она появилась на свет как малая венчурная компания, но сразу же начала разрастаться. Некоторые называют кракеров «инфо‑мафией»; а поскольку они действительно пустили корни в самых разных кругах подпольного бизнеса, это прозвище, скорее всего, справедливо. Отличие от настоящей мафии у них только одно: они занимаются исключительно информацией. Информация чиста и приносит деньги. Взял на мушку компьютер пожирней, выпотрошил ему память, загреб добычу — и поминай как звали.

Данные

Как упоминалось выше, данные это совокупность зафиксированных цифр и текста.

Ключевое отличие данных от информации и знаний состоит в том, что сами по себе данные пользы особой не имеют если в дальнейшем не анализируются. Данные ценны своей обработкой и что они могут показать.

Чем больше вы будете работать с одним набором данных, тем больше информации и знаний вы сможете из них выжать.

В свою очередь, данные также следует разделять как минимум на следующие две категории: неструктурированные и структурированные. В разговорном языке употребляются термины "сырые данные" когда речь идет о неструктурированных данных.

Представьте таблицу эксель в которой в каждом столбце свои значения и каждый столбец при этом обозначен и указана мера исчисления - это структурированные данные. А теперь удалите заголовки столбцов - в результате у вас будут неструктурированные данные, только цифры без их понимания. Различать эти две категории необходимо по причине того, что большие усилия и ресурсы используются для превращения именно сырых данных в правильно структурированные. Иначе польза последующего анализа будет минимальна. Потратив время на оформление данных и их осознание поможет в дальнейшем получить максимум пользы.

Всегда старайтесь изначально заполучить уже структурированные данные - это поможет сэкономить время и ресурсы.

Информация

В отличии от данных, информация не является фиксированным значением. Информация всегда должна базироваться на данных в результате обработки которых она и появилась.

Важно понимать какие данные использовались для получения какой либо информации - впоследствии всегда будут фактические данные на которых основана информация. Это поможет получать еще больше полезной информации с тех же данных.

Ключевое фактор - информация находится между данными и знаниями. Вы всегда сможете очень точно разделять понятия когда будете в первую очередь обращать внимание не является ли то или иное упоминание именно информацией. Если нет, то вы владеете либо данными либо знаниями, а это еще легче разделить потому что они кардинально отличаются.

Любая информация значительно ценнее самих данных. Однако, не стоит забывать что информация без данных имеет ограниченные возможности. В результате, в идеальном варианте, наличие и данных и информации представляют собой максимум возможности для будущего анализа и достижения результатов.

С одних и тех же данных можно получить огромное количество информации. Но, из информации обратно получить данные очень сложно, а иногда и невозможно.

Для практики, в любом разговоре или общении обращайте внимание чем вы оперируете - данными, информацией, или знаниями.

Очередной пример: возьмем простой случай с погодой, который поможет понять где данные, а где информация со знаниями.

  • Данные - значение температуры в вашем городе на 13:00 на каждый день прошлой недели. Набор из семи цифр. 30, 32, 33, 31, 20, 25, 28.
  • Информация - на прошлой неделе средняя температура днем была 28,4.
  • Знания - после летнего дождя температура в городе снижается.

Знания

Знания являются завершающим элементом в цепочке преобразования данных и информации. Знания всегда представляют собой устоявшийся факт, который можно использовать в течение длительного периода.

Знания - самый важный элемент по причине его максимальной пользы для достижения цели.

С помощью знаний вы всегда сможете принимать эффективные решения потому что ранее соответствующая информация была проанализирована и многократно проверена. Вам нет необходимости делать все заново - используйте сразу знания предыдущих поколений.

В каком формате представлены знания? В основном используются текстовые документы в виде стандартов и регламентов в котором описаны рекомендации и правила. Знания в больших количествах существуют в книгах, от научных до художественных. Википедия является ярким примером и информации и знаний одновременно. Различные философии и высказывания мудрецов также несут в себе огромный поток знаний.

Иногда достаточно прочитать одну правильную книгу чтобы набраться знаний, которые писатель получил в результате нескольких десятков лет опыта и анализа. В таком случае вы потратите всего неделю на прочтение книги чтобы получить те же самые знания на которые автор потратил года.

Ценность знаний уникальна, но при этом очень сильно зависит от метода использования самих знаний и достоверности предыдущей информации.

От того как будут применяться знания для каких либо специфических проектов будет зависеть конечный результат. Очень часто необходимо модифицировать знания и привносить свою экспертизу чтобы максимально эффективно принимать правильные решения.

Процесс преобразования знаний входит в постоянный цикл обратной связи. Несмотря на то, что определенные знания в основном базируются на проверенной информации и прошли проверку на практике, они всегда “живые”. Знания с течением времени меняются. Иногда медленно, иногда моментально. В связи с этим, необходимо постоянно иметь обратную связь насколько одни знания являются максимально результативными.

Обратная связь знаний организуется следующим образом: после того как принято решение на основе знаний, проверяется результативность, после чего значение результата используется в отделе обработки информации и их данных - впоследствии новые знания преобразуются уже с учетом результата. Такая модель обработки “данных-информации-знаний” является самоорганизующейся и может быть максимально автоматизирована.

Знания позволяют получать то самое озарение для принятия правильного решения.

Будущее

Построив модели обработки данных и дав возможность такой системе самообучаться возможно наладить процесс получения знаний на совсем другом уровне. Скорость получения и использования знаний возрастет в разы или на порядок - это повлечет стремительный рост бизнеса и связанных процессов.

Знания станут блоками данными - вся цепочка обработки, от данных до знаний, начнет смещаться и развиваться. Комплексные аналитические системы начнут оперировать не данными, а сразу знаниями и на той же скорости что и ранее с данными. Сами данные уйдут глубоко в нижние слои осознания и будут создаваться практически без вмешательства человека. Примером может служить эволюция языков программирования: ранее специалист управлял 0-ми и 1-ми раскладывая по правильным ячейкам и создавая элементарные алгоритмы вычисления. Сейчас же в современных языках на пользовательском уровне используются целые библиотеки для выполнения сложных задач.

В итоге, ключевыми факторами развития систем обработки информации станет автоматизация процессов и трансформирование данных в знания.

Задание

  1. Откройте все данные о компании которые вы собрали в предыдущем модуле.
  2. Осознайте формат представления этих данных и насколько они структурированы.
  3. Найдите информацию в этих данных путем простого логического размышления.
  4. Составьте список значимой информации которую вы смогли найти. В списке должно быть приблизительно 10 позиций различного рода информации.
  5. Изучите данные и найденные блоки информации на предмет получения знаний.
  6. Составьте список знаний из 3-х самых важных находок.
  7. На основе списка знаний предположите какие решения можно принять для улучшения ситуации компании, например для повышения объема продаж.
  8. Создайте список потенциальных решений и выберите самое значимое по вашему мнению.

В результате выполнения данного задания у вас будут списки информации, знаний и решений.

Эта модель ручного анализа на основе данных будет использоваться в дальнейшем для построения автоматической системы аналитики.

Резюме

  • Осознанно разделяйте понятия данных, информации и знаний.
  • Информация имеет высокую ценность и к ней необходимо относиться с уважением.
  • Для принятия правильных решений важны как сами данные так и правильный процесс их последующей обработки.

Недостаточно только получить знания; надо найти им приложение. -- И. Гёте