Неопределённость как дисциплина незнания
Человек давно пытается бороться с неопределённостью. Сначала — через опыт, осторожность и привычку. Затем — через планирование, учёт, сопоставление ожиданий и результата. Позже — через статистику, теорию вероятностей, теорию управления, нечёткие множества, байесовские оценки и другие формальные аппараты. Со стороны это выглядит как поступательное движение от хаоса к порядку. Но здесь возникает неудобный вопрос: действительно ли человек уменьшает неопределённость, или он лишь создаёт всё более удобные формы собственной уверенности?
Действительно ли человек уменьшает неопределённость, или он лишь создаёт всё более удобные формы собственной уверенности?
Этот вопрос не сводится к философии. Он касается любой практики принятия решений — от управления производством до построения интеллектуальных систем. Потому что всякая модель мира строится на достаточно смелом допущении: мир хотя бы частично поддаётся упорядочиванию, в нём есть регулярности, прошлое в некоторой степени связано с будущим, а действие может быть осмысленно соотнесено с ожидаемым результатом. Иначе ни планирование, ни прогноз, ни оптимизация вообще не имели бы смысла.
Но именно здесь и начинается главное ограничение. Человек не устраняет неопределённость. Он лишь переводит её в форму, с которой способен работать. Поэтому точнее говорить не о победе над неизвестным, а о дисциплине незнания.
Самый простой и, казалось бы, почти очевидный пример — это контур план-факт. Его принято считать одним из наиболее надёжных и практичных инструментов управления. Однако его сила часто переоценивается. Сам по себе он не даёт знания о будущем и не гарантирует устойчивости следующего периода. Он лишь фиксирует уже произошедшее расхождение между ожиданием и реальностью. Всё остальное — уже выводы человека, его интерпретация и, нередко, его скрытая вера в то, что структура процесса останется прежней.
Именно здесь возникает риск самообмана. Проблема план-факта не в его простоте, а в том, что процедура проверки слишком легко превращается в ритуал самоуспокоения. Если в прошлом периоде отклонение оказалось допустимым, появляется соблазн считать, что и дальше система будет вести себя примерно так же. Но это допущение очень часто не более чем психологически удобная гипотеза. Среда может измениться, скрытые факторы — накопиться, контур управления — ослабнуть, а наблюдаемая стабильность — оказаться лишь временной.
Проблема план-факта не в его простоте, а в том, что процедура проверки слишком легко превращается в ритуал самоуспокоения.
Поэтому корректнее говорить не о том, что план-факт является самообманом сам по себе, а о том, что он становится формой институционализированного самообмана в тот момент, когда прошлое совпадение ожидания и результата принимается за основание будущей управляемости. Там, где должен начинаться пересмотр модели, слишком часто начинается производство уверенности. Неопределённость исчезает не тогда, когда план совпал с фактом, а тогда, когда человек ошибочно решил, что теперь она ему больше не угрожает.
Если смотреть шире, то вся история борьбы с неопределённостью устроена похожим образом. Теория вероятностей не уничтожила неизвестность, а лишь позволила представить её как распределение возможных исходов. Байесовский подход не сделал мир прозрачным, а дал процедуру пересмотра знаний при поступлении новых данных. Робастные методы не отменили ошибку модели, а перенесли акцент на устойчивость решения к такой ошибке. Исследования Лотфи Заде и дальнейшее развитие нечёткой логики показали ещё одну неудобную вещь: проблема далеко не всегда сводится к случайности. Иногда неясен уже сам статус состояния.
Именно здесь различие становится принципиальным. Есть ситуации, где мир случаен, но границы понятий достаточно чётки. А есть ситуации, где сам язык описания оказывается расплывчатым. Не «исправно» или «неисправно», а «скорее работает на границе нормы». Не «безопасно» или «опасно», а «уже тревожно, но ещё не аварийно». Нечёткие множества важны не потому, что они якобы заменяют строгую математику на мягкие формулировки, а потому, что они честнее отражают структуру ряда реальных ситуаций, где бинарность просто лжёт.
Отсюда следует простой, но неприятный вывод: человек учится не столько уничтожать неопределённость, сколько различать её формы. Это уже серьёзный шаг. Потому что незнание перестаёт быть бесформенной тьмой и становится чем-то, что можно анализировать. Где перед нами случайность, где расплывчатость, где неполнота наблюдения, где конфликт сигналов, а где просто ложная уверенность в устойчивости собственной модели.
На этом фоне особенно интересно выглядит reinforcement learning. У RL есть достаточно очевидная поведенческая линия. Исторически он действительно близок к той логике, которую можно связать с бихевиоризмом: агент действует, получает подкрепление, закрепляет действия, ведущие к более выгодному результату. В этом подходе есть сила. Он позволяет обходиться без полного символического описания мира. Но в нём же скрыто и фундаментальное ограничение.
Поведенческая схема работает до тех пор, пока внешний сигнал действительно несёт достаточно информации о самой ситуации. Но как только среда становится частично наблюдаемой, шумной, нестационарной, с задержками и скрытыми переменными, одной связки «действие — подкрепление» становится недостаточно. Агент может получать положительный результат и при этом не понимать, что именно происходит в системе. Он может усиливать поведение, которое выглядит полезным в краткосрочной перспективе, но лишь эксплуатирует неполноту наблюдения. Он может быть успешным по награде и одновременно оставаться слепым по отношению к реальной структуре среды.
Именно поэтому реальный RL в серьёзных прикладных задачах неизбежно выходит за пределы чистой поведенческой интуиции. Появляются частичная наблюдаемость, belief state, эпистемическая неопределённость, model-based компоненты, контуры ограничений, человек в цикле принятия решения, fallback-режимы, доверие к источникам данных и способы различать случайность от неполноты знания. То есть проблема уже не в том, как максимизировать награду, а в том, как действовать там, где само представление о состоянии мира заведомо неполно.
Это особенно важно в инженерных и промышленных системах. Деградация оборудования не лежит на поверхности. Мы не видим состояние объекта напрямую. Мы видим лишь симптомы: вибрации, температурные отклонения, косвенные признаки, задержки реакции, статистические сдвиги. Оператор тоже не обладает абсолютной прозрачностью ситуации. Его решение может быть осторожным, запаздывающим, противоречивым или, наоборот, чрезмерно уверенным. Следовательно, задача состоит не просто в выборе действия. Она состоит в том, чтобы понимать, на каком уровне знания это действие вообще принимается.
Здесь и проходит одна из самых жёстких границ между наивной автоматизацией и зрелой системой принятия решений. Опасна не сама неопределённость. Опасна неопределённость, замаскированная под уверенность. Не тогда, когда система честно показывает границы знания, а тогда, когда модель ведёт себя так, будто этих границ нет. В этом смысле чрезмерная уверенность может быть опаснее явного незнания. Потому что незнание ещё можно встроить в архитектуру решения через ограничения, интервальные оценки, подтверждение человеком, защитные режимы и робастные контуры. Ложная уверенность обычно не оставляет себе предохранителей.
Опасна не сама неопределённость. Опасна неопределённость, замаскированная под уверенность.
Поэтому большая часть человеческих методов борьбы с неопределённостью — это не путь от незнания к полной ясности. Это путь от наивной уверенности к более дисциплинированным формам действия. План-факт нужен не для того, чтобы успокаивать, а для того, чтобы разрушать удобные иллюзии. Вероятность нужна не для создания видимости контроля, а для признания множественности исходов. Нечёткие множества важны не как декоративная альтернатива строгим моделям, а как признание того, что сами границы состояний мира далеко не всегда резкие. А современные интеллектуальные системы полезны лишь в той мере, в какой они не путают ограниченное знание с истиной.
Из этого следует и более жёсткий вывод: неопределённость требует не только дисциплины мышления, но и явного пересмотра самих используемых подходов. Когда меняется характер среды, структура наблюдений или тип незнания, старые модели могут сохранять внешнюю работоспособность, но уже терять содержательную адекватность. В таком случае проблема состоит не в нехватке вычислений, а в том, что сама рамка принятия решений требует обновления. Поэтому зрелая система отличается не уверенностью в собственной схеме, а способностью вовремя пересматривать её основания.
Сама рамка принятия решений требует обновления
Возможно, именно в этом и состоит реальный прогресс. Не в том, что человек стал всезнающим, а в том, что он начал осторожнее обращаться с собственным знанием. Не в том, что неопределённость исчезла, а в том, что она перестала быть просто хаосом и стала объектом дисциплины. И, пожалуй, главный вопрос для любой системы принятия решений сегодня звучит уже не так: как полностью устранить неопределённость? Этот вопрос почти наверняка ложный. Гораздо важнее другое: как построить такую модель и такой контур действия, которые не будут подменять работу с реальностью психологическим комфортом уверенной схемы.
Именно здесь заканчивается простая вера в управляемость и начинается настоящая работа мысли.