Optimistic Marvin

Неопределённость как дисциплина незнания

lomaxart — Mon, 13 Apr 2026 17:39:53 GMT

Человек давно пытается бороться с неопределённостью. Сначала — через опыт, осторожность и привычку. Затем — через планирование, учёт, сопоставление ожиданий и результата. Позже — через статистику, теорию вероятностей, теорию управления, нечёткие множества, байесовские оценки и другие формальные аппараты. Со стороны это выглядит как поступательное движение от хаоса к порядку. Но здесь возникает неудобный вопрос: действительно ли человек уменьшает неопределённость, или он лишь создаёт всё более удобные формы собственной уверенности?

Действительно ли человек уменьшает неопределённость, или он лишь создаёт всё более удобные формы собственной уверенности?

Этот вопрос не сводится к философии. Он касается любой практики принятия решений — от управления производством до построения интеллектуальных систем. Потому что всякая модель мира строится на достаточно смелом допущении: мир хотя бы частично поддаётся упорядочиванию, в нём есть регулярности, прошлое в некоторой степени связано с будущим, а действие может быть осмысленно соотнесено с ожидаемым результатом. Иначе ни планирование, ни прогноз, ни оптимизация вообще не имели бы смысла.

Но именно здесь и начинается главное ограничение. Человек не устраняет неопределённость. Он лишь переводит её в форму, с которой способен работать. Поэтому точнее говорить не о победе над неизвестным, а о дисциплине незнания.

Самый простой и, казалось бы, почти очевидный пример — это контур план-факт. Его принято считать одним из наиболее надёжных и практичных инструментов управления. Однако его сила часто переоценивается. Сам по себе он не даёт знания о будущем и не гарантирует устойчивости следующего периода. Он лишь фиксирует уже произошедшее расхождение между ожиданием и реальностью. Всё остальное — уже выводы человека, его интерпретация и, нередко, его скрытая вера в то, что структура процесса останется прежней.

Именно здесь возникает риск самообмана. Проблема план-факта не в его простоте, а в том, что процедура проверки слишком легко превращается в ритуал самоуспокоения. Если в прошлом периоде отклонение оказалось допустимым, появляется соблазн считать, что и дальше система будет вести себя примерно так же. Но это допущение очень часто не более чем психологически удобная гипотеза. Среда может измениться, скрытые факторы — накопиться, контур управления — ослабнуть, а наблюдаемая стабильность — оказаться лишь временной.

Проблема план-факта не в его простоте, а в том, что процедура проверки слишком легко превращается в ритуал самоуспокоения.

Поэтому корректнее говорить не о том, что план-факт является самообманом сам по себе, а о том, что он становится формой институционализированного самообмана в тот момент, когда прошлое совпадение ожидания и результата принимается за основание будущей управляемости. Там, где должен начинаться пересмотр модели, слишком часто начинается производство уверенности. Неопределённость исчезает не тогда, когда план совпал с фактом, а тогда, когда человек ошибочно решил, что теперь она ему больше не угрожает.

Если смотреть шире, то вся история борьбы с неопределённостью устроена похожим образом. Теория вероятностей не уничтожила неизвестность, а лишь позволила представить её как распределение возможных исходов. Байесовский подход не сделал мир прозрачным, а дал процедуру пересмотра знаний при поступлении новых данных. Робастные методы не отменили ошибку модели, а перенесли акцент на устойчивость решения к такой ошибке. Исследования Лотфи Заде и дальнейшее развитие нечёткой логики показали ещё одну неудобную вещь: проблема далеко не всегда сводится к случайности. Иногда неясен уже сам статус состояния.

Именно здесь различие становится принципиальным. Есть ситуации, где мир случаен, но границы понятий достаточно чётки. А есть ситуации, где сам язык описания оказывается расплывчатым. Не «исправно» или «неисправно», а «скорее работает на границе нормы». Не «безопасно» или «опасно», а «уже тревожно, но ещё не аварийно». Нечёткие множества важны не потому, что они якобы заменяют строгую математику на мягкие формулировки, а потому, что они честнее отражают структуру ряда реальных ситуаций, где бинарность просто лжёт.

Отсюда следует простой, но неприятный вывод: человек учится не столько уничтожать неопределённость, сколько различать её формы. Это уже серьёзный шаг. Потому что незнание перестаёт быть бесформенной тьмой и становится чем-то, что можно анализировать. Где перед нами случайность, где расплывчатость, где неполнота наблюдения, где конфликт сигналов, а где просто ложная уверенность в устойчивости собственной модели.

На этом фоне особенно интересно выглядит reinforcement learning. У RL есть достаточно очевидная поведенческая линия. Исторически он действительно близок к той логике, которую можно связать с бихевиоризмом: агент действует, получает подкрепление, закрепляет действия, ведущие к более выгодному результату. В этом подходе есть сила. Он позволяет обходиться без полного символического описания мира. Но в нём же скрыто и фундаментальное ограничение.

Поведенческая схема работает до тех пор, пока внешний сигнал действительно несёт достаточно информации о самой ситуации. Но как только среда становится частично наблюдаемой, шумной, нестационарной, с задержками и скрытыми переменными, одной связки «действие — подкрепление» становится недостаточно. Агент может получать положительный результат и при этом не понимать, что именно происходит в системе. Он может усиливать поведение, которое выглядит полезным в краткосрочной перспективе, но лишь эксплуатирует неполноту наблюдения. Он может быть успешным по награде и одновременно оставаться слепым по отношению к реальной структуре среды.

Именно поэтому реальный RL в серьёзных прикладных задачах неизбежно выходит за пределы чистой поведенческой интуиции. Появляются частичная наблюдаемость, belief state, эпистемическая неопределённость, model-based компоненты, контуры ограничений, человек в цикле принятия решения, fallback-режимы, доверие к источникам данных и способы различать случайность от неполноты знания. То есть проблема уже не в том, как максимизировать награду, а в том, как действовать там, где само представление о состоянии мира заведомо неполно.

Это особенно важно в инженерных и промышленных системах. Деградация оборудования не лежит на поверхности. Мы не видим состояние объекта напрямую. Мы видим лишь симптомы: вибрации, температурные отклонения, косвенные признаки, задержки реакции, статистические сдвиги. Оператор тоже не обладает абсолютной прозрачностью ситуации. Его решение может быть осторожным, запаздывающим, противоречивым или, наоборот, чрезмерно уверенным. Следовательно, задача состоит не просто в выборе действия. Она состоит в том, чтобы понимать, на каком уровне знания это действие вообще принимается.

Здесь и проходит одна из самых жёстких границ между наивной автоматизацией и зрелой системой принятия решений. Опасна не сама неопределённость. Опасна неопределённость, замаскированная под уверенность. Не тогда, когда система честно показывает границы знания, а тогда, когда модель ведёт себя так, будто этих границ нет. В этом смысле чрезмерная уверенность может быть опаснее явного незнания. Потому что незнание ещё можно встроить в архитектуру решения через ограничения, интервальные оценки, подтверждение человеком, защитные режимы и робастные контуры. Ложная уверенность обычно не оставляет себе предохранителей.

Опасна не сама неопределённость. Опасна неопределённость, замаскированная под уверенность.

Поэтому большая часть человеческих методов борьбы с неопределённостью — это не путь от незнания к полной ясности. Это путь от наивной уверенности к более дисциплинированным формам действия. План-факт нужен не для того, чтобы успокаивать, а для того, чтобы разрушать удобные иллюзии. Вероятность нужна не для создания видимости контроля, а для признания множественности исходов. Нечёткие множества важны не как декоративная альтернатива строгим моделям, а как признание того, что сами границы состояний мира далеко не всегда резкие. А современные интеллектуальные системы полезны лишь в той мере, в какой они не путают ограниченное знание с истиной.

Из этого следует и более жёсткий вывод: неопределённость требует не только дисциплины мышления, но и явного пересмотра самих используемых подходов. Когда меняется характер среды, структура наблюдений или тип незнания, старые модели могут сохранять внешнюю работоспособность, но уже терять содержательную адекватность. В таком случае проблема состоит не в нехватке вычислений, а в том, что сама рамка принятия решений требует обновления. Поэтому зрелая система отличается не уверенностью в собственной схеме, а способностью вовремя пересматривать её основания.

Сама рамка принятия решений требует обновления

Возможно, именно в этом и состоит реальный прогресс. Не в том, что человек стал всезнающим, а в том, что он начал осторожнее обращаться с собственным знанием. Не в том, что неопределённость исчезла, а в том, что она перестала быть просто хаосом и стала объектом дисциплины. И, пожалуй, главный вопрос для любой системы принятия решений сегодня звучит уже не так: как полностью устранить неопределённость? Этот вопрос почти наверняка ложный. Гораздо важнее другое: как построить такую модель и такой контур действия, которые не будут подменять работу с реальностью психологическим комфортом уверенной схемы.

Именно здесь заканчивается простая вера в управляемость и начинается настоящая работа мысли.

Кандидатский проект: иерархическое принятие решений под неопределённостью

lomaxart — Sat, 14 Mar 2026 16:15:59 GMT

О принятой статье, опубликованном proof-of-concept и о том, как работа развивается от классической марковской логики и reinforcement learning к более экономичным архитектурам управления неопределённостью.

В последнее время мыслям Марвина пришлось ненадолго уйти в тень: значительная часть работы была сосредоточена на собственных научных текстах, которые в дальнейшем войдут в основу будущей защиты. Но, во славу Лагранжа, работа оказалась не напрасной: статьи приняты, рецензирование пройдено, а значит, уже можно зафиксировать промежуточный результат и коротко рассказать, в чём состоит логика кандидатского проекта.

Не обошлось и без вполне закономерных замечаний со стороны редакции. В частности, главный редактор справедливо отметил, что кортеж, описывающий состояние системы, в какой-то момент начал заметно выходить за пределы журнального формата. Для исследовательской работы это почти естественно: чем ближе модель к реальности, тем труднее удержать её в компактных рамках. Тем не менее материал удалось привести в публикабельный вид без потери основной идеи.

Основная статья доступна здесь:
https://www.elibrary.ru/item.asp?id=89021776

Отдельно опубликован и proof-of-concept, доступный для скачивания:
https://www.elibrary.ru/item.asp?id=88851718

Кому будет интересно ознакомиться с полными версиями в оригинале, пишите в личные сообщения. Здесь же я хочу дать краткий, но содержательный обзор того, о чём именно идёт речь в кандидатском проекте и почему это направление представляется мне принципиально важным.

Начать стоит с простой мысли: проблема выбора постоянно стоит перед человеком. Иногда она выглядит бытовой, иногда — профессиональной, а иногда принимает форму решения, принимаемого при неполной информации и с отсроченными последствиями. Именно поэтому теорию принятия решений нельзя сводить к чему-то сугубо прикладному или «менеджериальному». В своей строгой части она опирается на вполне серьёзный математический аппарат, лежащий на пересечении статистики, теории вероятностей, стохастических процессов и оптимизации.

Ключевая сложность заключается в том, что выбор почти никогда не совершается в полностью известной и детерминированной среде. И человек, и любая сложная техническая система действуют в условиях неопределённости. Более того, если говорить строго, именно неопределённость является одним из фундаментальных свойств среды, а не просто досадным шумом поверх «настоящей» картины мира. Отсюда и возникает знакомая каждому ситуация: всё было спланировано, но в какой-то момент что-то пошло не так. Причина здесь не только в ошибке планирования, а в том, что сама реальность не обязана разворачиваться по простой линейной схеме.

По этой причине попытка описывать сложные процессы чрезмерно упрощёнными моделями довольно быстро упирается в пределы применимости. Линейные методы полезны, но далеко не всегда достаточны. Реальные системы развиваются с задержками, ветвлениями, скрытыми состояниями, ограниченностью наблюдений и неоднородностью событий во времени. Поэтому неопределённость — это не побочная неприятность, а центральный объект анализа.

Рядом с неопределённостью почти неизбежно возникает и понятие энтропии. Многие знают его из физики, однако в теории информации Шеннона энтропия приобретает уже другой смысл: она характеризует степень неопределённости и тот объём информации, который необходим для описания происходящего. Чем менее предсказуема система, тем выше цена наблюдения, интерпретации и выбора.

Именно здесь становится особенно значимым обучение с подкреплением — одна из ключевых парадигм современного машинного обучения. В самом общем виде reinforcement learning изучает, как агент может действовать в среде, получать обратную связь в виде вознаграждения и постепенно вырабатывать стратегию, которая оказывается предпочтительной в долгосрочном смысле. Но важно подчеркнуть: речь идёт не просто о подборе «выгодного» действия, а о целостной динамической схеме, где состояние, действие, наблюдение и результат связаны во времени.

Для интуитивного объяснения часто используют задачу «многорукого бандита». В ней агент вынужден выбирать между несколькими альтернативами, не зная заранее, какая из них окажется более выгодной. Он должен одновременно исследовать новые возможности и использовать уже найденное. За этой простой постановкой скрывается один из фундаментальных конфликтов принятия решений: баланс между поиском новой информации и эксплуатацией накопленного опыта.

Если двигаться дальше, то мы естественным образом выходим к марковским процессам и к марковской постановке принятия решений. Здесь появляются агент, среда, состояния, действия, функция награды и вероятностная функция перехода. Именно последний элемент особенно важен: действие не гарантирует единственного результата, а лишь изменяет вероятность того, что произойдёт дальше. В этом и состоит принципиальная близость модели к реальности. Мир отвечает на действие не строго и не линейно, а с вариативностью, задержками, ошибками наблюдения и непредвиденными отклонениями.

Однако и этой конструкции оказывается недостаточно, если мы говорим о реальных прикладных задачах. Среда наблюдается не полностью, а её динамика далеко не всегда разворачивается в удобном учебном такте. Одни события происходят почти мгновенно, другие проявляются спустя длительное время, а часть существенных характеристик вообще доступна лишь косвенно. В такой ситуации простая схема «состояние — действие — следующее состояние» требует расширения.

Именно в этой точке и возникает кандидатский проект. Его задача состоит не в том, чтобы ещё раз пересказать базовую теорию reinforcement learning, а в том, чтобы приблизить её к условиям, в которых реально приходится принимать решения: при неполной наблюдаемости, временной неоднородности, ограниченности ресурсов и необходимости согласовывать разные уровни управления.

В прикладной плоскости рассматриваемая задача связана с техническим обслуживанием и ремонтом оборудования. Если говорить совсем просто, вопрос формулируется так: когда и каким образом следует вмешиваться в работу системы, чтобы снизить вероятность аварии, сохранить оборудование в работоспособном состоянии и не расходовать ресурсы хаотично. Но за этой формулировкой скрывается значительно более сложная картина. Оборудование не просто исправно или неисправно; оно деградирует постепенно, работает в изменяющихся режимах, накапливает скрытые дефекты и не всегда проявляет признаки будущего отказа однозначно и заранее. Следовательно, решение о вмешательстве должно опираться не только на текущее наблюдение, но и на прогноз возможного развития ситуации.

Поэтому в проекте вводится разделение на стратегический и тактический уровни управления. Это не декоративное усложнение, а принципиальная часть модели. Стратегический уровень работает с укрупнёнными сценариями поведения — с тем, что в иерархическом reinforcement learning описывается через систему опций. На этом уровне решается, какой класс действий вообще уместен в текущей ситуации: запуск профилактического сценария, перераспределение ресурсов, перевод оборудования в более щадящий режим, отложенное вмешательство или подготовка к ремонту.

Тактический уровень расположен ближе к непосредственному исполнению. Он работает уже с конкретной текущей обстановкой: доступностью ресурсов, локальными ограничениями, сигналами от среды и теми изменениями, которые происходят непосредственно на месте. Иными словами, стратегический уровень отвечает на вопрос, какой сценарий должен быть выбран, а тактический — как именно этот сценарий реализуется в конкретной ситуации.

Такое разделение необходимо не только ради содержательной точности, но и ради вычислительной рациональности. Если пытаться принимать все решения в едином плоском пространстве состояний и действий, система быстро сталкивается с перегрузкой: возрастает размерность, растёт стоимость перебора, а интерпретируемость решений начинает снижаться. Иерархическая организация через опции позволяет структурировать пространство решений и тем самым уменьшить как информационную, так и вычислительную нагрузку.

Именно здесь находится одна из центральных целей работы: построить не просто «умную» систему, а систему, которая была бы ещё и экономичной в вычислительном смысле. Для прикладных задач это принципиально. Модель, которая выглядит убедительно на бумаге, но требует чрезмерного объёма вычислений и наблюдений, в инженерном отношении ограниченно полезна. Поэтому проблема экономии ресурсов в проекте — не второстепенное замечание, а один из системообразующих мотивов.

Но здесь возникает следующий вопрос: насколько вообще допустимо передавать автоматизированной системе право самостоятельно определять, что считать хорошим решением, а что плохим? В задачах, связанных с техническим обслуживанием и потенциально критической инфраструктурой, полностью исключать человека из контура принятия решений было бы методологически сомнительно. Машина может быть последовательной, быстрой и статистически эффективной, но у человека остаётся то, чего у неё нет в строгом смысле: контекст, профессиональный опыт, интуиция в отношении аномалий и способность интерпретировать нестандартную ситуацию за пределами формально наблюдаемого сигнала.

Именно поэтому в архитектуру проекта был дополнительно введён контур Human-in-the-Loop. Речь идёт не о формальном подтверждении решения «на всякий случай», а о встроенном механизме участия оператора в критически значимых точках. В такой постановке человек перестаёт быть просто внешним управленцем или наблюдателем за работой алгоритма. Он становится частью сопряжённой человеко-машинной системы, в которой итоговое решение формируется как результат взаимодействия вычислительной модели, наблюдаемых данных и профессионального человеческого суждения. Иными словами, автоматизация здесь не вытесняет субъекта управления, а образует с ним своего рода симбиотический контур, усиливающий качество решений там, где одной статистической модели уже недостаточно.

Если формулировать общий смысл кандидатского проекта кратко, то это попытка построить более реалистичную архитектуру принятия решений под неопределённостью: архитектуру, в которой сочетаются марковская логика, иерархичность, опционная организация поведения, ограниченная наблюдаемость, временная неоднородность и обязательное сохранение человека внутри управленческого контура.

При этом для меня важно и то, что проект не исчерпывается только текущей постановкой. Одним из естественных направлений дальнейшего развития выглядит линия, близкая к идеям Карла Фристона об экономичности поведения и управлении неопределённостью. Речь здесь не о том, что проект уже построен в парадигме active inference или free energy principle. Такое утверждение было бы некорректным. Но сама внутренняя логика работы постепенно подводит к сходному вопросу: можно ли описывать хорошее решение не только как максимизацию ожидаемой награды, но и как более общий процесс снижения неопределённости, сокращения избыточной сложности представления среды и более рационального распределения вычислительного ресурса?

В этом смысле дальнейшее развитие проекта может двигаться в сторону более широкой архитектуры, где управление рассматривается не просто как выбор оптимального действия, а как поддержание экономичного предсказательно-управляющего контура. Тогда важным становится не только достижение целевого состояния, но и цена описания среды, цена интерпретации наблюдений, цена вычисления политики и способность системы избегать избыточной сложности там, где её можно сократить. Такая перспектива особенно интересна потому, что она связывает классический reinforcement learning, иерархические методы и более общий вопрос об экономии когнитивных и вычислительных ресурсов.

Разумеется, это пока не финальная точка, а лишь одно из возможных продолжений. Однако сам факт того, что статья принята, а proof-of-concept опубликован, уже означает, что каркас идеи выдержал первую серьёзную внешнюю проверку. Для любой исследовательской работы это важный момент: когда замысел перестаёт быть только внутренней конструкцией автора и начинает существовать в пространстве внешнего научного обсуждения.

Именно поэтому кандидатский проект я рассматриваю не как завершённую систему, а как переход от исследовательской интуиции к более строгой, обсуждаемой и проверяемой архитектуре идей. И, возможно, это сейчас важнее всего: не заявлять преждевременно о завершённости, а зафиксировать, что направление выбрано правильно, что у него уже есть теоретический каркас и что первые результаты выдержали внешнюю экспертизу.

Если будет интерес, следующим текстом можно отдельно разобрать, почему неопределённость нельзя сводить только к шуму, почему для таких задач оказывается недостаточно «плоского» reinforcement learning и каким образом идеи экономичности, в том числе близкие к линии Фристона, могут стать следующим шагом в развитии проекта.

Иерархическая архитектура (схема)

Гипотеза Пуанкаре и «Стена мрака»: топология самовосприятия

lomaxart — Fri, 03 Oct 2025 13:41:06 GMT

Это небольшая статья, которая появилась входе диалога с чатом GPT, на основе аудикниги "Стена Мрака" А. Кларка.

Иллюстрация из книги 1949 г., где главный герой держит ленту Мебиуса.

Данное эссе анализирует рассказ Артура Кларка «Стена мрака», используя концепции математической топологии, квантовой физики и феноменологической философии. Проводя параллели между структурой рассказа и гипотезой Пуанкаре, а также геометрией ленты Мёбиуса, автор показывает, что произведение Кларка представляет собой глубокое онтологическое исследование, выходящее за пределы традиционной научной фантастики. Анализ подчёркивает, что рекурсивная идентичность главного героя и нелинейная структура времени служат метафорами топологических моделей самости, бросая вызов традиционным представлениям о времени, причинности и эпистемологических границах.

Рассказ Артура Кларка «Стена мрака» (1949) обычно известен своим сюжетным поворотом, в котором главный герой осознаёт свою идентичность по ту сторону загадочной стены. Однако при глубоком анализе обнаруживается более сложный философский слой. В статье утверждается, что повествование Кларка имеет внутреннюю топологическую структуру, служа литературным отражением математических принципов, таких как гипотеза Пуанкаре-Перельмана.

Исследование начинается с рассмотрения двойственности наблюдения и саморефлексии, затем переходит к концепции рекурсивных путей, представленных лентой Мёбиуса. В итоге повествование раскрывается как выражение метафизической формы, где субъективность неотделима от пространства опыта. Исследование начинается с рассмотрения двойственности наблюдения и саморефлексии, затем переходит к концепции рекурсивных путей, представленных лентой Мёбиуса. В итоге повествование раскрывается как выражение метафизической формы, где субъективность неотделима от пространства опыта.

Наблюдатель и наблюдаемое. Кларк открывает повествование экзистенциальным актом наблюдения. Встреча героя со Стеной символизирует фундаментальную эпистемологическую проблему столкновения с радикально неизвестным. Развитие сюжета показывает, что эта эпистемическая неопределённость является онтологическим парадоксом: герой обнаруживает себя как объект собственного наблюдения, разрушая традиционные различия субъекта и объекта.

Подобная концептуальная рамка существует в квантовой механике, демонстрирующей роль наблюдателя в определении реальности. Кларк аналогично стирает границы между воспринимающим и воспринимаемым, переопределяя Стену не как внешнюю границу, а как отражающую поверхность, воплощающую проекцию самости.

Лента Мёбиуса, характеризующаяся единой непрерывной поверхностью и краем, представляет мощную топологическую метафору структуры повествования Кларка. Видимое линейное путешествие героя парадоксально завершается в исходной точке, демонстрируя топологическую замкнутость, заложенную в пространственную логику рассказа. Эта структурная рекурсия бросает вызов классическим понятиям линейной причинности и свободного выбора. Идея вечного возвращения Ницше также утверждает, что подлинное существование подразумевает принятие циклической неизбежности. Герой Кларка, замыкая петлю Мёбиуса, демонстрирует форму предопределённости, обусловленную не детерминистской причинностью, а структурной необходимостью.

Гипотеза Пуанкаре описывает трёхмерное многообразие, петли которого могут быть равномерно стянуты в точку, что означает топологическую эквивалентность сфере. Аналогично герой Кларка воплощает это концептуальное сжатие, становясь не просто обитателем, а воплощением пространственной целостности многообразия. Философски это соответствует феноменологическим представлениям Мерло-Понти и Хайдеггера, согласно которым самость возникает из укоренённости в пространстве опыта. Повествование Кларка эффективно моделирует сознание как внутренне пространственное, с идентичностью героя, определяемой завершением топологического обхода. А эпистемологически Стена у Кларка символизирует кантовские границы познания — порог, разделяющий феномены и ноумены. Однако Кларк новаторски инвертирует эту концепцию: за Стеной открывается не альтернативная реальность, а альтернативное восприятие уже существующей реальности.

Хайдеггеровская онтология перекликается с этой инверсией, определяя истину (алетейя) как раскрытие уже существующих реальностей, а не приобретение новой информации. Таким образом, Кларк переходит от эпистемологии к онтологии, переосмысливая знание как зависящее от позиции субъекта в мире.
Темпоральная структура рассказа Кларка согласуется с нелинейной временной логикой, представленной в современном кинематографе, таком как «Прибытие» и «Интерстеллар». Время изображено как пространственно организованное поле, а не линейное развитие. Повествование представляет осознание героем своей предопределённой судьбы как структурную неизбежность, а не как ограничение выбора. Это переосмысление нарушает классические интерпретации свободы, переопределяя её как принятие собственной позиции в заданной темпорально-пространственной конфигурации, перекликаясь с нарративными структурами Борхеса.

Рассказ Кларка «Стена мрака» выходит за рамки традиционной повествовательной завершённости, предлагая философскую полноту через признание героем самости как топологического многообразия. Идентичность раскрывается как пространственная конфигурация, познаваемая через обход, а не наблюдение. В итоге повествование Кларка предстаёт философским доказательством, объединяя литературу, науку и феноменологическое мышление для создания убедительной онтологии самовосприятия посредством топологической формы.

PS:

Перельман — как «живое доказательство» топологической замкнутости, о которой мы говорим в статье. Его отказ от мировой славы и Миллениум‑премии можно читать как перформативный жест, подтверждающий три тезиса, встроенные в наши выводы. Перельман прошёл петлю профессионального признания и вышел в ту же точку, отказываясь принимать внешние «метки» успеха. Он показывает: доказательство замыкается на себе, ценность знания не нуждается во внешнем подтверждении. Это тот же эффект, что и у героя Кларка — путешествие завершается в собственном источнике.

От судьбы к вероятности: как А.А. Марков изменил представления о случайности

lomaxart — Fri, 26 Sep 2025 18:18:32 GMT

Марков Андрей Андреевич

В обычной жизни простой обыватель, всегда подвластен обстоятелсьтвам: плохая работа, не так сложился день, и вообще... жизнь как-то не клеется. В бытовых объяснениях удач и неудач часто фигурируют «рок», «судьба», «карма». Такая оптика снимает ответственность: если всё предрешено, рациональный выбор бессмыслен. В начале XX века Андрей Андреевич Марков предложил иную перспективу: там, где мы подозреваем мистику, работает статистическая закономерность. Случайность — не пустота между причинами, а предмет строгого анализа.

Марков не был кабинетным схоластом. Ученик П. Л. Чебышева, автор работ по теории чисел, приближению функций и проблеме моментов, он сознательно перенёс центр тяжести в теорию вероятностей и статистику — туда, где сталкиваются неопределённость, данные и проверяемые предсказания. Его полемика с П. А. Некрасовым лишь обострила главный вопрос: можно ли выйти за пределы независимых «монеток» и описывать закономерности в зависимых последовательностях событий?

А. А. Марков был не просто учёный, ничего не видящий за пределами своих узких интересов, это был учёный-боец. Всю свою жизнь он вступал в яростную борьбу со всем, что шло вразрез с его научными принципами. Его при этом не останавливали ни лица, против которых ему приходилось выступать, ни возможные последствия для его собственной карьеры [1]

Немного истории..

Тема случайности и совершенства мира с теологичсекой точки зрения беспокоила умы ученых начиная с конца 17 века, дин из основоположников теории вероятностей Якоб Бернулли (1654–1705) [2], в своих работах, о зарождении статситики, как науки об азартных играх и сочетаниях, и сводилась работы по детерминированными ситуациям (ситуацяим, которые взаимосвязаны) как промысел некий божественных сил: Всё, что под Солнцем существует или возникает — прошедшее, настоящее или будущее, — само по себе и объективно всегда имеет высшую степень достоверности. Относительно событий настоящего или прошедшего это ясно; ибо тем самым, что они существуют или существовали, они не могут быть несуществующими или несуществовавшими. Но нельзя сомневаться и относительно событий будущего, которые, равным образом, если и не по некоторой неизбежной необходимости, то в силу Божественного предвидения или предопределения, не могут не осуществляться в будущем; ибо если не наверно случится то, чему определено случиться,
то непонятно, как может остаться непоколебленной хвала всеведению и всемогуществу величайшего Творца. Каким образом, однако, эта достоверность будущего может быть согласована со случайностью или свободой вторичных причин, — об этом пусть спорят другие; мы же не будем касаться чуждого нашим целям». Бернулли дает определение категориям: вероятность, необходимость, нравственная достоверность. Случайности как объективного явления нет, так как мир детерминирован волей Творца. «Вероятность» это есть степень достоверности.

Английский математик, член Лондонского королевского общества Абрахам де
Муавр (1667–1754) в знаменитом мемуаре «Учение о шансах» (1718, 1738) рассуждал о том, что шанс мало нарушает ход событий, которые были при естественном установлении задуманы наступить или не наступить в соответствии с некоторым детерминированным законом, что есть прямое указание на действие Божественного Промысла: «хотя шанс приводит к неправильностям, все же соотношение шансов окажется неограниченно большим в пользу того, что с течением времени эти неправильности не окажут никакого влияния на восстановление того Порядка, который естественно вызывается первоначальным Замыслом… в устройстве вещей существуют определенные законы, в соответствии с которыми происходят события, не менее очевидно, что эти законы служат мудрым, полезным и благодетельным целям сохранения непоколебимого порядка во вселенной, размножения видов живых существ и обеспечения такой степени счастья способному на ощущения роду человеческому, какие соответствуют его состоянию. Будучи глубоко верующим христианином, Муавр в своих математических занятиях нашел способ обосновать присутствие Божественного Промысла там, где остальные видели только случайность.

Постепенно, к началу XIX в., из работ по теории вероятностей исключаются те-
ологические рассуждения, хотя философско-метафизические установки, определяющие доктринальную позицию ученых, остаются. Так, выдающийся французский математик Пьер Симон Лаплас (1749–1827), существенно продвинувший приложения теории вероятностей к астрономическим и демографическим исследованиям, исходил из принципа детерминизма, что исключало онтологическую реальность случайности.

В процессе развития, математичсекой статситики, от исследования азартных игр, акцент был к началу XX века обращен на доказательства закона больших чисел, которые опирались на независимость испытаний. Марков сделал шаг в сторону реальности: признал, что зависимость неизбежна, но потребовал минимальной и проверяемой формы памяти — зависимости только от текущего состояния. Так появились цепи Маркова. В знаменитом статистическом эксперименте с «Евгением Онегиным» он показал, что даже язык — не хаос, а структура: вероятность гласной после согласной отличима от случайной.

Ключевой вывод: чтобы предсказывать, не нужно знать всю историю — достаточно корректно зафиксировать состояние и вероятности переходов. Это резко удешевляет моделирование и делает случайность вычислимой.

Представьте систему с конечным набором состояний (погода: «ясно», «дождь»). Для каждого состояния известны вероятности перехода в другие состояния на следующем шаге. Марковское свойство гласит: будущее зависит от настоящего и не зависит от более далёкого прошлого, если настоящее уже учтено. В результате длинные траектории становятся управляемыми статистически: можно вычислять доли времени в состояниях, средние выигрыши, времена до событий.

От цепей к принятию решений: МППР (MDP)

Один шаг отделяет наблюдателя от агента. Если добавить действия и вознаграждение, получаем марковский процесс принятия решений (MDP): агент выбирает действие, действие влияет на переход и на награду, цель — максимизировать ожидаемую суммарную награду. Эта конструкция — стандартный язык задач «планирования под неопределённостью».

Почему именно МПП(MDP) стал базовым? Он минимально достаточен: фиксирует динамику мира, интерфейс управления и критерий качества. Всё, что сложнее (частичная наблюдаемость, неизвестная динамика, иерархия целей), — надстройки над MDP.

В начале XX века Андрей Андреевич Марков предложил иной способ смотреть на случайность. Он показал: там, где мы привыкли видеть произвол обстоятельств, есть статистическая структура, которую можно описать, оценить и использовать для прогноза. Марков пришёл к этому через конкретную математическую проблему. Классические доказательства закона больших чисел опирались на независимость испытаний — на «монетки», которые «не помнят» прошлое. Но реальный мир зависим: погода тянет за собой завтрашнюю погоду, привычки — завтрашнюю работоспособность, экономические решения — будущие цены. Марков предложил минимально необходимую память: пусть будущее зависит только от текущего состояния, а не от всей истории. Так родились марковские цепи — строгая модель зависимых последовательностей. Характерно, что для демонстрации он взял не «шарики из урн», а текст «Евгения Онегина»: вероятность гласной после согласной отличается от случайной — язык тоже статистически структурирован.

Принцип здесь прост и мощен. Мы описываем систему конечным набором состояний (например, «ясно» и «дождь») и матрицей переходов — вероятностями того, как одно состояние сменяет другое на следующем шаге. Если известны состояния и переходы, можно считать доли времени в разных состояниях, времена до наступления событий, средние выигрыши. Главное — будущее зависит от настоящего, а прошлое учтено ровно настолько, насколько оно проявилось в текущем состоянии. Это резко упрощает моделирование сложных процессов без потери сути.

Следующий шаг — добавить в картину действующего агента. Если у системы есть не только случайные переходы, но и выбор действия на каждом шаге, мы получаем марковский процесс принятия решений (MDP): (S,A,P,r,γ) (S, A, P, r, \gamma)(S,A,P,r,γ). Здесь S— состояния, A — действия, P — вероятности переходов, r — вознаграждение, γ — насколько мы ценим будущее. Задача агента (человека) — выбрать стратегию (политику) так, чтобы максимизировать ожидаемую суммарную награду. Это уже язык планирования под неопределённостью: мы не знаем, как точно сложится следующий шаг, но можем проектировать поведение, которое в среднем даёт лучший долгосрочный результат.

Зачем это человеку?

Почему это важно человеку, а не только роботам? Потому что почти любая жизненная задача — не одиночный бросок, а цепочка действий с отложенными последствиями. В спорте: перетренировал сегодня — проиграл через неделю. В финансах: взял краткосрочную выгоду — потерял долгосрочную устойчивость. В учёбе: попытался «выучить всё сейчас» — быстро забыл. МППР дисциплинирует мышление: заставляет формулировать цель, описывать состояние несколькими наблюдаемыми признаками, перечислять допустимые действия и честно считать выгоду с учётом будущего и рисков.

Все аналогичными сюжетами, которыми можно проиллюстрировать является всего один тезис: локальная выгода (ещё один подход, ещё одна покупка, ещё один ролик) часто противоречит долгосрочной цели. МППР как формализм заставляет проверять стратегии на симуляции, измерять метрики и корректировать «курс» — вместо того, чтобы надеяться на «удачу» или «характер».

Связь с AGI: где заканчивается MDP и начинаются трудности

От человека — к машинам. Современные интеллектуальные системы решают те же задачи, только в куда более сложных средах. В робототехнике — навигация и манипуляции; в энергетике — управление хранилищами и сетями; в онлайновых сервисах — ранжирование, рекомендации и ценообразование с учётом долгосрочного эффекта на пользователя. В кластерах — распределение задач и энергосбережение. В медицине — персонализированные режимы терапии и реабилитации. Везде требуется стратегия, устойчивость к неопределённости и учёт отложенных эффектов — именно то, что удобно формулируется в МППР.

Где здесь AGI?

Все слышали про ИИ, но в научный среде - это исскуственный общий интелект (AGI). Универсальный разум должен объединять восприятие (вычислять состояние по сырым сигналам), планирование (решать MDP/POMDP), обучение на потоке (адаптироваться к нестабильному миру), иерархию целей и навыков (собирать сложные планы из простых «опций»), безопасность (избегать катастрофических действий). MDP остаётся «скелетом»: состояния, действия, переходы, награды и понятие оптимальности. Дальше на этот скелет навешиваются модели мира, память, язык и ценности. Без такого каркаса «разумность» не проверяется и не улучшается — она превращается в набор несопоставимых трюков.

В сухом остатке: Марков убрал мистику и оставил структуру. Цепи Маркова сделали случайность вычислимой; MDP сделали действие проектируемым. Для человека это язык осознанного выбора под неопределённостью. Для машин — формальная основа, на которой можно строить всё более мощные и безопасные агенты.

Современные системы объединяют MDP-формализмы с моделями представлений (world models), языковыми и перцептивными модулями, механизмами долгосрочной памяти и внешними инструментами. Но именно MDP даёт «скелет»: состояния, действия, переходы, награды и понятие оптимальности, относительно которого можно проверять и улучшать поведение.

Марков перевёл разговор о «судьбе» на язык моделей, параметров и проверяемых предсказаний. Цепи Маркова сделали случайность вычислимой; MDP сделали действие проектируемым. Для человека это язык осознанного выбора под неопределённостью. Для AGI — формальный каркас, к которому подключаются восприятие, планирование, память и ценности.

Байес, Демстер, Шафер и все...

lomaxart — Wed, 04 Jun 2025 17:52:58 GMT

Томас Байес

Байес, Демпстер, Шафер и другие: как формализовать неопределённость

Вопрос о том, как человек принимает решения, остаётся открытым на протяжении веков. Этим интересовались философы, позже — психологи, а в наше время — исследователи в области искусственного интеллекта, статистики и математики. Что мы делаем, когда сталкиваемся с выбором? Почему в одних условиях мы действуем рационально, а в других — ошибаемся?

На уровне нейробиологии человек часто описывается как агент, принимающий решения, опираясь на свой ограниченный опыт и представление о мире. Однако когда мы хотим точно смоделировать процесс принятия решений — особенно в инженерии, медицине или экономике — нам нужны строгие математические подходы, способные формализовать неопределённость.

Откуда берётся неопределённость?

Неопределённость — это не просто «незнание». Это ситуация, когда информации недостаточно, она устарела, содержит шум или даже противоречит сама себе. И всё же нам приходится принимать решения: врач ставит диагноз, автоматический пилот выбирает курс, а пользователь решает, кликнуть ли по ссылке.

В таких условиях рациональность не означает абсолютной уверенности. Рациональность — это способность оценить и учесть неопределённость.

Байес: вероятности и новые данные

Одним из первых, кто предложил формализовать обновление знаний, был английский математик Томас Байес. В его работе, опубликованной после смерти в 1763 году, была изложена идея, которая сегодня известна как правило Байеса. Суть проста: если у вас есть некая гипотеза, и появляются новые данные — вы можете пересчитать вероятность этой гипотезы с учётом этих данных.

На первый взгляд — тривиально. Но именно байесовский подход лежит в основе современных алгоритмов: от медицинской диагностики до спам-фильтров. Особенно он оказался полезен там, где данных мало, а решений много.

В XX веке байесовские методы получили широкое распространение. Один из ярких примеров — работа Бернарда Купмана во время Второй мировой войны. Он применил вероятностные методы для поиска вражеских подводных лодок и доказал, что неопределённость можно считать, а не бояться её.

«Каждая операция поиска сопряжена с неопределённостью. И она поддаётся количественному анализу через вероятности.»
— B.O. Koopman, Search and Screening, 1980

Что, если мы вообще почти ничего не знаем?

Байесовский подход хорош, когда у нас есть хотя бы какие-то представления — априорные вероятности. Но что, если никакой статистики нет, данные противоречат друг другу, а экспертные оценки — расплывчаты?

Здесь на помощь приходит теория Демпстера–Шафера (DST). Вместо одной вероятности она работает с двумя: уверенностью (belief) и допустимостью (plausibility). Между ними — зона неопределённости. Это как если бы вы сказали: «Я на 60% уверен, что объект — это человек, но на 90% это возможно». Оставшиеся 30% — это и есть ваше незнание, формализованное.

DST особенно полезна в ситуациях, когда данные поступают из разных источников, и каждый даёт свою неполную картину. Например, в системах видеонаблюдения или в мультиагентных сценариях, где информация разрозненна и несовершенна.

Когда знания расплывчаты: нечёткие множества

Иногда данные выражаются не цифрами, а словами: «высокая температура», «близкий объект», «умеренный риск». В таких случаях полезна теория нечётких множеств, разработанная Лотфи Заде. Она позволяет работать с лингвистической неопределённостью — тем, что называют «размытым знанием».

Например, фраза «температура высокая» может означать от 37,5 до 39,5 градусов — в зависимости от контекста. Теория нечётких множеств не требует строгих границ — она работает с плавными переходами и степенями принадлежности.

Такие методы применяются в экспертных системах, системах управления, экономических моделях и даже в стиральных машинах, когда алгоритм подбирает режим стирки на основе «нечётких» характеристик загрузки.

Какой подход лучше?

Короткий ответ — ни один. Все подходы работают в разных ситуациях:

Почему это важно?

В мире, где мы тонем в потоке информации — и при этом чаще всего она неполная, шумная и противоречивая — способность правильно интерпретировать неопределённость становится ключевым навыком. И не только для искусственного интеллекта, но и для человека.

Интеллектуальные системы, которые не игнорируют, а учитывают неопределённость, становятся более надёжными, адаптивными и «человечными». Именно они лежат в основе систем поддержки принятия решений, роботов, автономных автомобилей, диагностических платформ и многих других технологий будущего.

PS: Можете попробоывать мой проект https://damshaf.onrender.com, данный проект - это практическая реализация правил Демпстера-Шафера. В данном приложении происходит иммитация работы датчиков, и как разные правила справляются с данной задачей. Датчики имитируют М - механические, Т - температурные, N - акустические сигналы от оборудования указывающие на источник повреждения.

Мудрость толпы

lomaxart — Sun, 11 May 2025 15:05:18 GMT

Концепция мудрости толпы утверждает, что группа людей, при соблюдении определённых условий, может принимать более точные решения или делать более точные прогнозы, чем отдельные её члены, включая самых компетентных. Эта идея получила формальные математические обоснования в рамках социальной теории, теории вероятностей и машинного обучения. В данной статье рассматриваются ключевые теоремы, объясняющие феномен, а также обсуждаются условия его применимости и ограничения.

Идея о коллективной рациональности была впервые зафиксирована в эмпирических наблюдениях, наиболее известным из которых является пример Фрэнсиса Галтонa (1907), где среднее значение оценок массы быка, предложенное толпой на ярмарке, оказалось точнее индивидуальных экспертных оценок. Это стало эмпирическим прологом к формализации феномена.

В современной научной литературе "мудрость толпы" формализуется через такие инструменты, как:

Теорема Кондорсе (Condorcet Jury Theorem);
Теорема о прогнозе разнообразия (Diversity Prediction Theorem);

Теорема Кондорсе

Теорема Кондорсе, сформулированная в XVIII веке французским математиком и философом Маркизом де Кондорсе, формализует эффект коллективного голосования. Рассматривается модель, в которой N агентов независимо друг от друга принимают решение о бинарном событии (например, «истина/ложь» или «да/нет»), и каждый участник обладает вероятностью p>=0.5 принять правильное решение. Предполагается, что:

решения агентов статистически независимы,
каждый агент лучше случайного выбора (p>0.5p),
итоговое решение принимается простым большинством голосов.

Тогда утверждается следующее:

(1)

Это значит, что при достаточно большом числе участников, вероятность правильного коллективного решения стремится к 1, даже если каждый отдельный агент слабо компетентен.

Данная теорема — основа аргумента в пользу демократического принципа принятия решений. Она подчёркивает, что даже «слабо информированные» индивиды, при соблюдении условий независимости и ненулевой компетентности, в совокупности формируют высокоточный механизм коллективного суждения.

Однако важно понимать ограничения теоремы:

если p<0.5p, то толпа с увеличением N начинает систематически ошибаться;
зависимость между мнениями (например, из-за социальной конформности) нарушает предпосылки;
применимость ограничена бинарными задачами и голосованием по большинству.

Таким образом, теорема Кондорсе задаёт базовую, но строгую математическую рамку для "мудрости толпы" в простых условиях.

Теорема о прогнозе разнообразия (Diversity Prediction Theorem)

Теорема о прогнозе разнообразия, предложенная Скоттом Пейджем (Page, 2007), уточняет, за счёт чего именно группа может быть «умной» — не просто за счёт количества участников, а благодаря взаимному компенсированию ошибок. Если участники группы совершают разные, несистематические ошибки, то за счёт взаимного компенсирования отклонений групповой прогноз будет точнее, чем индивидуальный. Тогда справедливо следующее тождество:

Важно:

если участники мыслят одинаково, разнообразие минимально → ошибка группы ≈ ошибка индивида;
если прогнозы независимы и разнообразны, то ошибка группы может быть существенно ниже.

Эта теорема лежит в основе работы ансамблей моделей в машинном обучении, краудсорсинга и экспертных панелей.

Феномен "мудрости толпы" наблюдается только при выполнении нескольких ключевых условий:

Независимость мнений — участники должны принимать решения без взаимного влияния;
Когнитивное разнообразие — разные способы мышления и подходы к оценке;
Децентрализация — отсутствие централизованного давления или иерархического принуждения;
Агрегационный механизм — наличие процедуры объединения индивидуальных мнений (например, среднее, медиана, голосование и т.д.).

Если эти условия нарушены (например, при групповом мышлении, конформизме, социальном давлении), коллективное решение может быть хуже индивидуального.

Несмотря на привлекательность, идея "мудрости толпы" может быть ложной в условиях:

Коррелированных ошибок (зависимость между прогнозами);
Недостатка разнообразия;
Манипулируемой информации (fake news, agenda setting);
Группового давления и имитации (эффект толпы).

Поэтому на практике важно оценивать, насколько соблюдаются предпосылки перед применением групповых оценок.

Мудрость толпы — не универсальный принцип, а вероятностное утверждение, справедливое только при выполнении строгих условий. В эпоху массовых данных, коллективных систем и ансамблевых алгоритмов понимание этих условий критично. Применение концепции требует учёта зависимости, качества участников и механизма агрегации. В противном случае, толпа может оказаться не мудрой, а хаотичной.