Байес, Демстер, Шафер и все...
Байес, Демпстер, Шафер и другие: как формализовать неопределённость
Вопрос о том, как человек принимает решения, остаётся открытым на протяжении веков. Этим интересовались философы, позже — психологи, а в наше время — исследователи в области искусственного интеллекта, статистики и математики. Что мы делаем, когда сталкиваемся с выбором? Почему в одних условиях мы действуем рационально, а в других — ошибаемся?
На уровне нейробиологии человек часто описывается как агент, принимающий решения, опираясь на свой ограниченный опыт и представление о мире. Однако когда мы хотим точно смоделировать процесс принятия решений — особенно в инженерии, медицине или экономике — нам нужны строгие математические подходы, способные формализовать неопределённость.
Откуда берётся неопределённость?
Неопределённость — это не просто «незнание». Это ситуация, когда информации недостаточно, она устарела, содержит шум или даже противоречит сама себе. И всё же нам приходится принимать решения: врач ставит диагноз, автоматический пилот выбирает курс, а пользователь решает, кликнуть ли по ссылке.
В таких условиях рациональность не означает абсолютной уверенности. Рациональность — это способность оценить и учесть неопределённость.
Байес: вероятности и новые данные
Одним из первых, кто предложил формализовать обновление знаний, был английский математик Томас Байес. В его работе, опубликованной после смерти в 1763 году, была изложена идея, которая сегодня известна как правило Байеса. Суть проста: если у вас есть некая гипотеза, и появляются новые данные — вы можете пересчитать вероятность этой гипотезы с учётом этих данных.
На первый взгляд — тривиально. Но именно байесовский подход лежит в основе современных алгоритмов: от медицинской диагностики до спам-фильтров. Особенно он оказался полезен там, где данных мало, а решений много.
В XX веке байесовские методы получили широкое распространение. Один из ярких примеров — работа Бернарда Купмана во время Второй мировой войны. Он применил вероятностные методы для поиска вражеских подводных лодок и доказал, что неопределённость можно считать, а не бояться её.
«Каждая операция поиска сопряжена с неопределённостью. И она поддаётся количественному анализу через вероятности.»
— B.O. Koopman, Search and Screening, 1980
Что, если мы вообще почти ничего не знаем?
Байесовский подход хорош, когда у нас есть хотя бы какие-то представления — априорные вероятности. Но что, если никакой статистики нет, данные противоречат друг другу, а экспертные оценки — расплывчаты?
Здесь на помощь приходит теория Демпстера–Шафера (DST). Вместо одной вероятности она работает с двумя: уверенностью (belief) и допустимостью (plausibility). Между ними — зона неопределённости. Это как если бы вы сказали: «Я на 60% уверен, что объект — это человек, но на 90% это возможно». Оставшиеся 30% — это и есть ваше незнание, формализованное.
DST особенно полезна в ситуациях, когда данные поступают из разных источников, и каждый даёт свою неполную картину. Например, в системах видеонаблюдения или в мультиагентных сценариях, где информация разрозненна и несовершенна.
Когда знания расплывчаты: нечёткие множества
Иногда данные выражаются не цифрами, а словами: «высокая температура», «близкий объект», «умеренный риск». В таких случаях полезна теория нечётких множеств, разработанная Лотфи Заде. Она позволяет работать с лингвистической неопределённостью — тем, что называют «размытым знанием».
Например, фраза «температура высокая» может означать от 37,5 до 39,5 градусов — в зависимости от контекста. Теория нечётких множеств не требует строгих границ — она работает с плавными переходами и степенями принадлежности.
Такие методы применяются в экспертных системах, системах управления, экономических моделях и даже в стиральных машинах, когда алгоритм подбирает режим стирки на основе «нечётких» характеристик загрузки.
Какой подход лучше?
Короткий ответ — ни один. Все подходы работают в разных ситуациях:
Почему это важно?
В мире, где мы тонем в потоке информации — и при этом чаще всего она неполная, шумная и противоречивая — способность правильно интерпретировать неопределённость становится ключевым навыком. И не только для искусственного интеллекта, но и для человека.
Интеллектуальные системы, которые не игнорируют, а учитывают неопределённость, становятся более надёжными, адаптивными и «человечными». Именно они лежат в основе систем поддержки принятия решений, роботов, автономных автомобилей, диагностических платформ и многих других технологий будущего.
PS: Можете попробоывать мой проект https://damshaf.onrender.com, данный проект - это практическая реализация правил Демпстера-Шафера. В данном приложении происходит иммитация работы датчиков, и как разные правила справляются с данной задачей. Датчики имитируют М - механические, Т - температурные, N - акустические сигналы от оборудования указывающие на источник повреждения.