May 25, 2021

Оценка вероятности в анализе рисков для качества

Понимание вероятности имеет первоочередное значение для применения принципов управления рисками. Данная заметка охватывает краткий обзор критериев, которые необходимо учитывать при количественной оценке вероятности риска.

Автор: Майк Лонг, Concordia ValSource, США

А.Хамид Моллах, Майк Лонг, Гарольд С. Бэйсмен, Управление рисками в фамацевтическом производстве, 2-е изд., испр.: Пер. с англ. - М.: ВИАЛЕК, 2017 - 464 с.

Неопределенность

По предположению Джона Мэйнард Кейнса [1] существуют обстоятельства, в которых расчет вероятности невозможен. Он назвал такую ситуацию «истинной неопределенностью». По утверждению Кейнса, неопределенность не поддается объективному определению, поскольку возможна ситуация, когда неизвестно ничего о потенциальных угрозах.

"Известно, что есть известное нам известное. Есть то, об известности чего нам известно. Еще нам известно, что есть известное нам неизвестное. То есть то, неизвестность чего нам известна. Впрочем, есть и неизвестное нам неизвестное, неизвестность чего нам совсем неизвестна". - Дональд Рамсфелд, 12 февраля 2002 года. Брифинг Министерства обороны США. Опубликовано в журнале Slate Magazine в статье «Поэзия Дональда Рамсфелда», апрель 2003.

По определению из ISO 31000, риск – следствие влияния неопределенности на достижение поставленных целей. Получается, нужно определять субъективную составляющую риска. По сути это – попытка создать модель количественной оценки субъективно ожидаемой пользы. Существует разница между возможностью, вероятностью, неопределенностью и истинной неопределенностью. Просто неопределенным является нечто, для чего необходимо собрать больше данных; например, разработка процесса. Истинная же неопределенность состоит в невозможности количественной оценки. Разве можно определить вероятность начала третьей мировой войны или вероятность того, что такие удобные изобретения, как микроволновая печь, смартфоны или компьютеры выйдут из употребления? Этого просто невозможно знать. Можно делать предположения, но точно знать невозможно. Даже прогноз погоды связан лишь с умеренной неопределенностью.

На самом деле риск не имеет точной системы измерения – в одних случаях он может иметь объективное выражение, а в других – субъективное. При неопределенности в оценке риска люди часто пытаются получить субъективную оценку неопределенности вместо того, чтобы просто признать ее наличие и заняться сбором дополнительных данных. Более подробно об этом описано в книге Нассима Николаса Талеба «Черный лебедь».

Проанализировав определения терминов из нескольких различных источников, можно прийти к выводу, что неопределенность – это не поддающийся количественной оценке недостаток знаний. Например, фраза «Похоже, будет дождь» является заявлением о неопределенности. В то же время поддающийся количественной оценке недостаток знаний лежит в основе таких взаимодополняющих понятий как вероятность, статистика и риск. «Вероятность того, что сегодня будет дождь, составляет 50%» – заявление о вероятности.

Везение и вероятность

«Везение – это вероятность, которую мы принимаем на свой счет» автор неизвестен.

Двойственность такого заявления наглядно демонстрирует, как вероятность воспринимается обществом. Миллионы людей верят в везение, но не в его вероятность. Вот небольшой пример. Если мы подбросим монету шесть раз, и она все время будет падать «орлом» вверх, большинство людей на улице или в казино признают, что вероятность выпадения «решки» в седьмой раз будет более высокой, чем в случае предыдущего выпадения трех «орлов» и трех «решек». Фактически люди будут готовы поставить на это свои деньги.

По их мнению, монета просто обречена, чтобы упасть вверх «решкой». Однако по теории вероятности возможность выпадения «решки» составляет 50/50, так же, как и при первом, втором, третьем и всех шести подбрасываниях. Монета не имеет памяти. Подобное недопонимание наглядно демонстрирует необходимость изучения теории вероятности для корректного управлении рисками для качества, ведь здоровье и безопасность пациента не могут быть основаны на невежестве или что еще хуже, на простом везении.

Определение вероятности

Сложно придумать лучшее определение вероятности, чем предложенное более трехсот лет назад [2].

«Можно предположить, что определенное событие произойдет либо не произойдет в будущем столько раз, сколько оно произошло либо не произошло в прошлом при аналогичных обстоятельствах».

Есть три распространенных определения или правила вероятности:

  1. Субъективная вера или интуиция – наименее поддающаяся количественной оценке вероятность. «Мне кажется, что пандемия вряд ли завершится в этом году».
  2. Соотношение числа исходов в прошлом и общего числа возможных исходов – наиболее эмпирический вариант. Соотношение может быть представлено в виде описания, дробного числа или процентного показателя. «За последние сто бросков кости тройка выпадала шестнадцать раз». Подобный вариант определения вероятности предпочтителен, если существуют данные для расчета. Оценка вероятности, основанная на проекции полученных уже результатов на будущее, исходит из предположения, что в будущем все будет происходить так же, как и в прошлом – предположение, которое само по себе связано с некоторой неопределенностью.
  3. Последним, наиболее поддающимся количественной оценке, вариантом вероятности является теоретический показатель, определенный путем ограничения бесконечной случайной последовательности повторений для принятой модели. В теории симметричная монета упадет «орлом» вверх в 50% случаев, но реальный результат будет лишь приблизительно соответствовать теоретическому.

Правила вероятности

Вероятность может быть выражена в виде числового показателя от 0 до 1 или процентного от 0 до 100 %. Нулевую вероятность имеет явление, которое абсолютно невозможно. Единица или сто процентов означают явление, которое абсолютно точно должно случиться. В некоторых случаях для обозначения вероятности могут быть введены дополнительные категории, например: низкая, средняя, высокая, 0, 1, 2, 3, 4 или 0, 1, 2, 3, 4, 5, 6. При этом ноль означает среднюю вероятность, т. е. половину максимального показателя. Шкала оценки вероятности, как правило, выбирается индивидуально для каждого проекта.

Показатель вероятности 0,5 или 50 % присваивается явлению, которое в среднем будет происходить в половине случаев в бесконечной последовательности повторений. Этот показатель часто называют точкой безразличия. В некоторых литературных источниках событие указывается как «возможное», если вероятность составляет 50% и менее, а также как «вероятное», если вероятность более 50%.

Теоретическая вероятность падения монеты вверх «орлом» равна 0,5 или 50%. Р («орел») = 0,5. В реальности же вероятность может быть меньше или больше. Например, есть монеты, которые тяжелее со стороны «орла», что может сказаться на вероятности ее падения этой стороной вверх.

При расчете вероятности необходимо правильно определить числитель и знаменатель. В английском алфавите шесть гласных букв – a, e, i, o, u, y. Вероятность случайного выбора гласной на странице с текстом составляет 6 из 26 или 23%. Однако в некоторых случаях y используется как согласная, поэтому есть некоторая неопределенность в отношении числителя и конечного результата. Ситуацию могут исправить тщательная оценка, принятые определения и специальные правила. Какова вероятность того, что при двух подбрасываниях монета дважды упадет «орлом» вверх? Вероятность выпадения «орла» составляет 0,5 для первого подбрасывания и 0,5 для второго. Таким образом, общая вероятность выпадения двух «орлов» составляет 0,5 «и» 0,5, где «и» значит «умножить», то есть один раз из четырех.

P («орел» и «орел») = P («орел») * P («орел») = 0,5 * 0,5 = 0,25 или 25%.

Этот расчет основан на предположении, что оба события независимы друг от друга.

Если же события влияют друг на друга, то используется вариант расчета, описанный ниже. Какова вероятность того, что подброшенная монета упадет «орлом» или «решкой» вверх? Вероятность выпадения «орла» и «решки» составляет по 0,5. Таким образом, общая вероятность составляет 0,5 «или» 0,5, где «или» означает «прибавить».

P («орел» или «решка») = P («орел») + P («решка») = 0,5 + 0,5 = 1,0 или 100%.

Это правило действует при отсутствии общности двух событий – в этом случае используется «или».

Предупреждения

Совокупный эффект описанных правил может быть поразительным. Например, при проведении нескольких испытаний может быть получен очень высокий показатель вероятности случайного появления как минимум одного отказа. Предположим, что для валидации методики количественного определения было проведено 47 t-тестов при значении α= 0,05. Вероятность появления одного или нескольких отказов рассчитывается по формуле 1 ‒ (1 ‒ α)n.

Таким образом,

P = 1 ‒ (1 ‒ α)n = 1 ‒ (1 ‒ 0,05)47 = 0,91

Получается, вероятность того, что один или несколько t-тестов случайно окажутся неудачными, составляет 91 %.

Риск

Каждый производственный процесс и продукт связан с риском тех или иных отказов (отклонений, несоответствий). Снижение риска до нуля требует огромных финансовых и временных затрат, и является невозможной с практической точки зрения по причине наличия некоторого, хоть и небольшого, остаточного риска даже после принятия мер по его минимизации.

В любом случае концепция вероятности является ключевой для понимания риска. Нельзя оценить или понять риск, не изучая принципы вероятности.

Статистический риск

В литературе по статистике риск часто ассоциируется с простой вероятностью. Статистика различает два типа риска или ошибок. Ошибка I рода или ошибка «альфа» означает вероятность отклонения истинной гипотезы, т. е. риск поставщика. Ошибка II рода или ошибка «бета» означает вероятность принятия ложной гипотезы и, следовательно, риск потребителя.

Редкие события

«Если что-то может пойти не так, то оно обязательно пойдет не так» закон Мерфи.

Редким называется событие, которое происходит нечасто либо является уникальным или необычным. Подобное событие происходит, поскольку возможностей для его наступления гораздо больше, чем мы можем себе представить. Например, существуют тысячи возможных событий в программном обеспечении, из-за которых при вычислениях мы можем получить очень странные результаты.

Такая характеристика как «редкость» – тоже относительна. Событие, происходящее один раз в миллион дней в небольшом поселке, случается 300 раз ежедневно в масштабах мегаполиса. Известная концепция «шесть сигм» позволяет выявить дефекты, вероятность появления которых составляет около четырех дефектных единиц на миллион изделий. Однако можно ли надеяться на выявление четырех таблеток с дефектами в серии, размером 1,2 млн. таблеток?

Полезно научиться различать экстремальные значения и выбросы. Экстремальные значения превышают стандартные, они расположены в наиболее удаленной точке от среднего значения, но при этом все еще являются частью совокупности данных. Вероятность появления таких значений является крайне низкой. Например, таблетки или капсулы слишком большого веса либо не полностью заполненные флаконы являются экстремальными значениями. К экстремальным значениям можно отнести также наводнения и стихийные бедствия, вызванные общими причинами.

Выбросы также удаляются из оставшейся совокупности данных, но при этом они не являются частью предполагаемого распределения. Причинами появления выбросов в большинстве случаев являются неслучайные особые причины. К выбросам можно отнести таблетку с двойным тиснением, блистер с одной незаполненной ячейкой или техногенные катастрофы. Как правило, выбросы – это очень редкие явления.

Совпадения

Совпадение – это случайное наступление двух событий в одно и то же время, создающее видимость взаимной или причинно-следственной связи.

«Среди миллиардов людей и квадриллионов характеристик невероятно, чтобы иногда не случалось невероятное» автор неизвестен.

Совпадения могут случаться довольно редко. Например, если бы в аварии с участием четырех машин все водители имели одинаковые фамилии или некая пара имела трех детей, родившихся 25 мая. Если в промышленности случается какое-либо редкое событие, то велико искушение установить вызвавшую его причинно-следственную связь. А ее может и не быть.

Оценка вероятности

Оценка вероятности должна быть, насколько это возможно, основана на научных знаниях и исторических данных. Степень усилий и строгость, направленные на оценку вероятности должны соответствовать уровню восприятия риска. Соответственно, оценка значимых рисков требует значительных усилий.

Вероятность можно оценить, используя три определения. Первый способ определения вероятности основан на предположении, что объем доступных для оценки данных крайне ограничен, поэтому оценка представляет собой наиболее близкое к истине научное предположение, построенное на опыте, знаниях и интуиции.

Однако человеку свойственно ассоциировать публичность с повышенным риском. Например, согласно сообщению Всемирной организации здравоохранения (ВОЗ) от 18 мая 2009 года число заболевших свиным гриппом составило 4800 человек, а количество скончавшихся предположительно от этого заболевания – 61 человек. Тем не менее широкое освещение этого факта в средствах массовой информации привело к временному закрытию многих школ в Мексике. Вице-президент США попросил свою семью на время отказаться от путешествий, а население разных стран начало массово закупать защитные маски для лица и делать запасы продовольствия.

Теперь давайте сравним эту ситуацию с количеством смертей в автомобильных авариях. За первые десять месяцев 2008 года среднее количество погибших составило 3111 в месяц. Такой показатель был расценен как приемлемый, поскольку в аналогичный период 2007 года погибло в среднем 3450 человек в месяц. При этом вице-президент США не рекомендовал членам своей семьи отказаться от использования автотранспорта.

К сожалению, это означает, что субъективно мы считаем события, получающие широкую огласку, более вероятными. Например, если в сообществе профессионалов постоянно освещается проблематика температурных отклонений, то специалисты будут считать такой риск более высоким, чем, например, риск биологического загрязнения от насекомых и животных, который на самом деле может быть гораздо выше.

Второй способ определения вероятности предполагает наличие достаточного объема данных для расчета вероятности. Обычно это исторические данные, собранные в ходе разработки, валидации и (или) производства. Взвесив 1000 таблеток из 10 последовательных серий, можно получить оценку вероятности выявления таблеток, характеристики которых превышают допустимые пределы для предупреждения, вмешательства или подтверждения отказа. Конечно, при этом предполагается использование репрезентативных для процесса данных.

Рассмотрим другой пример. Допустим, при проверке ряда паллет, на которых размещено по 400 флаконов, было обнаружено в среднем по 40 флаконов с трещинами. Как определить вероятность того, что следующий флакон, выбранный случайным образом, окажется треснувшим? Результат проверки составляет 40 из 400 флаконов, т.е. 10%. Если предположить, что аналогичная частота появления треснувших флаконов сохранится и в будущем, то частота появления угрозы составит 10%, а вероятность угрозы будет равна 0,1. Однако какова истинная оценка вероятности? Насколько можно быть уверенным в полученном показателе? Имеет ли это значение для оценки риска?

Для этого необходимо рассчитать доверительный интервал вокруг частоты появления, определенной для потенциальной угрозы. В большинстве случаев достаточно определения 95% доверительного интервала. Получается, с 95% уверенностью можно утверждать, что истинная частота появления угрозы находится между 0,071 и 0,129 или 7,1% и 12,9%.

Может ли рассчитанный доверительный интервал использоваться при оценке риска? Зависит от обстоятельств. Что произойдет, если вместо 400 флаконов для контроля будут взяты только 30? Вероятность, которая изначально составляла 0,1, теперь может составлять от 0 до 0,212. Этот результат может оказаться малоприменим при попытке определения частоты появления.

Третий способ определения вероятности требует наличия надежной статистической модели. Наиболее распространенными моделями для лабораторных данных являются нормальное, логарифмически нормальное и экспоненциальное распределение.

Распределение Пуассона

Распределение Пуассона полезно при расчете вероятности незначительных событий, для наступления которых существует множество возможностей.

При расчете вероятности появления таких опасностей, как потеря стерильности или наличие бактериальных эндотоксинов, применяется закон малых чисел (или закон редких событий). Этот закон описывается распределением Пуассона.

Например, с помощью распределения Пуассона можно рассчитать вероятность Р полного отсутствия случаев потери стерильности ампул для площадки со средним показателем 2 случая в год, которая составит 0,135 или 13,5%.

Также можно рассчитать вероятность превышения среднего показателя. Получится, что вероятность наступления более 2 случаев потери стерильности в следующем году для производственной площадки со средним показателем 2 случая в год составит 0,323 или 32,3%.

Литература

1. Keynes, J. M., The Collected Writings of John Maynard Keynes. Volume 29. The General Theory and After: A Supplement, London: The Macmillan Press. 1979.

2. Bernoulli, Jacob. Ars Conjectandi. Basil: Thurnisiorum, 1713.


👉 Больше информации на Telegram-канале СЛУЖБА КАЧЕСТВА
Обсуждения, дискуссии вопросы-ответы 👉 в чате специалистов по качеству