фармацевтика
April 25, 2022

Оценка линейности при валидации аналитических методик: планирование эксперимента и обработка результатов

Автор: Попова Татьяна Андреевна, менеджер проектов по трансферу, [email protected]

В системе обеспечения качества фармацевтической продукции важную роль играет контроль исходного сырья, полупродуктов и готовых лекарственных препаратов. Для того чтобы аналитические методики гарантировали достоверные и точные результаты анализа, предусмотрена процедура валидации аналитических методик. Одной из важных валидационных характеристик, подлежащих оценке, является линейность – способность в пределах заданного диапазона получать результаты, прямо пропорциональные концентрации (количеству) анализируемого вещества в образце [1].

Современные рекомендации и требования по оценке линейности при валидации аналитических методик приведены в руководстве ICH [1], Фармакопее США (USP) [2], ГФ РФ XIV [3] и Решении Коллегии ЕЭК №113 от 17.08.2018 [4]. Однако, как показывает практика, этих источников не всегда достаточно, чтобы полностью спланировать эксперимент и не допустить ошибок при обработке его результатов. По этой причине в этой статье мы постараемся:

а) разобрать теоретические основы и особенности эксперимента по оценке линейности при валидации аналитических методик;

б) проанализировать, есть ли различия в требованиях к оценке линейности в основных руководствах по валидации аналитических методик [1–4];

в) дать рекомендации, которые помогут избежать типичных ошибок, допускаемых в ходе испытаний или обработки результатов.

1. Планирование эксперимента

1.1 Количество точек для проведения испытаний и их распределение

Согласно руководствам [1–4], необходимо использовать не менее 5 экспериментальных точек. Четких требований относительно того, как эти точки должны быть распределены по охваченному диапазону, в данных руководствах нет, однако наиболее предпочтительный вариант – равномерное распределение экспериментальных точек относительно диапазона применения методики [5–7].

1.2 Диапазон концентраций, который необходимо охватить

Согласно руководствам [1–4], линейную зависимость необходимо оценить в пределах всего диапазона применения аналитической методики, который зависит от ее назначения. В качестве минимально допустимых рассматриваются диапазоны применения, представленные в таблице 1.

Таблица 1. Минимально допустимые диапазоны применения аналитических методик согласно руководствам [1–4].

Помимо этого, согласно руководствам [1, 4], для примесей, обладающих чрезвычайно сильным действием или имеющих токсический или непредвиденный фармакологический эффект, предел обнаружения и предел количественного определения должны быть соразмерны тому уровню, на котором примеси должны контролироваться. Также может потребоваться задать аналитическую область вблизи предполагаемого (возможного) предела содержания примеси. Кроме того, если количественное определение и чистота изучаются одновременно с помощью одного испытания и используется только 100-процентный стандарт, линейная зависимость должна быть во всем диапазоне применения аналитической методики, начиная с порога информирования для примеси до 120-процентного содержания, указанного в спецификации для количественного определения.

1.3 Приготовление растворов

Согласно руководствам [1, 4] допустимо подтверждать линейность как на фармацевтической субстанции (путем разведения основного стандартного раствора), так и на отдельных навесках модельных смесей компонентов лекарственного препарата, используя предложенную методику. В фармакопеях [2–3] данный аспект не обсуждается.

Использование отдельных навесок модельных смесей представляется более правильным способом, поскольку:

а) позволяет учесть влияние вспомогательных веществ;

б) не вносит дополнительные операции (разведение) в тестируемую методику анализа;

в) позволяет исключить ошибки, связанные с неверным взятием одной исходной навески вещества.

Однако такой способ не всегда возможен на практике, поскольку для приготовления растворов с очень низкой концентрацией пришлось бы брать очень маленькие навески компонентов лекарственного препарата, что внесло бы дополнительную погрешность в результаты испытаний. В связи с этим зачастую используют смешанный способ: часть растворов готовят из отдельных навесок, а другие – путем их разведения.

Кроме того, допустимо проводить тест «Линейность» одновременно с тестом «Правильность», что позволяет уменьшить объем работ и приводит к экономии времени, затрачиваемого на валидацию [5].

1.4 Количество повторов эксперимента

Ни в одном из руководств [1–4] не рассмотрены требования к минимально необходимому количеству повторов испытаний по оценке линейности. Однако очевидно, что многократное проведение эксперимента повышает надежность выводов о линейности методики. Обзор литературы показывает, что возможны варианты как с одной серией растворов, так и с несколькими, вплоть до шести, причем второй способ является более предпочтительным, поскольку позволяет учесть не только погрешность прибора, но и погрешность пробоподготовки [6].

Также некоторые источники [7–8] дают рекомендации проводить двукратное, а лучше трехкратное измерение для каждого раствора каждой серии, причем измерения необходимо проводить в случайном порядке, например,

– номер раствора в порядке увеличения концентрации.

2. Обработка результатов эксперимента

Согласно руководствам [1–2, 4], после получения результатов испытаний необходимо построить график зависимости аналитического сигнала как функции концентрации или количества определяемого вещества и визуально оценить линейность. При наличии четкой линейной зависимости полученные результаты обрабатывают подходящими статистическими методами. Наиболее распространенным является вычисление регрессионной линии методом наименьших квадратов (МНК) [1–4].

2.1 Линейная регрессия и МНК (суть метода)

Задача регрессии – выбрать такую кривую зависимости y от х, чтобы она проходила как можно ближе к полученным в ходе эксперимента точкам и при этом эта зависимость оставалась бы максимально простой. В самом распространенном при валидации аналитических методик случае такая зависимость y = f(x) будет иметь вид:

(1)

где a и b – параметры линейной регрессии: свободный член линейной регрессии и тангенс угла наклона линии регрессии соответственно.

Возникает вопрос – как определить эти параметры? Одним из наиболее простых методов для решения этой задачи является МНК. В этом методе важную роль играет понятие остатка – разности экспериментального и вычисленного по уравнению регрессии значения аналитического сигнала (см. рис. 1). Функцию f(x) подбирают так, чтобы сумма квадратов остатков была минимальной.

Рисунок 1. Линия регрессии с изображенным остатком для второй экспериментальной точки.

Для того чтобы найти параметры линейной регрессии в этом случае, необходимо просуммировать все квадраты остатков

(2)

вычислить частные производные этой функции по a и b, приравнять их нулю и решить получившуюся систему линейных уравнений.

На практике химикам-аналитикам, проводящим валидацию методик, не приходится углубляться в сложные математические расчеты, поскольку чаще всего они осуществляются автоматически в специализированном программном обеспечении либо в Microsoft Excel.

2.2 Коэффициент корреляции Пирсона r и коэффициент детерминации R^2

Наиболее частым статистическим показателем, который используется для обозначения силы линейных взаимоотношений между двумя переменными, является коэффициент корреляции Пирсона r, представляющий собой число от –1 до +1. Положительный коэффициент корреляции r означает, что по мере того, как увеличиваются значения одной переменной, возрастают и значения другой переменной. Отрицательный коэффициент корреляции r говорит об обратной зависимости. Чем ближе коэффициент корреляции r к +1 или –1, тем ближе зависимость между величинами к линейной.

Другой статистический показатель, который нередко применяют при оценке линейности, – коэффициент детерминации R^2. Он показывает долю дисперсии (разброса значений случайной величины относительно её математического ожидания) переменной y, объясняемой рассматриваемой линейной моделью. Коэффициент детерминации R^2 может принимать значения от 0 до +1, и чем ближе он к +1, тем сильнее зависимость между переменными. В частном случае линейной зависимости, коэффициент детерминации R^2 представляет собой квадрат коэффициента корреляции Пирсона r.

Согласно руководствам [1–3], при предоставлении результатов испытаний по оценке линейности необходимо рассчитать коэффициент корреляции Пирсона r. Согласно Решению Коллегии ЕЭК №113 [4], допустимо предоставить данные либо по коэффициенту корреляции r, либо по коэффициенту детерминации R^2. При этом в руководствах [1–2, 4] нет критериев, в которые должны укладываться эти коэффициенты. В ГФ РФ XIV [3], напротив, присутствуют требования к коэффициенту корреляции Пирсона r:

Однако, легко показать, что ни коэффициент корреляции Пирсона r, ни коэффициент детерминации R^2 не могут быть единственными критериями оценки линейности модели. Для примера рассмотрим степенную функцию , нанесем значения переменных х и у на график и применим к этим данным метод линейной регрессии.

Таблица 2. Значения переменных х и у для функции у = 10 * x^1.3 и рассчитанные остатки при использовании линейной регрессионной модели (см. рис. 2)
Рисунок 2. Иллюстрация применения метода линейной регрессии к степенной функции у = 10 * x^1.3

Вычислив коэффициент корреляции Пирсона r,

заметим, что даже при

зависимость может не являться линейной.

Анализ литературных данных [5] показывает, что на практике желательно применять более жесткие критерии для коэффициента корреляции Пирсона r:

для методик определения содержания основных веществ и

для методик определения содержания примесей. В некоторой литературе [7] встречается мнение о том, что несмотря на широкую распространённость, коэффициент корреляции Пирсона r зачастую вводит исследователей в заблуждение и потому вообще не подходит в качестве теста при оценке линейности аналитических методик.

В связи с вышеизложенным можно сделать вывод, что при проверке линейности нельзя полагаться лишь на этот критерий, и близкие к единице коэффициенты корреляции и детерминации – необходимое, но недостаточное условие наличия линейной зависимости.

2.3 Остаточная сумма квадратов RSS

Согласно руководствам [1–2, 4] при валидации линейности необходимо представить данные об остаточной сумме квадратов RSS (Residual Sum of Squares). Встречается также иной перевод этого термина – сумма квадратов остатков. RSS (см. уравнение 2) описывает, насколько велика разница между экспериментальными результатами и значениями, вычисленными по уравнению регрессии. Чем меньше значение RSS, тем лучше подобрана регрессионная модель.

Возникает вопрос, зачем суммировать именно квадраты остатков, а не сами остатки? Дело в том, что остатки могут быть как положительными, так и отрицательными. Одно из следствий использования метода наименьших квадратов заключается в том, что сумма остатков будет всегда равна нулю, кроме того случая, когда свободный член линейной регрессии отсутствует. В связи с этим, сумма остатков не может быть индикатором того, насколько хорошо подобрана регрессионная модель. Если же мы просуммируем квадраты остатков, то это позволит преобразовать все отрицательные величины в положительные и, таким образом, избежать нулевого значения их суммы.

В отличие от коэффициентов корреляции и детерминации, остаточная сумма квадратов напрямую зависит от размерности единиц, в которых выражены концентрация и аналитический сигнал. В связи с этим не представляется возможным установить единый критерий приемлемости для RSS, а следует лишь рассматривать полученное значение RSS в совокупности с другими результатами, полученными при оценке линейности [9].

2.4 График остатков и определение «выбросов»

Из рассмотренных руководств [1–4] лишь ICH предлагает в качестве дополнения проанализировать отклонения экспериментальных точек от регрессионной линии, иными словами, построить график остатков. Однако на практике это может быть весьма полезно. В качестве критерия приемлемости можно рассматривать отсутствие какой-либо тенденции (например, параболической или синусоидальной зависимости) в выбранном диапазоне концентраций [5-6].

Вернемся к примеру функции рассмотренной в 2.2 и построим график остатков для полученных данных.

Рисунок 3. График остатков для функции рассмотренной в 2.2

Как видно из рисунка 3, график остатков в этом случае имеет U-образную форму, что должно сразу насторожить исследователя. При получении такой картины рекомендуется проанализировать, не будет ли какая-либо нелинейная модель описывать зависимость y от х более точно, а также подтвердить это расчетом.

Наличие какой-либо системности на графике остатков также может свидетельствовать о так называемой гетероскедастичности, то есть неоднородности, наблюдений, выражающейся в непостоянной дисперсии случайных ошибок регрессионной модели [8].

Также по графику остатков можно сделать предположение о наличии в выборке «выбросов» – не типичных по отношению к остальным данным, которые требуют выяснения причин их возникновения. Такие точки, как правило, хорошо просматриваются на графике остатков. В таблице 3 приведен пример смоделированных данных, а на рисунке 4 представлен график остатков этой модели, из которого видно, что точка №8 является сомнительной и может быть рассмотрена как «выброс».

Таблица 3. Смоделированные данные для демонстрации возможности определения «выброса» с помощью графика остатков, стьюдентизированных остатков и расстояния Кука
Рисунок 4. График остатков модели, приведенной в таблице 3.

Помимо визуальной оценки графика остатков, существуют и различные статистические тесты, с помощью которых можно проверить, является ли данная точка «выбросом» относительно регрессионной модели. Некоторые такие тесты приведены в работах [5] и [10, с. 73–77].

Следует, однако, отметить, что применение параметрических методов непосредственно к величинам остатков не вполне корректно, поскольку они не являются независимыми. Один из способов решения этой проблемы – расчет так называемых стьюдентизированных остатков (в некоторой литературе этому же определению соответствует понятие «стандартизированные остатки» или «внутренне стьюдентизированные остатки») по формуле:

К стьюдентизированным остаткам применимы все те же методы выявления грубых ошибок, что и к обычным остаткам [10, с. 117]. В некоторой литературе [11] встречается простой критерий для стьюдентизированных остатков – если по абсолютной величине они не превышают значения 1,96, значит рассматриваемая точка не является «выбросом». В таблице 3 показаны стьюдентизированные остатки для рассматриваемой модели. Стьюдентизированный остаток для точки №8 составляет 3,10, что указывает на необходимость обратить внимание на данный результат.

Ещё один способ выявления «выбросов» в регрессионном анализе основан на использовании расстояния Кука

(4)

где p – число параметров регрессионной модели (p = 2 в случае простой линейной регрессии).

Считается, что если для какой-либо точки расстояние Кука

то эту точку можно рассматривать как «выброс» [12]. В приведенном выше примере (см. таблицу 3), такой точкой также является №8

Следует помнить, что статистические тесты, будучи по своей сути вероятностными, не всегда дают однозначные результаты. Так один тест причислит сомнительный результат к «выбросам», а другой скажет, что это значение из генеральной совокупности исключать не нужно. В таких случаях рекомендуется провести дополнительные испытания, а при невозможности это сделать – руководствоваться здравым смыслом и проверить, приведет ли обработка серии данных вместе с подозрительной точкой к значительному искажению результатов.

2.5. Тесты на статистическую значимость результатов

Визуальная оценка графиков зависимости аналитического сигнала от концентрации или графиков остатков всегда субъективна. В связи с этим существуют различные статистические способы проверки линейности методики. Как и в случае с выявлением «выбросов», таких тестов множество, но в аналитической химии одним из самых распространенных и сравнительно простых является ANOVA–LOF-тест (Analysis of variance – lack-of-fit test) [6], требующий как минимум два параллельных измерения для каждой концентрации. В основе данного теста лежит разбиение суммы квадратов остатков RSS на компоненту чистой ошибки (pure error) SSe и компоненту ошибки неадекватности подбора (lack-of-fit error), которые можно рассчитать по формулам [8]:

Полученное значение Fexp сравнивают с табличным значением F-критерия Фишера для степеней свободы

Условием для подтверждения линейности методики является выполнение требования

Рассмотрим пример смоделированных данных из раздела 2.4. Статистика теста Fexpдля данной модели равна 0,89. Табличное значение F-критерия Фишера для f1 = 4, f2 = 6 составляет 4,53 при доверительной вероятности 95%. Таким образом,

что позволяет считать данную модель линейной регрессии статистически значимой.

2.6. Взвешенная линейная регрессия

Одной из основных гипотез классического МНК является предположение о равенстве дисперсий остатков, то есть их разброс вокруг среднего (нулевого) значения должен быть стабильной величиной. Однако в практике количественного анализа, особенно если диапазон измерений достаточно широк, иногда наблюдается гетероскедастичность, при которой дисперсии остатков увеличиваются с возрастанием концентраций анализируемых растворов. Обычно в такой ситуации применяют взвешенный метод наименьших квадратов, в котором каждое наблюдение получает «вес» wi, обратно пропорциональный дисперсии случайной ошибки в данном наблюдении [13, стр. 135-136]:

2.7. Отсутствие линейности

Согласно руководствам [1–4] при отсутствии линейности данные испытаний следует подвергнуть математическому преобразованию (например, логарифмированию) до проведения регрессионного анализа. Если линейность не наблюдается ни при каких видах математических преобразований (например, при валидации иммуноаналитических методик), аналитический сигнал необходимо описать с помощью соответствующей функции концентрации (количества) определяемого компонента в пробе. В любом случае, основной целью является получение модели, которая описывает зависимость аналитического сигнала от концентрации наилучшим образом.

3. Частые ошибки при валидации линейности

3.1. Использование точки (0, 0) при построении градуировки

В большинстве случае в программном обеспечении, используемом для построения калибровочных кривых, есть функция «провести калибровочную кривую через точку (0, 0)». Однако эта процедура может привести к ошибкам при оценке результатов. Дело в том, что при анализе бланка большинство детекторов покажет сигнал, отличный от нуля. Таким образом, форсированное проведение калибровочной кривой через начало координат добавит дополнительную фиктивную калибровочную точку (0, 0), что повлияет на результаты расчета – в частности, изменятся параметры регрессионной модели, а сумма остатков в этом случае не будет равна нулю [6].

3.2. Невыполнение обратного расчета

Даже в случае близкого к единице коэффициента корреляции r и отсутствии какой-либо тенденции на графике остатков, нередки ситуации, когда полученное уравнение регрессии дает большую ошибку в области низких концентраций. Это предположение легко проверить, выполнив обратный расчет концентраций по полученному уравнению регрессии и сравнив результат с тем значением концентрации, которое было использовано для построения калибровочной кривой:

Рассчитав таким образом относительную ошибку для каждой экспериментальной точки, мы можем сделать вывод о том, подходит ли данная калибровка для всего рассматриваемого диапазона концентраций [6].

Заключение

Рассмотрены основные особенности планирования эксперимента по оценке линейности при валидации аналитических методик. Показано, что существует множество критериев для оценки линейности, использование которых по отдельности не гарантирует надежный результат. В связи с этим вопросы, связанные с трактовкой результатов, полученных в ходе испытаний, остаются по-прежнему актуальными. Как и все статистические методы, метод линейной регрессии требует разумной интерпретации результатов исследователем.

Список литературы

1.   ICH Harmonised Tripartite Guideline. Validation of Analytical Procedures: Text and Methodology Q2(R1). ICH, 2005.

2.   United States Pharmacopoeia. Monograph 1225. Validation of compendial procedures. 2017.

3.   Государственная фармакопея Российской Федерации. XIV издание. Том 1. ОФС.1.1.0012.15.

4.   Решение Коллегии ЕЭК «Об утверждении Руководства по валидации аналитических методик проведения испытаний лекарственных средств» №113 от 17.08.2018.

5.   Эпштейн Н. А. Валидация аналитических методик: графические и расчетные критерии для оценки линейности методик на практике // Разработка и регистрация лекарственных средств. 2019. Т. 8, № 2. C. 122–130.

6.   Raposo F. Evaluation of analytical calibration based on least-squares linear regression for instrumental techniques: A tutorial review // Trends in Anal. Chem. 2016. V. 77. P. 167–185.

7.   Thompson M., Ellison S.L.R., Wood R. IUPAC technical report. Harmonized guidelines for single-laboratory validation of methods of analysis // Pure Appl. Chem. 2002. V. 74. P. 835–855.

8.   Analytical Methods Committee. Is My Calibration Linear? // Analyst. 1994. V. 119. P. 2363–2366.

9.   Heym P.P. About small values with huge influence – Sum Of Squares – part 1 // https://mpl.loesungsfabrik.de/en/english-blog/method-validation/sum-of-quares-part1 (доступно на 25.04.2022).

10.   Дворкин Н.И. Метрология и обеспечение качества количественного химического анализа. М.: Химия, 2001.

11.   Jurado J.M., Alcazar A., Muniz-Valencia R., Ceballos-Magana S.G., Raposo F. Some practical considerations for linearity assessment of calibration curves as function of concentration levels according to the fitness-for-purpose approach // Talanta. 2017. V. 172. P. 221–229.

12.   Henderson A.R. Information for Authors: Is the Advice Regarding the Reporting of Residuals in Regression Analysis Incomplete? Should Cook’s Distance Be Included? // Clin. Сhem. 2006. V.52. P. 1848–1850.

13.   Miller J.N., Miller J.C. Statistics and Chemometrics for Analytical Chemistry. Pearson Education Limited, 2005.

Обсуждения, дискуссии вопросы-ответы 👉 в GxP-чате. Производство (GMP).

👉 Мы в telegram:

Производство (GMP) - https://t.me/chat_gmp
Регистрация ЛС - https://t.me/chat_registration
Фармаконадзор (GVP) - https://t.me/chat_gvp
Дистрибуция (GDP) - https://t.me/chat_gdp
Клинические исследования (GCP) - https://t.me/chat_gcp