Коррелирует ли VO2max и результат?
Довольно часто можно услышать, что "VO2max не коррелирует с результатом и производительностью бега". Правда ли это?
А как насчет подобных же утверждений о таких показателях, как состав тела, экономичность бега, объем бега и максимальная частота сердечных сокращений?
Обычно, когда люди делают подобные заявления, ссылаются на исследование, показывающее, что среди определенной группы бегунов рассматриваемый показатель (например, VO2max) не позволяет различить самых быстрых и самых медленных бегунов в группе.
Другая версия этих утверждений имеет форму утверждений типа "среди бегунов с похожим VO2max те, у кого лучше (экономичность бега/порог лактата/какой-либо другой показатель эффективности), показывают более быстрое время на дистанции".
Что должны делать с такими утверждениями? Давайте посмотрим, почему корреляции всегда будут слабее, если ограничить анализ небольшой подгруппой, например, элитными спортсменами.
Что означает "VO2max коррелирует с производительностью"?
Корреляция — это классическая статистическая мера того, как одна переменная связана с другой. Обычно она обозначается как R. Проще понять определение квадрата корреляции (R2) – это значение равно вариации результата (например, результата гонки), которая объясняется предикторной (независимой) переменной, деленной на общую величину вариации результата. Корреляция — это просто квадратный корень этого значения.
Обратите внимание на знаменатель – общую вариацию результата. Если в нашем результате есть какой-либо источник вариации, который не полностью объясняется нашей метрикой, R2 обязательно будет меньше 1,0.
Легче вырабатывать интуитивное понимание с помощью нескольких графиков. Вот несколько примеров различных значений для R:
Соответствующие значения R2 составляют 0,09, 0,36 и 0,81 (что демонстрирует одно неприятное свойство R2: его неудобное, нелинейное масштабирование).
What is VO2max in running, and how is it measured?
VO2max — это максимальное количество кислорода, которое организм может извлечь за минуту. Это стандартное измерение, используемое в физиологии упражнений, и оно определяется при тестировании на беговой дорожке (если мы говорим про бег). Во время теста на атлете герметичная маска с датчиком, который измеряет концентрацию кислорода во вдыхаемом и выдыхаемом воздухе.
Разница между этими двумя показателями (умноженная на объем дыхания) — это объем (V) кислорода (O2), потребляемого для этого вдоха: VO2.
Если поместить спортсмена на беговую дорожку с низкой скоростью и увеличивать скорость каждые одну-две минуты, потребление кислорода спортсменом будет неуклонно расти по мере увеличения скорости, пока не произойдет одно из двух: либо (а) VO2 достигнет явного плато, не показывая дальнейшего роста даже при продолжающемся увеличении скорости дорожки, либо (б) спортсмену придется остановиться из-за усталости.
Кстати, ситуация (б) случается чаще, чем можно было бы подумать; примерно половина элитных спортсменов не выходит на классическое "плато VO2", которое часто показывают в традиционных учебниках по физиологии упражнений. Это открытие ставит под сомнение, является ли VO2max действительно максимумом, поэтому формулировка весьма осторожная: "VO2max — это оценка максимального потребления кислорода".
В любом случае максимальное значение VO2, достигнутое во время теста — либо значение плато, либо наивысшее значение, достигнутое до остановки спортсмена — принимается за максимальный объем кислорода, который может извлечь спортсмен, и оно называется VO2max.
VO2max традиционно нормализуется по отношению к массе тела, поэтому единицами VO2max являются миллилитры потребляемого кислорода на килограмм массы тела в минуту: мл/кг/мин. У среднестатистического здорового молодого человека VO2max может быть около 30; бегуны в хорошей физической форме, как правило, набирают 50, 60 и 70 баллов, а элитные бегуны, как правило, набирают более 70 баллов.
Почему мы можем ожидать, что VO2max будет коррелировать с производительностью?
Интуитивно понятно, почему VO2max должен коррелировать с производительностью (имеется в виду время гонки): более высокое потребление кислорода указывает на большую способность производить энергию аэробным путем, что означает, что атлет лучше способен "удалять" излишки побочных продуктов метаболизма, образующихся при сжигании большого количества АТФ для создания мышечной силы.
Действительно, определенно кажется, что VO2max должен коррелировать с более быстрыми личными рекордами — у элитных спортсменов VO2max часто вдвое или втрое больше, чем у малоподвижного человека, даже при сопоставимой массе тела.
Почему мы можем ожидать, что VO2max не будет коррелировать с производительностью?
Скептики важности VO2max справедливо отмечают, что с производительностью связаны и многие другие факторы, помимо потребления кислорода: насколько эффективно атлет использует энергию, получаемую при "сжигании" кислорода? Насколько он ментально вынослив? Какую часть максимальной аэробной мощности атлет можете поддерживать в течение заданного времени? Каков его лактатный порог?
Все это обоснованные замечания. Даже в контексте лабораторных испытаний легко можно представить себе альтернативную вселенную, в которой физиологи одержимо сосредоточены на экономичности бега — обычно количественно определяемой как потребление кислорода при заданной скорости — вместо VO2max.
В этой вселенной говорили бы о том, кто самые экономичные бегуны, и какие тренировки можно сделать, чтобы увеличить экономичность бега. И тогда, возможно, появится какой-нибудь эксперт и скажет, что среди бегунов с похожей экономичностью бега те, у кого более высокий VO2max, бегут быстрее!
Опять же, не стоит оспаривать аргументы сторонников или противников VO2max. Это лишь контекст для относительно бесспорного момента – на результат атлета, помимо VO2max, влияют и другие факторы.
VO2max и производительность – ошибки и неточности
Лабораторное физиологическое тестирование имеет видимость точности, но правда в том, что даже самое современное коммерчески доступное оборудование для измерения потребления кислорода имеет около 2% отклонения в повторных измерениях идентичных образцов газа. Даже для оборудования, специально настроенного для исследовательских целей, точность измерений VO2max может различаться вплоть до 15%!
То же самое касается и производительности: хотя сама система хронометража очень точна, время любого конкретного спортсмена почти наверняка будет иметь 1-2% отклонения в зависимости от того, как разворачивается гонка, его тактических решений и ежедневной изменчивости самочувствия, даже если фактическая физическая форма постоянна.
Помните, что оба этих источника ошибок будут способствовать оцениваемой корреляции, когда берется измерение VO2max и производительность гонки (личный рекорд или иное) в качестве "истинных значений" для спортсмена. Они будут способствовать накоплению общего количества вариаций в данных, которое находится в знаменателе уравнения корреляции.
Выборка: решающий фактор в определении вариации результата
Помимо случайных ошибок в измерении VO2max и результатов забега, есть один очень большой фактор, который повлияет на расчет корреляции между этими двумя переменными: кого мы включаем в выборку.
Что такое выборка? Это просто группа бегунов, которая рассматривается в исследовании. Однако, это ключевой фактор при расчете корреляции!
Почему так? Потому что если мы ограничим размер выборки только бегунами определенного уровня — скажем, элитными бегунами на длинные дистанции — мы серьезно ограничим общую вариацию результата. И более того, результаты будут еще более разнонаправленные, если включить в эту выборку людей, которые показывают лучшие результаты, и исключив тех, которые показывает худшие результаты.
Ниже представлены реальные данные, позволяющие увидеть этот эффект в действии.
VO2max и его корреляция с результатом в гонке на 3 км
В статье Андерса Аандстада представлен очень хороший набор данных, который можно использовать для изучения корреляций между VO2max и результатами гонок, а также для большего понимания феномена ограничения выборки и корреляции.
В статье, опубликованной в 2021 году, изучалась связь между измеренным в лабораторных условиях VO2max и результатами бега на 3000 м у 259 военных курсантов в Норвегии. Это хорошая выборка, и можно ожидать широкий диапазон вариаций как в VO2max, так и в уровне производительности. Действительно, если посмотреть на распределение этих показателей, то видно достаточно сильную корреляцию между VO2max и скоростью бега на 3 км:
Синяя линия показывает линейную регрессионную модель, соответствующую данным. Линия представляет среднюю скорость на 3 км у людей с заданным показателем VO2max.
Тот факт, что реальные данные не всегда идеально ложатся на эту линию, является результатом как ошибок измерений, так и дополнительных факторов, которые влияют на показатели в беге на 3 км помимо VO2max, таких как экономичность бега и порог лактата. Эта ошибка называется остаточной ошибкой, поскольку она "осталась" после расчета линейной модели.
Корреляция, показанная на графике выше (R=0,81), является достаточно сильной по стандартам исследований производительности человека. Значение R2 =0,66 указывает на то, что 66% вариабельности времени на 3 км для этой группы можно объяснить лабораторно измеренным показателем VO2max.
Ограничение выборки уменьшает силу корреляции
Теперь, используя те же данные, повторим анализ, но ограничим выборку только теми, кто пробежал 3 км быстрее 11:00 (допустим, что это контрольное время для участия в гонке, и мы проводим исследование, используя только тех, кто прошел квалификацию для этой гонки). Условно назовем спортсменов со временем на 3 км быстрее 11:00 "элитными спортсменами".
Что же теперь происходит с корреляцией в выборке с отсечением по времени? Она становится гораздо меньше. Теперь R равняется 0,48, а R2 =0,23. Почему? Ничего не изменилось в базовых данных или в биологическом процессе, который генерировал данные.
Произошло то, что знаменатель в расчете R2 стал намного меньше — мы искусственно уменьшили вариацию скорости на 3 км, включив только самых быстрых бегунов. Элитное "пороговое значение" исключило бегунов со значениями VO2max в диапазоне 55–65 мл/кг/мин, которые показали более медленные результаты на 3 км, поэтому в этой ограниченной выборке VO2max не так точно предсказывал результаты, чем это было на самом деле.
Другой способ рассмотрения этой проблемы заключается в том, что бегуны, которые хорошо бегают 3 км по причинам, отличным от их VO2max, с большей вероятностью будут отобраны в выборку, поскольку они, как правило, показывают более высокие результаты среди бегунов с тем же VO2max.
Вследствие этого эффекта "отбора VO2max", по-видимому, "не коррелирует" (или слабо коррелирует) с результатами, если смотреть на бегунов высокого уровня.
Эффект отбора становится более очевидным, когда данные элиты и их корреляции выносятся вместе со всем набором данных:
Лучший подход: какой диапазон показателей возможен для данного значения VO2max?
Есть лучший способ подойти к вопросам корреляции, который заключается в рассмотрении диапазона результатов, которые возможны для заданного уровня выбранного показателя. В нашем случае – нужно спросить, какой диапазон времени на дистанции 3 км возможен для заданного VO2max. К счастью, ответ может дать та же модель линейной регрессии.
Можно спросить: "С 90%-ной уверенностью, какой диапазон результатов 3 км возможен с заданным VO2max?". Либо можно сказать: "Среди бегунов с заданным VO2max, 90% из них смогут пробежать в этом диапазоне времени 3 км".
Значение 90% было выбрано совершенно произвольно, можно, по желанию можно использовать любое значение. Можно визуализировать интервалы прогнозирования для приведенных выше данных следующим образом:
Этот график позволяет более просто визуализировать диапазон вероятных времен бега на 3 км, которые ожидается увидеть для данного значения VO2max. Например, среди большой группы бегунов с VO2max 60 мл/кг/мин ожидается, что 90% из них смогут пробежать 3 км за 10:22–12:37.
Интервалы прогнозирования все равно не спасут вас, если размер выборки ограничен на основе результата. Причина та же: выбирая атлетов на основании результатов, мы все равно систематически исключаем большую группу людей, которые показывают неудовлетворительные результаты относительно своего VO2max.
Вот интервал прогнозирования 90% из группы только элиты, наложенный на интервалы прогнозирования 90% для всего набора данных:
Даже интервалы прогнозирования страдают от искусственного исключения людей с высоким VO2max, но медленным временем гонки. Опять же, когда "слишком быстрые атлеты" с большей вероятностью будут включены в выборку, корреляции и интервалы прогнозирования опять не будут точными.
Вывод
При оценке того, насколько хорошо данная метрика коррелирует с результатами, крайне важно учитывать выборку, которая используется для такого утверждения.
В сильно ограниченной выборке (например, в группе элитных бегунов) корреляции всегда будут казаться меньше, поскольку вы искусственно уменьшаете диапазон общей вариации результата (в данном случае, результатов в гонке).
Лучше сформулировать вопрос в терминах интервалов прогнозирования — диапазона результатов, которые совместимы с заданным значением любой интересующей нас метрики. Вот что имеется в виду:
Менее полезно: VO2max плохо коррелирует с производительностью (R2 = 0,23) среди бегунов со временем на дистанции 3 км менее 11:00
Более полезно: Среди бегунов с показателем VO2max 60 мл/кг/мин, 90% смогут пробежать дистанцию 3 км за 10:22–12:37.
Второе и более полезное замечание помогает понять несколько вещей о VO2max и производительности. В приведенном выше примере очевидны три вещи:
- Более высокий VO2max обеспечивает лучшую производительность
- Даже для заданного значения VO2max возможен относительно широкий диапазон результатов.
- Если VO2max очень низкий, существуют уровни производительности, которые совершенно недостижимы.
То, где результаты на гонке окажутся в пределах диапазона вероятных значений для любого заданного VO2max, будет зависеть от всех "других вещей", которые нас интересуют с точки зрения производительности: экономичность бега, порог лактата в процентах от VO2max, анаэробная емкость и т. д.
Но утверждение "VO2max не коррелирует с производительностью" явно неверно, а очевидное отсутствие корреляции — это всего лишь артефакт, получающийся от того того, как была отобрана выборка. То же самое будет верно для любой выбранной метрики, если выборка ограничится на основе чего-то, что коррелирует с производительностью.