Мониторинг
February 8

USE vs RED vs LTES: Какой метод выбрать для диагностики системы?

Введение

В этой статье я расскажу о том, какие метрики наиболее полезно собирать для приложений и сервисов.

Начало работы

Допустим, вы развернули сервис на своей платформе и решили добавить для него мониторинг.

С чего начать?

Во-первых, необходимо выяснить, какой именно набор метрик вы хотите снимать.

Этот набор не всегда будет одинаковым для всех приложений.

Часто бывает нелегко понять, что именно нужно отслеживать, и в таких случаях всегда можно собрать все метрики и выяснить, что из них полезно.

Чтобы немного сузить круг поиска, мы можем обратиться к методам RED и USE.


Методы RED / USE

Вы наверняка слышали о методах RED и USE.


USE

USE - это аббревиатура от Utilization, Saturation и Errors. В статье Брендан Грегг пишет, что

"USE - это методология анализа производительности любой системы" и что с помощью этого метода можно решить около 80% проблем сервера, затратив 5% усилий.Вы начинаете с создания чек-листа для анализа сервера, который может быть использован для быстрого выявления узких мест или ошибок. Затем вы начинаете задавать вопросы и искать на них ответы.

Он сравнивает его с аварийным контрольным списком в руководстве по летной эксплуатации: он должен быть простым, понятным, полным и быстрым.

В основе метода USE лежат три типа метрик и стратегия метода к комплексной системе.

Брендан Грегг кратко описал метод USE следующим образом:

Для каждого ресурса проверьте использование, насыщенность и ошибки.

где:

  • Utilization (использование - процент времени, в течение которого ресурс был занят).
  • Saturation (насыщенность - количество работы, которую должен выполнить ресурс).
  • Errors (количество ошибок во время выполнения работы)

Метод USE предназначен для использования на ранних этапах исследования производительности, чтобы выявить системные узкие места.

О методе USE можно прочитать здесь

RED

В 2015 году Том Уилки из Grafana рассказал о методе RED для мониторинга микросервисов.

В этом выступлении Том Уилки сказал:

«Метод USE не совсем применим к сервисам; он применим к аппаратному обеспечению, сетевым дискам и тому подобным вещам. Нам очень нужна была философия мониторинга, ориентированная на микросервисы, поэтому мы придумали метод RED».

Вместо того чтобы отслеживать каждый ресурс на предмет использования, насыщенности и ошибок, Том предлагает следующее:

Для каждого ресурса отслеживайте:

  • Rate (скорость - количество запросов в секунду, которые обслуживают ваши службы).
  • Errors (количество неудачных запросов в секунду - ошибок).
  • Duration (длительность - время отклика ваших сервисов на каждый запрос).


Используя метод RED, компании будут лучше понимать, насколько довольны клиенты

Если у вас высокая частота ошибок, это означает, что ваши пользователи получают ошибки при загрузке страницы.
Если у вас высокое время отклика, значит, ваш сайт работает медленно.

LTES (или "Четыре золотых сигнала")

Подождите, есть еще один метод. Четыре «золотых сигнала» взяты из книги Google's SRE Book

Четыре золотых сигнала мониторинга - это задержка, трафик, ошибки и насыщенность. Если у вас есть возможность измерить только четыре метрики вашей системы, ориентированной на пользователя, сосредоточьтесь на этих четырех.

Где:

  • Latency (Задержка - время, необходимое для обслуживания запроса)
  • Traffic (Трафик - количество запросов к вашей системе)
  • Errors (Ошибки - количество запросов, которые не выполняются)
  • Saturation (Насыщение - насколько «переполнен» ваш сервис).

Единственное отличие этого метода от метода RED заключается в том, что он включает в себя насыщение (Saturation ).

Какой метод вам следует использовать?

Том Уилки рекомендует использовать комбинацию методов USE и RED.

«Метод RED - это забота о пользователях и их счастье, - говорит Том, - а метод USE - это забота о машинах и их счастье. На самом деле это просто два разных взгляда на одну и ту же систему. Они дополняют друг друга».

Источник Medium |

📢 Канал в телеграмм

😊 Для донатов