September 18, 2020

Лучшие практики A/B тестирования

— Шаблон дизайна эксперемента:
• Гипотеза
• Что делаем
• На каких пользователях тестируем
• Ключевые метрики для оценки эксперемента
• Ожидаемый эффект
• План действий в зависимости от результатов эксперемента

— Формула гипоезы: 
Действие [X] позволит увеличить метрику [N] на величину [Y], потому что [Z]

— Приоритезация гипотез по ICE

• Impact (Влияние) - демонстрирует, насколько идея положительно повлияет на ключевой показатель, который вы пытаетесь улучшить.
• Confidence (Уверенность) - демонстрирует, насколько вы уверены в оценках влияния и легкости реализации
• Ease (Легкость реализации) — это оценка того, сколько усилий и ресурсов требуется для реализации этой идеи.

— Дизайн эксперемента:
• Гипотеза:
Если мы изменим виджет регистации, то это позволит увеличить %CR в оплату через виджет с ?% на ?%, потому как процесс покупки станет интуитвно понятным для пользователя

• Что делаем: устанавливаем цель на покупку
– Контрольна версия: оставляем лендинг таким как есть и выкатываем предыдущую версию виджета (https://tube.biz/en/landing)
– Тестовая версия: создаем копию лендинга с новым виджетом (https://tube.biz/en/landing-new-widget)

• На каких пользователях тестируем:
Только на новых пользователях из g.ads

 Метрики:
%CR в оплату из виджета

• План действий:
– Если эксперемент положительный: масштабируем на всех пользователей
– Если эксперемент провальный:  проводим MVT тест где проверяем целесообразность виджета
– Если результат неизменный: откатываем к контрольной версии

— Настройка инструментов
• Создаем эксперемент (с типом редирект)
• Настраиваем варианты редиректов (новый и старый лэнд)
• Настраиваем цель тестирования (успешная оплата)

— Расчет теста
• Рассчитываем выборку тестирования (https://mindbox.ru/ab-test-calculator/)
• Определяем длительность тестирования (кол-во дней)
• Определяем уровень доверительной выборки (доверительный интервал p-value от 80% до 99%)

— Анализ реузльтатов
https://mindbox.ru/ab-test-calculator
Калькулятор №2