Что такое A/B эксперимент плюс почему этот метод необходимо
Что такое A/B эксперимент плюс почему этот метод необходимо
сплит эксперимент являет из себя способ сравнения двух либо дополнительных решений раздела, интерфейса, текста, CTA-элемента, формы, рассылки, рекламного креатива или прочего веб блока. Его задача заключается в необходимости этом, для того чтобы понять, какой вариант лучше работает в реальном использовании. Взамен предположений плюс оценочных мнений используется тест среди реальной аудитории, при которой первая доля получает формат A, и другая — версию B.
Такой метод позволяет выбирать решения на основе информации, а без опоры на индивидуальных предпочтений а также случайных наблюдений. В обзорных материалах, в том числе 1вин, часто указывается, что A/B эксперимент особенно полезно там, когда малые изменения могут влиять на действия пользователей: нажатия, оформления профилей, заполнение форм, глубину изучения, лояльность, покупки, подписки а также прочие заданные шаги. Подход помогает проверить, действительно ли правка улучшает 1win показатель.
Как функционирует А/Б проверка
Логика А/Б проверки достаточно прост. Сначала берется элемент, какой требуется оценить. Таким элементом может быть название, оттенок CTA-элемента, последовательность секций, формулировка сообщения, построение анкеты, изображение, цена, тип предложения а также позиция важного действия. Далее готовятся минимум пары версии: исходный плюс измененный. Вслед за этого поток пользователей делится между ними на основе предварительно установленным параметрам.
Контрольная группа пользователей сохраняет возможность получать первоначальную страницу, а тестовая получает обновленную. Платформа собирает данные касательно действиях любой группы а также сопоставляет метрики. Когда решение B демонстрирует более высокий результат при нужном объеме сведений, его получается запускать. Если прироста не видно либо новая версия функционирует слабее, изменение не принимается. Как раз в данной логике как раз проявляется практическая польза эксперимента: он позволяет оценивать гипотезы до окончательного 1вин релиза.
Для чего нужно сплит эксперимент
сплит эксперимент нужно ради снижения неопределенности. Внутри онлайн продуктах даже небольшая правка имеет шанс воздействовать на понимание интерфейса. Одиночный заголовок может быть доступнее альтернативного, короткая заявка имеет шанс проходиться активнее длинной, и намного более заметная кнопка действия способна усилить объем переходов. При отсутствии тестирования такие результаты обычно остаются гипотезами.
Эксперимент позволяет оптимизировать платформу постепенно. Без необходимости крупной переработки целого проекта или сервиса получается оценивать точечные объекты а также фиксировать практический показатель. Это уменьшает угрозу ошибочных решений, сокращает расход время и средства и помогает собирать данные про действиях пользователей. С течением накоплением тестов проект 1 win получает не совокупность суждений, но модель подтвержденных действий.
Какие объекты получается сравнивать
Тестировать можно практически любой блок, что влияет по части поведение пользователя. Чаще всего оценивают названия, разделы, призывы на действию, тексты CTA-элементов, поля создания профиля, позицию блоков, картинки, страницы товаров, очередность действий, фильтры, меню, промоблоки, подсказки, письма и рекламные креативы. Необходимо, чтобы отобранный объект оставался объединен с заданной метрикой.
Если ориентир состоит в процессе увеличении заполненных обращений, разумно тестировать форму, текст около формы, количество строк а также видимость кнопки. Когда нужно усилить объем просмотра, стоит оценивать переходы, блоки предложений, внутренние линки а также логику материала. Насколько яснее соотношение 1win в паре изменением и метрикой, настолько ценнее эффект проверки.
Предположение как база эксперимента
Каждый хороший A/B тест начинается на основе проверяемой идеи. Гипотеза объясняет, какое именно изменение рассматривается, из-за чего это изменение может сказаться в отношении результат и какой именно результат может сдвинуться. Например, допустимо предположить, если упрощение заявки оформления аккаунта сократит количество незавершенных действий, потому что человеку нужно будет меньший объем минут ради завершения действия.
Качественная формулировка не обязана должна казаться очень размытой. Идея типа «сделать интерфейс качественнее» не помогает дает возможность оценить результат. Более точный пример: «при условии что обновить объемный надпись кнопки с помощью краткий и понятный, объем нажатий вырастет, потому ведь действие окажется очевиднее». Такая идея непосредственно 1вин определяет объект теста, основание плюс метрику.
Базовая и экспериментальная аудитории
Внутри А/Б эксперименте контрольная аудитория видит первоначальный формат, и тестовая — обновленный. Это разделение необходимо для честного анализа. Если без контроля поменять страницу затем оценить результаты до изменения а также после изменения, результат способен исказиться вследствие сезонных факторов, рекламной нагрузки, смены потоков пользователей, новостей, технических сбоев или прочих внешних факторов.
Параллельный вывод разных решений снижает роль случайных обстоятельств. Контрольная и тестовая аудитории оказываются внутри близкой среде: один плюс тот идентичный период, схожие же источники пользователей, схожие девайсы плюс единый окружение. Следовательно отличие по результатах с 1 win повышенной вероятностью объясняется в первую очередь с корректировкой, и не не только с посторонними случайными обстоятельствами.
Какого типа показатели задействуются в А/Б экспериментах
Показатель — представляет собой показатель, по которого оценивается итог теста. Подбор метрики строится на основе цели проверки. Ради лендинга с формой важны отправки заявок, для интернет-магазина — добавления к заказ плюс транзакции, для медиа — длина просмотра плюс период просмотра, ради сервиса — создания аккаунтов, запуски, удержание и повторные 1win события.
Необходимо разграничивать главную и дополнительные показатели. Главная демонстрирует, ради чего запускается тест. Вспомогательные дают возможность выявить вторичные результаты. В частности, правка CTA может повысить переходы, однако уменьшить ценность последующих действий. Поэтому разумно анализировать не только только на начальный клик, но и на дальнейшее развитие: окончание заявки, возвраты, уходы, проблемы и общую значимость события.
Математическая значимость
Статистическая существенность отражает, насколько вероятно, что наблюдаемая разница среди версиями не считается оказывается случайным колебанием. Когда конкретный решение незначительно обходит второй после пары малого числа посещений, такой результат все еще не означает победу. При малом массиве данных результат может быстро измениться, когда 1вин выборка окажется шире.
Для достоверного итога необходимо достаточное количество данных. Чем ниже предполагаемая разница среди вариантами, тем самым больше наблюдений нужно накопить. Если изменение обязано улучшить показатель лишь примерно на несколько процентов, тесту нужно будет значительно больше длительности и пользователей. Статистическая значимость позволяет не формировать поспешные решения с опорой на результатах временных изменений.
Размер наблюдений а также продолжительность проверки
Размер аудитории влияет в отношении качество вывода. Если эксперимент получает чрезмерно небольшое число посетителей, заключения способны оказаться сомнительными. К примеру, пять новых кликов внутри первой группе могут выглядеть как рост, при этом в условиях крупном масштабе будут обычной случайностью. Следовательно до момента старта разумно оценивать, какое количество посетителей 1 win или событий нужно ради оценки предположения.
Срок проверки дополнительно получает значение. Чрезмерно сжатый тест имеет шанс не показывать отличия в паре обычными и нерабочими днями, рабочей а также поздней активностью, разными потоками трафика. Как правило эксперимент обязан захватывать завершенный период действий аудитории. Вместе с этом условии слишком затянутый тест также неподходящ, в случае если сторонние условия могут заметно поменяться.
Зачем опасно корректировать проверку во время проведения
Распространенная в числе типичных проблем — делать правки внутрь проверку вслед за запуска. В случае если в процессе эксперимента поменять сообщение, аудиторию, дизайн, условия вывода а также метрику, показатели смешаются. После этого будет непросто определить, что точно воздействовало в отношении итог. Проверка снизит чистоту, и выводы окажутся сомнительными 1win.
До момента старта нужно установить гипотезу, варианты, метрики, деление выборки и критерии завершения. После старта лучше не нужно менять условия без серьезной основания. Если выявлена неточность внутри конфигурации либо служебный дефект, лучше прервать тест, починить сбой и начать новый проверку, вместо того чтобы пробовать интерпретировать смешанные показатели.
Параллельное тестирование разных изменений
Иногда возникает идея оценить одновременно группу изменений: новый заголовок, иную кнопку, сокращенную анкету и измененный последовательность блоков. Такой подход способен показать итоговый результат, однако не раскроет, какого типа именно фактор сказался в отношении результат. Когда обновленная страница победила, сохранится непонятно, какая правка помогло лучше прочего.
С целью точной проверки чаще всего корректируют единственный значимый объект в 1вин одну проверку. Когда требуется проверить несколько вариаций, применяется многофакторное тестирование. Оно труднее, нуждается повышенного объема посещений а также внимательной интерпретации. Ради многих целей А/Б тест с одной конкретной точной проверкой дает более чистый и ценный эффект.
Сценарии сплит экспериментов на уровне UI
Внутри интерфейсах А/Б проверка часто задействуется для улучшения доступности действий. К примеру, получается проверить пару версии анкеты: длинную с количеством полей а также упрощенную с небольшим малым числом данных. В случае если упрощенная анкета усиливает число успешных регистраций без снижения качества заявок, ее получается считать гораздо более удачной.
Следующий сценарий — проверка текста кнопки. Общая надпись имеет шанс быть гораздо менее ясной, по сравнению с точное описание результата. Также тестируют позицию элементов действия, порядок контентных разделов, оформление 1 win пояснений, присутствие шкалы выполнения, способ отображения сбоев плюс количество действий на протяжении сценарии. Отдельный такой элемент сказывается по части то самое, как удобно выполнить заданное действие.
А/Б проверка на уровне материалах
Внутри контенте эксперимент помогает выяснить, какие headline-блоки, описания, построения а также типы лучше сохраняют интерес. Допустимо проверять несколько первые абзацы, размер текста, последовательность аргументов, наличие списков, дизайн карточек, описание выгод а также формат раскрытия трудной задачи. При этом сценарии важно оценивать не только нажатия, но также последующее действие.
Headline может повысить объем кликов, однако в случае если материал не сможет соответствует ожиданиям, вырастет часть уходов. Из-за этого текстовые тесты должны анализировать ценность контакта: длительность просмотра, скролл, перемещения внутри сайта, повторные визиты а также совершение заданных событий. Качественный эффект — это не просто исключительно привлечение интереса, а соответствие интереса и материала.
A/B эксперимент на уровне почтовых рассылках
В email-кампаниях нередко проверяют заголовки рассылок, имя автора, стартовые предложения, период отправки, длину email, позицию CTA-элементов и тексты предложений. Одна часть подписчиков открывает контрольную версию email, второй сегмент — другую. Затем этим сопоставляются открытия, нажатия, unsubscribes, негативные сигналы плюс дальнейшие действия на ресурсе.
Необходимо не стоит останавливаться метрикой open rate. Тема письма имеет шанс стать заметной а также захватывать внимание, при этом когда она не будет отвечает содержанию, переходы плюс лояльность имеют шанс ослабнуть. Следовательно качественный тест рассылки измеряет цельную последовательность: просмотр, клик, действия после нажатия и ответ подписчиков по отношению к письмо.