Перейти к содержимому

Атрибуция цепями Маркова — граф путей, который видит невидимое Last Click

DataGo строит атрибуцию цепями Маркова: граф реальных путей клиентов и Removal Effect — насколько упадёт конверсия, если убрать канал. Медийка получала 10% по Last Click — потому что редко стоит последней. Цепи Маркова показывают: без неё исчезают цепочки, приводящие к конверсии через другие каналы.

Как цепи Маркова определяют вес канала

Представьте: пользователь увидел медийный баннер, потом нашёл бренд в SEO, потом перешёл по Директу и купил. Last Click отдаёт 100% Директу. Но уберите медийный баннер из всех путей — часть пользователей вообще не доберётся до SEO, а значит, и до Директа. Марковская модель это видит — Last Click нет.

Для каждого канала модель задаёт вопрос: насколько упадёт суммарная вероятность конверсии, если убрать этот канал? Разница — Removal Effect. Нормируем по всем каналам — получаем атрибуцию.

Ключевое свойство: Цепи Маркова учитывают порядок касаний. Путь «Медийка → Директ → Conv» и путь «Директ → Медийка → Conv» — разные сценарии с разными вероятностями. Shapley value таким различием пренебрегает.

Пример: что происходит, когда убираем Медийку
Сценарий Конверсия Изменение
Все каналы активны 3,0% базово
Без Медийки 2,1% −30%
Без Email 2,6% −13%
Без Директа 1,8% −40%

Removal Effect Медийки — 30%, хотя Last Click даёт ей только 10%. Директ получает 40% RE и 38% Last Click — здесь обе модели согласны. Расхождение по Медийке — ценный сигнал для перераспределения бюджета.

Математический фундамент

2011–2016

Академический фундамент

Shao & Li (KDD 2011) ввели data-driven атрибуцию как противовес эвристикам. Anderl, Becker, von Wangenheim & Schumann (IJRM, 2016) применили граф-маркировские цепи к четырём промышленным датасетам и показали: Last Click систематически недооценивает медийную рекламу, PPC-каналы среднего funnel и email — и рекомендовали третий порядок Маркова как практический оптимум.

DataGo

Реализация на ClickHouse

DataGo строит матрицу переходов из витрины User Path — всех digital-сессий клиента. Граф включает Start, каналы, Conv и Null. Из матрицы вычисляется вероятность поглощения состоянием Conv методом итерации. Removal Effect считается на ClickHouse, результат добавляется как колонка атрибуции в витрину Sessions рядом с Last Click и Funnel-Based.

Removal Effect в действии: отключайте каналы — смотрите, что происходит

Три шага. Сначала посмотрите на граф переходов. Потом отключайте каналы и наблюдайте, как падает конверсия. В итоге — сравните атрибуцию Маркова с Last Click.

Removal Effect — интерактивный пример

Отключите любой канал — и увидите, сколько заказов он реально приносит. Не по Last Click, а по цепям Маркова.

Каналы — отключите любой
Заказов/мес
300
базово
CPO
7 333 ₽
стоимость заказа
Бюджет
2 200 000 ₽
в месяц

← Отключите любой канал слева, чтобы увидеть его реальный вклад. Начните с Медийки — результат удивит.

Цепи Маркова — интерактивный пример Removal Effect

Базовый результат: 300 заказов/мес, бюджет 2 200 000 ₽, CPO 7 333 ₽.

  • Яндекс.Директ: бюджет 800 000 ₽, Last Click 43%, цепи Маркова 33%, при отключении теряется 99 заказов.
  • РСЯ: бюджет 400 000 ₽, Last Click 20%, цепи Маркова 22%, при отключении теряется 65 заказов.
  • ВКонтакте: бюджет 150 000 ₽, Last Click 12%, цепи Маркова 13%, при отключении теряется 38 заказов.
  • Медийная реклама: бюджет 800 000 ₽, Last Click 8%, цепи Маркова 19%, при отключении теряется 56 заказов.
  • Email: бюджет 50 000 ₽, Last Click 17%, цепи Маркова 14%, при отключении теряется 42 заказов.

Ключевой инсайт: Медийная реклама получает 8% по Last Click, но 19% по цепям Маркова — в 2.3 раза выше, потому что запускает цепочки к конверсии через другие каналы.

Что показывает демо

Граф переходов — вероятности движения между каналами. Переключатели каналов — Removal Effect в реальном времени. Итоговый бар-чарт — сравнение с Last Click. Попробуйте отключить Медийку: конверсия упадёт сильнее, чем её доля по Last Click.

А что в продакшене

В реальной витрине Sessions — тысячи путей, 5–15 каналов, обновление по расписанию. DataGo строит матрицу переходов из всего User Path и возвращает Removal Effect как колонку атрибуции — рядом с Last Click, FBA и Shapley value.

Сравнение атрибуции цепями Маркова с другими моделями

Параметр Цепи Маркова Last Click Shapley Funnel-Based
Тип Data-Driven Правило Data-Driven Data-Driven
Вес определяется Removal Effect Позицией (последний) Маржинальным вкладом Сложностью шага
Учитывает порядок Да Нет Нет Да
Канальные синергии Да Нет Частично Нет
Учитывает воронку Нет Нет Нет Да
Минимум данных ~300 конв./мес Нет 5 000+ конв./мес Нет жёстких
Прозрачность Полная Полная Чёрный ящик (GA4) Полная
Офлайн-события Нет Нет Нет Да

Когда цепи Маркова дают максимум пользы

Подходит
  • Много каналов с неочевидной ролью

    Медийка, SEO и email запускают цепочки, которые конвертируются через Директ — Last Click отдаёт им 0%. Цепи Маркова показывают реальный структурный вклад.

  • E-commerce и сложные мультиканальные пути

    Пользователи проходят 5–10 касаний до покупки. Удаление любого канала меняет вероятность конверсии — это и измеряет Removal Effect.

  • Хотите понять канальные синергии

    Маркова улавливает: «Медийка → Директ → конверсия» — если убрать Медийку, исчезнут цепочки с Директом. FBA и Shapley этой зависимости не увидят.

  • Параллельная верификация другой Data-Driven модели

    Маркова и Shapley value вместе дают перекрёстную проверку: если обе модели согласны по каналу — решение уверенное. Если расходятся — сигнал глубже разобраться.

Не подходит
  • Менее 300 конверсий в месяц

    При малом числе путей матрица переходов нестабильна: Removal Effects «прыгают» от запуска к запуску. Используйте Linear или Time-decay и переходите на Маркова при росте объёма.

  • 1–3 канала в путях клиентов

    Когда 90% путей — один-два касания, граф вырождается. Removal Effect не несёт информации, которую Last Click не дал бы. Маркова раскрывается на развитых мультиканальных путях.

  • Нужна атрибуция офлайн-шагов воронки

    Марковская модель работает с digital-касаниями. Для офлайн-шагов (встреча, оплата в магазине) больше подходит Funnel-Based Attribution с CRM-событиями.

  • Нужно объяснить результат нетехническому стейкхолдеру

    Removal Effect требует понимания «вероятности поглощения». Для презентации CMO Last Click или FBA часто понятнее. Маркова — инструмент аналитика, не бизнес-правило.

Не уверены — ваш ли это случай? Обсудим и подберём подходящую модель атрибуции.

Посмотреть другие модели

Стоимость атрибуции цепями Маркова

от 25 000 ₽/мес

за data-driven модель атрибуции, без НДС

Финальная стоимость зависит от объёма данных и числа каналов. Рекомендуем разворачивать цепи Маркова параллельно с Funnel-Based Attribution или Shapley value в одной витрине Sessions — для сравнения и перекрёстной проверки решений.

Частые вопросы

Пять вопросов про атрибуцию цепями Маркова. Если вашего нет — обсудим на звонке.

Оба метода Data-Driven, но у них разный объект измерения.

Shapley value считает, на сколько в среднем вырастают конверсии, когда канал добавляется в любую возможную коалицию. Порядок касаний при этом игнорируется — модель меняет местами каналы в путях.

Цепи Маркова строят граф последовательности касаний и считают: насколько упадёт вероятность конверсии, если этого канала нет вообще. Порядок путей сохраняется — «Медийка → Директ → Conv» и «Директ → Медийка → Conv» обрабатываются отдельно.

Практический вывод: Shapley видит средний вклад канала вне зависимости от положения в пути; Маркова видит структурную роль канала в реальных последовательностях. Используем обе параллельно — расхождение между ними сигнализирует о sequence-зависимых эффектах.

Да — и это ключевое отличие цепей Маркова от большинства других моделей атрибуции.

Модель строит граф, где каждый канал — это состояние, а переходы между ними — вероятности, извлечённые из реальных путей пользователей. Последовательность важна: путь «Медийка → SEO → Директ → покупка» и путь «Директ → SEO → Медийка → покупка» дают разные вероятности переходов и, следовательно, разный вклад каждого канала.

Для сравнения: Last Click смотрит только на последнее касание и игнорирует весь путь. Shapley value учитывает наличие канала в путях, но меняет их порядок при расчётах. Цепи Маркова сохраняют реальную последовательность касаний — граф не переставляет шаги.

Практически это означает: если Медийка всегда первая в цепочках, которые заканчиваются конверсией, Маркова увидит, что без неё эти цепочки не запустились бы — и отдаст ей соответствующий вес.

Removal Effect (RE) канала — это относительное падение вероятности конверсии при его удалении из модели.

Формула: RE(i) = 1 − (conv_rate_without_i / conv_rate_baseline)

Если базовая конверсия 3%, а без Медийки стала 2,1% — RE(Медийка) = 1 − 2,1/3,0 = 30%.

Итоговая доля канала = RE(i) / Σ RE(j) — нормированный Removal Effect по всем каналам.

Математическая основа — поглощающие цепи Маркова. Статес-граф включает Start, каждый канал, Conv (поглощающее) и Null (поглощающее). Из матрицы переходов вычисляется фундаментальная матрица N = (I − Q)⁻¹, из которой получают вероятность поглощения состоянием Conv. При удалении канала его строка и столбец исключаются, вероятности перераспределяются в Null.

Нет академически заверенного порога — но практика называет два ориентира:

- 300+ конверсий в месяц — минимум для стабильной матрицы переходов первого порядка. - Каждый переход канал → канал должен встретиться в 50+ путях, иначе вероятность нестабильна.

При меньшем объёме модель деградирует к Linear — технически работает, но без информационного преимущества. Рекомендуем стартовать с Linear и переходить на Маркова при выходе на устойчивые объёмы.

Первый порядок означает: вероятность следующего шага зависит только от текущего канала, а не от всей истории. Это упрощение реального поведения — в жизни «SEO после Медийки» и «SEO напрямую из Start» могут вести себя по-разному.

Академические исследования (Anderl et al., 2016) показывают, что 3-й порядок обычно даёт лучшие результаты, чем 1-й — но требует экспоненциально больше данных. При 5 каналах модель 3-го порядка имеет 5³ = 125 возможных состояний против 5 у 1-го порядка.

Практика DataGo: используем 1-й порядок как устойчивую базу. При достаточном объёме данных предлагаем тест 2-го порядка. Разница на реальных наборах данных часто меньше ожидаемой.

Да — это рекомендованная практика DataGo. Типичный набор атрибуций на одном дашборде:

- Last Non-Direct Click (LNDC) — для сходимости с рекламными кабинетами (Директ, ВКонтакте) - Цепи Маркова — data-driven, учитывает структуру путей - Funnel-Based Attribution — data-driven, учитывает сложность шагов воронки

Если Маркова и FBA согласны по каналу — решение по бюджету уверенное. Если расходятся — исследуем: скорее всего, канал имеет sequence-зависимый эффект, который одна из моделей не улавливает.

Развернём цепи Маркова в вашей витрине Sessions

Расскажите про ваши каналы, объём конверсий и текущую модель атрибуции. Оценим, как настроить Removal Effect под ваш кейс, и предложим, какие модели запустить параллельно для перекрёстной проверки.

Если сообщите — успеем подготовить первичное предложение к созвону

Текущие основные задачи