Трансформируем ваши данные в прибыль

Пн — Пт: с 10:00 до 19:00

ГлавнаяБлогКачество данных в аналитике: 10 причин, почему цифры не сходятся, и как это исправить

Качество данных в аналитике: 10 причин, почему цифры не сходятся, и как это исправить

7 минут(ы)

Данные лежат в основе маркетинговых решений. На них опираются при распределении бюджетов, оценке каналов и планировании стратегии. Однако в разных отчетах одни и те же показатели могут расходиться. Например, рекламный кабинет показывает 200 конверсий, Аналитические системы — 170, CRM — 140 оплаченных заказов, а сквозная аналитика теряет половину из них. Не многим лучше случай, когда данные аналитических систем собираются в полном объеме, но дублируются в каких-то случаях.

Когда качество данных под вопросом, последствия ощутимы. Руководитель не понимает, какому источнику верить. Маркетолог не может обосновать эффективность канала. Бюджеты перераспределяются на основе искаженной картины, а ошибки накапливаются от отчета к отчету. Поиск причин растягивается на длительное время, а бизнес теряет большие деньги.

В этой статье мы разберем 10 типичных причин расхождений и дадим чек-лист для регулярной проверки.

  • null
    Дорогие читатели и пользователи платформы StreamMyData! Хотим пригласить вас в наш телеграм канал, в котором публикуются важные новости, обновления, статьи и кейсы.

Не хотите думать о качестве данных?

StreamMyData создаст сквозную аналитику для вас.

Почему данные вообще расходятся

Каждая система в маркетинговом стеке решает свою задачу и поэтому собирает данные по-своему. Директ работает с рекламным трафиком до момента клика: показы, клики, расход бюджета. Конверсии в его отчетах тоже есть, но считает он их не сам. Он берет данные о достижении целей из привязанного счетчика Метрики и накладывает на них собственную модель атрибуции. Метрика, в свою очередь, собирает данные о поведении пользователей уже на сайте: визиты, просмотры, достижения целей. CRM ведет учет сделок и обновляет их статусы вручную или через интеграции. Бухгалтерия фиксирует фактические поступления денег.

У каждой системы свой момент регистрации события, свои правила группировки и свои определения метрик. Директ припишет конверсию к дате клика. Метрика — к дате визита. CRM — к дате создания сделки. Уже этого достаточно, чтобы цифры за один и тот же день не совпали.

К этому добавляются технические факторы. Счетчик Метрики не сработает, если пользователь заблокировал скрипты. Интеграция между формой и CRM может дать сбой. Менеджер может забыть обновить статус сделки. Каждый такой фактор вносит свою погрешность, и в сумме они формируют ту самую разницу между отчетами.

Небольшие расхождения между системами — ситуация нормальная. В разумных пределах (5–10%) они допустимы. Проблемы начинаются, когда разница выходит за эти рамки, а команда не может объяснить ее природу. Именно здесь на первый план выходит контроль качества данных.

Рассмотрим, что чаще всего приводит к расхождениям.

10 причин, из-за которых страдает качество данных

1. Разные часовые пояса

Яндекс.Метрика по умолчанию работает по часовому поясу, указанному в настройках счетчика, чаще всего это Москва. Но CRM может вести учет в UTC, а сторонние рекламные системы — в своих таймзонах. В результате один и тот же заказ, оформленный ближе к полуночи, попадает в разные сутки — в зависимости от системы.

На первый взгляд мелочь. Но при посуточной сверке расхождение будет стабильным и необъяснимым — до тех пор, пока кто-нибудь не заглянет в настройки.

Что делать: установить единый часовой пояс во всех системах, где это возможно. Там, где нельзя, — зафиксировать разницу в документации.

2. Разные модели атрибуции

Клиент увидел рекламу в Директе, через неделю вернулся из органического поиска и оформил заказ. Директ отнесет атрибуцию на свой счет, потому что использует собственную модель атрибуции с окном до 21 дня. Метрика по умолчанию отдаст конверсию последнему значимому источнику — то есть органике. CRM, вероятнее всего, запомнит первый источник.

Поэтому у одного заказа может оказаться три разных источника.

Что делать: выбрать одну модель атрибуции для принятия управленческих решений. Остальные модели использовать для углубленного анализа, но не для сравнения между системами.

3. Отмененные и незавершенные заказы

Веб-аналитика фиксирует событие в момент оформления заказа. Дальнейшая судьба этого заказа ей неизвестна. Если клиент отменил покупку, не выкупил посылку или оформил возврат, Метрика об этом не узнает. При этом в CRM статус обновится.

В итоге аналитика показывает 120 заказов, CRM — 95 выполненных. Та же история с выручкой: суммы в Метрике и в учетной системе будут различаться.

Что делать: разделять в отчетах оформленные и выполненные заказы. Сверку проводить по финальным статусам в CRM, а не по событиям на сайте.

4. Некорректные настройки аналитической системы

Некорректные настройки аналитической системы, пожалуй, самая частая причина, по которой данные Метрики не совпадают с реальными продажами. Речь здесь идет не об одной конкретной ошибке, а сразу о нескольких типичных технических проблемах.

Счетчик Метрики установлен не на всех страницах сайта и часть визитов просто теряется. Цели настроены технически неверно или давно устарели: например, форму заказа переделали, а цель по-прежнему привязана к старому элементу. События электронной коммерции передаются с неверной структурой данных: одна лишняя пара скобок в коде, и данные, даже при сработавшем событии, в отчеты не попадут.

Отдельная категория проблем — неучтенные сценарии. Событие “Покупка” срабатывает при обычном оформлении заказа, но не отслеживается при покупке “в один клик”. Кроссдоменное отслеживание не настроено и при переходе пользователя между поддоменами сессия рвётся. Та же история с банковскими шлюзами: клиент уходит на страницу оплаты, возвращается и Метрика считает это новым визитом с потерей источника.

Наконец, нередко сама интеграция с CRM настроена так, что одни и те же данные поступают повторно, порождая дубли в статистике.

Что делать: провести технический аудит счетчика: проверить установку на всех страницах, корректность целей и событий, структуру данных электронной коммерции. Пройти все сценарии покупки и убедиться, что каждый из них отслеживается. Проверить кроссдоменные переходы и поведение сессий при уходе на внешние платежные страницы.

5. Дубликаты и задвоения

Клиент отправил заявку и обновил страницу, в результате в CRM появились две записи. Менеджер завел сделку вручную, а через час импорт подтянул ту же заявку из формы. Таким образом в данных образуются дубликаты.

Каждый отдельный случай незначителен. Однако за месяц дубликаты могут раздуть воронку на 10–15% и исказить стоимость лида.

Что делать: настроить правила дедупликации в CRM. Регулярно проверять аномальные всплески в количестве лидов.

6. Битые и потерянные UTM-метки

Редирект обрезал параметры URL. Разработчик обновил ссылку на лендинге и забыл про UTM. Менеджер отправил клиенту ссылку из мессенджера без меток. Результат один — трафик падает в “(not set)” или “Прямые заходы”, а разметка кампаний теряет смысл.

Качество данных по источникам и каналам напрямую зависит от целостности UTM-меток.

Что делать: использовать шаблонизатор для генерации UTM. Перед запуском кампании проверять каждую ссылку вручную или автоматизированно.

7. Блокировщики рекламы и отказ от cookies

Часть пользователей просто не попадает в системы аналитики. AdBlock блокирует скрипты счетчиков, а часть посетителей отклоняет cookies. По разным оценкам, это от 15 до 30% трафика.

Между тем рекламная площадка показ и клик зафиксировала. Отсюда нередко возникают расхождения между кликами в Директе и визитами в Метрике.

Что делать: учитывать эту слепую зону при сравнении данных. Для более точной картины необходимо сопоставлять серверные логи с клиентской аналитикой.

8. Offline-конверсии и телефонные обращения

Клиент кликнул по рекламе, изучил сайт, а затем позвонил и оформил заказ по телефону. Или вовсе пришел в офлайн-магазин. Для Метрики этот клиент — визит без конверсии. Для Директа — клик без результата.

Если не возвращать данные об офлайн-продажах в рекламные системы, картина эффективности каналов останется неполной.

Что делать: настроить передачу offline-конверсий в Директ. Подключить коллтрекинг для учета телефонных обращений.

9. Задержки обработки и пересчет показателей

Яндекс.Директ и Метрика пересчитывают показатели в течение нескольких дней после даты события. Конверсия, которая произошла в понедельник, может появиться в отчете Директа только к среде, потому что система относит ее к дате клика, а не дате самого действия. Цифры за прошлую неделю вполне могут измениться задним числом.

Вдобавок CRM обновляет статусы сделок по мере работы менеджеров. Сводный отчет, собранный утром в понедельник, через пару дней покажет другие значения.

Что делать: не принимать решения по свежим данным. Закладывать 3 — 5 дней на стабилизацию показателей. И главное регулярно обновлять бэкдату в отчетах, чтобы пересчитанные значения не терялись.

10. Сбои интеграций, ошибки ввода и забытые настройки

API отвалился. Webhook не дошёл. Менеджер ввел сумму с лишним нулем. Импорт CSV сбил кодировку — и половина строк не загрузилась. Каждый такой случай по отдельности — мелочь. Но за квартал они накапливаются и вносят системную погрешность.

Сюда же относятся забытые фильтры и сегменты в отчетах. Кто-то год назад сохранил отчёт с фильтром по региону или типу устройства — и теперь команда сравнивает урезанную выборку с полными данными из CRM. Расхождение очевидно, а причина скрыта в настройках, в которые давно никто не заглядывал.

Особенно опасны тихие сбои: интеграция перестала работать, фильтр режет данные, отчет строится по устаревшему сегменту — но никто не замечает, потому что нет ни алертов, ни регулярных проверок.

Что делать: настроить мониторинг интеграций с уведомлениями при сбоях. Ввести валидацию на этапе ввода: ограничение диапазонов, проверка форматов, контроль обязательных полей. Раз в квартал проводить ревизию сохранённых отчётов, фильтров и сегментов — и всегда держать под рукой нефильтрованный отчёт как эталон для сверки.

Читайте нашу статью о том, как связать оффлайн-события с источником в интернете по ссылке.

Чек-лист: как контролировать качество данных

Ниже представлен набор проверок, сгруппированный по периодичности. Его можно адаптировать под специфику бизнеса, но базовую структуру стоит сохранить.

Еженедельно

Сверка лидов и заказов. Выгрузите количество заказов из Метрики и из CRM за одну и ту же неделю. Сравните цифры. Допустимое расхождение 5 — 10%. Если разница больше ищите причину: пропущенные события, дубликаты, сбой интеграции. Важно использовать один и тот же часовой пояс и одинаковый период вплоть до минут, если данные выгружаются автоматически.

Доля неопознанного трафика. Откройте отчет по источникам в Метрике и посмотрите, какую долю занимают «Прямые заходы» и переходы без определенного источника. Если их процент резко вырос по сравнению с прошлой неделей скорее всего, что-то произошло с UTM-разметкой или редиректами. Проверьте ссылки в последних запущенных кампаниях.

Контроль целей и событий. Убедитесь, что ключевые цели в Метрике (отправка формы, добавление в корзину, оформление заказа) продолжают фиксироваться. Иногда обновление сайта или смена шаблона ломает счетчики, и об этом узнают только через неделю — две, когда данные уже потеряны.

Контроль целей и событий. Убедитесь, что ключевые цели в Метрике (отправка формы, добавление в корзину, оформление заказа) продолжают фиксироваться. Иногда обновление сайта или смена шаблона ломает счетчики, и об этом узнают только через неделю — две, когда данные уже потеряны.

Ежемесячно

Сверка выручки. Сопоставьте три источника: выручку из Метрики (по цели «оформление заказа» с параметром дохода), из CRM и из бухгалтерии. Метрика покажет сумму оформленных заказов. CRM — сумму выполненных. Бухгалтерия — фактические поступления. Все три цифры будут отличаться, но у каждой разницы должно быть объяснение: отмены, возвраты, задержки оплаты.

Аудит UTM-меток. Пройдитесь по всем активным кампаниям в Директе и других рекламных каналах. Проверьте, что ссылки содержат корректные метки. Особое внимание уделите ссылкам, которые проходят через редиректы, сокращатели URL и мессенджеры.

Проверка на дубликаты в CRM. Выгрузите лиды за месяц и проверьте на совпадения по email, телефону или другим уникальным полям. Большинство CRM-систем позволяют сделать это встроенными средствами или через простой отчет.

Обновление бэкдаты. Выгрузите показатели из Метрики и Директа за прошлый месяц заново с учетом пересчета, который обе системы проводят в течение нескольких дней. Сравните с тем, что было в отчете ранее. Если разница существенна следует обновить данные в сводном дашборде.

Валидация данных электронной коммерции. Проверьте, что события e-commerce передаются с корректной структурой: суммы, количество товаров, идентификаторы. Даже мелкая ошибка в формате данных может привести к тому, что события срабатывают, но в отчеты не попадают.

Ежеквартально

Технический аудит счетчика. Проверьте, что код Метрики установлен на всех страницах сайта, включая страницы благодарности, лендинги и поддомены. Убедитесь, что кроссдоменное отслеживание настроено корректно, а переход на внешний платежный шлюз не разрывает сессию пользователя.

Аудит фильтров и сегментов. Откройте настройки каждого сохраненного отчета и сегмента в Метрике. Проверьте, какие условия активны, нет ли устаревших фильтров. Удалите или скорректируйте те, что потеряли актуальность.

Ревизия интеграций. Проверьте, что все связки между системами работают: данные из форм попадают в CRM, заказы из CRM уходят в Директ для offline-конверсий, вебхуки доходят до получателей. Самый простой способ — оформить тестовый заказ и проследить его путь по всей цепочке.

Обновление глоссария метрик. Соберите определения ключевых метрик, что считаем заказом, лидом, выручкой, конверсией. Убедитесь, что все участники процесса понимают эти термины одинаково. Если глоссария еще нет самое время его создать.

Сквозная тестовая конверсия. Пройдите путь клиента от клика по рекламе в Директе до оформления заказа. Проверьте, что каждая система зафиксировала нужное событие: Метрика — визит и достижение цели, CRM — лид или сделку, Директ — конверсию.

Мы позаботимся о качестве ваших данных

ETL-коннекторы и сквозная аналитика от StreamMyData

Заключение

Большинство ошибок в данных типовые и повторяющиеся: разные таймзоны, забытые фильтры, битые UTM, задержки пересчета. Для их выявления не нужна техническая экспертиза. Достаточно регулярно проходить по чек-листу, чтобы вовремя ловить сбои и значительно повысить качество данных.

Начните с еженедельной сверки показателей и контроля UTM-разметки. Даже два этих шага заметно сократят расхождения и вернут команде доверие к отчетам.