Что значит яндекс метрика
Что значит яндекс метрика
Поэтапное знакомство с понятиями веб-аналитики даст вам понимание, что означают цифры в отчётах Метрики.
В этом уроке мы рассмотрим три важных базовых термина: просмотр, визит и посетитель.
Каждый раз, когда на одну из страниц сайта с подключённой Метрикой заходит посетитель, серверы Метрики получают информацию об этом событии — оно называется просмотром. Несколько просмотров, совершённых одним пользователем, Метрика объединяет в один визит. Именно визиты являются основными данными для построения отчётов в Метрике.
Визит начинается с перехода на сайт из какого-либо внешнего источника. Это может быть ссылка на стороннем сайте, рекламное объявление, поисковая система или социальная сеть. Пользователи также могут попадать на ваш сайт, открыв закладку или напечатав URL в адресной строке браузера — такие переходы называются прямыми.
Визит заканчивается, когда в течение определённого времени от посетителя не поступает новых событий — по умолчанию это 30 минут. Если в течение 30 минут от последнего события тот же пользователь снова перейдет на сайт из внешнего источника, Метрика не будет считать такое посещение новым визитом — все новые просмотры страниц будут добавлены к предыдущему визиту.
Пример
Если пользователь перешёл на ваш сайт из поиска, просматривал одну страницу 25 минут, затем перешёл на другую, а потом сразу ушел и через 20 минут вернулся на сайт по ссылке из социальной сети, все эти просмотры будут объединены в один визит продолжительностью 45 минут с источником «переходы из поисковых систем».
Визиты из рекламного источника учитываются иначе. При каждом новом переходе по рекламе — независимо от того, сколько времени прошло от предыдущей активности этого посетителя на вашем сайте — Метрика всегда будет фиксировать новый визит.
Пример
Если посетитель пришёл из поисковой системы, а затем в пределах 30 минут (то есть до завершения визита) повторно перешёл на сайт по рекламе, в отчётах появятся два визита. В первый будут входить все просмотры от перехода из поисковой системы и до захода по рекламе. А во второй визит войдут все просмотры начиная с перехода по рекламе и до завершения визита, то есть до истечения 30 минут с момента последнего взаимодействия с сайтом.
При этом оба визита будут относиться к одному и тому же уникальному посетителю.
В каждом обратившемся к вашему сайту браузере сохраняется уникальный идентификатор — файл cookies. По этому файлу Метрика узнает этого посетителя и отличает одного посетителя от другого. Важно понимать, что уникальный идентификатор назначается именно браузеру. Это значит, если один и тот же пользователь будет заходить на сайт из разных браузеров — неважно, установленных на одном и том же или на разных компьютерах, мобильных телефонах или планшетах, — Метрика будет регистрировать нового посетителя для каждого нового браузера.
О посетителе и визитах Метрика запоминает общую информацию. При этом информация о визитах хранится как бы в привязке к пользователю, поэтому Метрика может показывать первый визит, его источник, последний визит, общее количество визитов и их периодичность для каждого посетителя.
Так вы узнаете, как пользователи изначально попадают на ваш сайт, часто ли они возвращаются, оценить, насколько эффективны разные источники трафика, и сделать другие выводы. Например, если заметная часть посетителей переходит на ваш сайт напрямую, значит, у вас достаточно лояльная аудитория — пользователи помнят адрес вашего сайта или открывают его из закладок.
Вопросы
Посетитель на ноутбуке нашёл ваш сайт в поисковой системе, зашёл на него и провёл на нём 2 часа, регулярно переходя с одной страницы на другую. Затем он отошёл на 40 минут, после чего продолжил просмотр. Затем, выключив ноутбук, сразу же продолжил просмотр с планшета, введя на нём адрес сайта вручную. Через 20 минут он сделал новый поисковый запрос, в результатах увидел заинтересовавшее его рекламное объявление Яндекс.Директа и, перейдя по нему, заново попал на ваш сайт. Увидев, что это тот же сайт, посетитель завершил просмотр.
Что такое Яндекс.Метрика и как с ней работать
Яндекс.Метрика помогает отслеживать посещаемость страниц и показывает, какие товары и услуги востребованы, какая информация интересует целевую аудиторию. Кроме прочих функций, Яндекс.Метрика отслеживает с каких социальных сетей и партнерских сайтов приходит больше пользователей: это позволяет понять, куда лучше вложить рекламные средства. Сервис тесно связан с другими продуктами Яндекса: Яндекс.Директом и Яндекс.Маркетом, что увеличивает его потенциал и повышает точность статистических данных.
Что такое Яндекс Метрика
Яндекс Метрика — это сервис, который помогает анализировать статистику посещений онлайн-ресурсов. Установленный в исходном коде счётчик собирает данные о посетителях и их взаимодействии с сайтом, создавая из полученной информации визуальное представление в личном кабинете веб-мастера. В результате вы получаете наглядные таблицы, схемы и графики, в которых отображается максимум возможной информации, полезной для анализа целевой аудитории и пользователей в целом.
Зачем нужна Яндекс Метрика
Когда у вас нет возможности установить физический контакт с потенциальными клиентами и потребителями контента, остаётся «идти по приборам», применяя специальные средства сбора данных. Если интерактив невозможен или затруднителен, решением становится фоновый анализ данных о посетителях сайта.
Яндекс Метрика предоставляет ценную информацию о посетителях сайта, с помощью которой можно делать выводы об эффективности работы текущих процессов и о необходимых улучшениях.
Преимущества Яндекс Метрики
Сервис предоставляет широкий спектр информации, которую можно настроить индивидуально. Регулировка целей расширяет функционал сервиса и позволяет получать отчеты:
По сравнению с другими сервисами, Яндекс.Метрику настроить проще, но одно из главных преимуществ — она бесплатная.
Что можно смотреть в Яндекс Метрике
Потенциал Метрики зависит от формата вебплощадки. Так, к информационному сайту, созданному с целью размещения на нем рекламы, можно подключить:
К интернет-магазинам рекомендуется дополнительно подключать статистику электронной коммерции, которая показывает количество просмотров и продаж.
Для сайта-визитки, назначение которого — информировать пользователя о существовании компании, сервис предлагает присоединить инструмент статистики. С его помощью можно будет отслеживать количество переходов и наиболее интересные пользователям страницы.
Таким образом, Яндекс. Метрика показывает эффективность контента и помогает принять решения по дальнейшему развитию сайта.
Как зарегистрироваться в Яндекс Метрике
Чтобы подключить Метрику к своему сайту, необходимо создать почтовый ящик в Яндексе, если его еще нет.
После регистрации или авторизации войдите в аккаунт Яндекс.Метрики и щелкните по кнопке «Создать счетчик».
Как создать счетчик Яндекс.Метрики
Регистрируя личный кабинет в Яндекс Метрике, вы начинаете работу с того, что создаёте счётчик. Система выдаёт особый идентификатор, используя который вы сможете настроить сопряжение своего сайта и аналитической платформы.
Прежде всего, код, содержащий идентификатор внутри, необходимо установить в исходный код сайта.
После установки в личном кабинете на странице Мои счётчики появится ссылка на дашборд и статус счётчика. Проверять его состояние можно через несколько минут — информация начинает собираться моментально. Индикатор слева, окрашенный в зелёный цвет, свидетельствует о том, что установка прошла успешно и данные собираются.
Установка счетчика добавлением в HTML-код
Система Яндекс.Метрики формирует HTML-код счетчика, который интегрируется в HTML-код сайта. Большинство конструкторов для сайтов открывают вебмастерам доступ к HTML-коду страниц, куда они вносят изменения, управляя дизайном и функционалом страниц.
HTML-код следует добавлять в блок, который отображается на всех страницах, и желательно, чтобы он оказался в верхней части кода, ближе к началу страницы. Оптимально, если код сервиса установится в пределах или
Как работать с Яндекс.Метрикой: установка, настройка, отчеты
Яндекс.Метрика – бесплатный инструмент аналитики с обилием функций. Интернет-маркетолог должен знать все его возможности, уметь настраивать счётчик и цели, анализировать отчёты. В этом поможет наш гайд.
Вот какие полезные сведения можно получить по разным типам сайтов.
Данных Метрики достаточно для комплексного анализа продвижения ресурса в интернете. Но для их получения нужно правильно установить и настроить счётчик.
Авторизуйтесь под аккаунтом, к которому вы хотите привязать счётчик, зайдите на страницу Яндекс.Метрики и кликните «Добавить счётчик»:
Дальше работаем с разделом «Настройка»:
Заполняем поля во вкладке «Счётчик»: название и URL сайта, часовой пояс. URL указываем без префикса http/https:
Если нужно, включите отслеживание поддоменов. На этой же вкладке можно привязать счетчик к Вебмастеру. Это полезная функция, т. к. поисковик будет быстрее индексировать новые страницы на сайте.
Можно привязать несколько сайтов к одному счётчику. Если для вас это актуально, добавьте их URL. Переходы между этими сайтами будут считаться внутренними.
Во вкладке «Фильтры» можно исключить или, наоборот, учитывать переходы с определенных URL и IP-адресов при помощи условий. Лучше сразу активировать чекбокс «Не учитывать мои визиты». Можно задать до 30 фильтров.
В этой же вкладке настраивается фильтрация роботов:
Оптимальный вариант фильтрации – только по строгим правилам (выставлен по умолчанию). Самый жёсткий – по строгим правилам и поведению – нужно использовать при резком повышении неестественных переходов.
Во вкладке «Уведомления» настройте оповещение о недоступности сайта:
Здесь вы можете дать доступ к счётчику на редактирование или просмотр:
Если включить публичный доступ к статистике, сведения из отчётов (кроме трафика в разрезе поисковых систем, поисковых фраз, отчётов групп «Целевой звонок» и «Директ», записей Вебвизора, содержимого заказов) можно будет посмотреть по прямой ссылке:
На вкладке «Счётчик» активируются расширенные возможности Метрики:
К этой группе относятся:
Настройки можно редактировать во вкладке «Счётчик»:
Скопируйте код счётчика и установите его на все страницы вашего сайта:
Как устанавливать код — зависит от вашей CMS. Полезно знать, что кроме сайта Метрика совместима с Турбо, AMP-страницами и Facebook Instant Articles.
Особенности установки счётчика на SPA-сайты, а также ресурсы, использующие AJAX, Flash, Content Security Policy – в официальной Помощи.
Для настройки целей нужно перейти на одноименную вкладку раздела «Настройка»:
Новая цель попадет в группу конверсионных. Активировав соответствующий чекбокс, можно настроить ретаргетинговую цель для кампаний этого типа в Яндекс.Директе.
Для одного счётчика можно настроить до 200 целей разных типов:
Для цели «JavaScript-событие» нужно задать идентификатор, для целей остальных типов — условия.
При настройке целей для своего проекта советуем выбирать значимые действия пользователей, которые влияют на бизнес-показатели – подписка на рассылку, регистрация на вебинар, покупка и прочие. Учитывайте, что часть действий можно отследить без настройки целей.
Инструкция по настройке целей всех типов – в Справке Яндекс.Метрики.
1. Добавьте к URL сайта в адресной строке параметр «_ym_debug» со значением 1 и загрузите страницу:
2. Вызовите консоль браузера на Windows комбинацией клавиш Ctrl + Shift + J, на Mac — ⌥ + ⌘ + J.
3. В консоли отобразится номер счётчика и данные, которые он передает:
4. Если данных нет, то на этой странице счётчик не установлен или установлен некорректно.
При условии, что счётчик установлен корректно, данные о посещениях сайта будут передаваться в отчёты.
На дашборд «Сводка» можно вывести виджеты самых важных отчётов:
Виджеты можно создавать самостоятельно или добавлять из библиотеки. Изображения виджетов доступны к скачиванию в формате PDF.
Вот группы отчётов:
Ссылки на часто используемые отчёты выводятся под соответствующим заголовком.
Подробнее расскажем о группе стандартных отчётов. Большинство из них состоят из визуализации и таблицы.
Можно создать отчёт по расписанию, сохранить на компьютер, скачать в форматах XLSX/CSV данные графика и таблицы или все данные в формате PDF.
Таблицу можно настроить под свои задачи, используя доступные группировки, метрики и цели:
В отчёт «Конверсии» попадают данные по настроенным целям. Динамика за выбранный период представлена в виде графика из двух кривых. Красная обозначает процент конверсии, синяя – сколько целей достигнуто:
Клик по названию цели вызывает переход в детализированный отчёт:
Метрики по любой цели можно проанализировать во всех отчётах, которые сформированы на основе визитов:
Чтобы соотнести действия на сайте и покупки в офлайн-точках, настройте систему идентификации пользователей, например, промокоды, систему карт лояльности, регистрацию.
В счетчик Метрики необходимо загрузить информацию о конверсиях, совершенных офлайн. Это можно сделать:
Расскажем о загрузке данных через веб-интерфейс Метрики:
Отчёты группы «Звонки» нужны для владельцев сайтов, существенная часть заявок с которых приходится на звонки, например, салоны красоты или частные клиники.
Внедрите систему колл-трекинга. Она будет подменять телефонный номер, размещенный на сайте, в зависимости от источника трафика и передавать информацию в счетчик (перечень систем, интегрированных с Метрикой, по ссылке).
Данные по звонкам представлены в соответствующей группе отчётов:
Сразу же после того, как данные из системы колл-трекинга начинают поступать в Метрику, автоматически создается цель «Звонок»:
Изучите, какие из параметров звонков являются обязательными, а какие нет, в Помощи Метрики.
Группа агрегирует данные по каналам трафика – поиск, соцсети, реклама и другим:
Информация о переходах на сайт, размеченных при помощи From, UTM и Openstat, находится в соответствующих отчётах.
Отчёт «Источники, сводка» отражает посещаемость по источникам трафика:
Для корректного отображения данных нужно правильно выбрать модель атрибуции:
В Яндекс.Метрике их четыре:
По умолчанию установлена модель «Последний значимый переход». Подробное описание моделей атрибуции и целесообразность применения каждой из них – в Справке Метрики.
В отчёте «Поисковые запросы» отображаются запросы из следующих источников:
Отчёт полезен для определения доли брендового трафика, расширения семантического ядра, выявления нецелевых запросов.
Отчёты «Директ» аккумулируют данные по рекламным кампаниям в системе Яндекса. Чтобы информация по переходам из Директа передавалась в Метрику, нужно:
Здесь содержатся характеристики посетителей сайта по целому ряду параметров:
Отчёты этой группы показывают, как пользователи ведут себя на сайте:
Из отчётов можно узнать о самых посещаемых страницах, загрузках файлов, страницах входа и выхода, расшаривании контента в соцсетях и мессенджерах и другие важные сведения.
Для передачи данных в два последних отчёта группы – «Параметры визитов» и «Параметры посетителей» — нужно загрузить их при помощи JavaScript API или CSV-файла. Подробная инструкция – в Справке Яндекса.
Здесь содержится следующая информация:
На основе срезов в отчётах можно сделать выводы о том, оптимизирован ли ваш сайт под популярные у посетителей устройства, разрешения экрана и технологии.
Отчёты содержат информацию о техническом состоянии сайта:
Обязательное условие для включения отчётов группы «Мониторинг» – трафик на сайт должен превышать 100 просмотров страниц за неделю.
Отчёты содержат такую информацию:
Информация о периодах недоступности ресурса может приходить на почту или по SMS. Для этого нужно указать email и/или телефон во вкладке «Уведомления» раздела «Настройки».
Группа отчётов обязательна для интернет-магазинов. Электронная коммерция подключается в качестве дополнительной опции в разделе «Настройка». Далее нужно разместить контейнер dataLayer на всех страницах, которые содержат информацию о товарах, и настроить передачу событий в Яндекс.Метрику. Это можно сделать двумя способами – поставить задачу программисту или при помощи одного из плагинов. Подробная инструкция – в Справке Яндекса.
После того как электронная коммерция будет подключена и контейнеры размещены, информация попадёт в соответствующую группу отчётов:
Группа «Электронная коммерция» включает отчёты по доходу, содержимому заказов, популярным товарам, промокодам и другие сведения. Почти все данные можно проанализировать в разрезе каналов трафика, достижения целей, сегментов, демографических характеристик и других группировок и метрик.
Группа отчётов подключается для сайтов-партнеров РСЯ (рекламной сети Яндекса) или ресурсов, которые используют рекламную систему Adfox:
Данные сгруппированы по каналам, регионам, устройствам пользователей и другим параметрам. В группе есть отчёты по РСЯ, Adfox и рекомендательному виджету РСЯ.
Чтобы данные передавались в Метрику, в интерфейсе рекламной системы нужно указать номер счётчика и подключить отчёты. Инструкция по настройке – по ссылке.
Отчёт содержит данные о посетителях сайта в анонимизированном виде:
В отчёте есть информация о регионе, операционной системе, активности, количестве визитов и других параметрах посетителей сайта. Для того, чтобы сохранить анонимность данных пользователей, в отчёте не отображаются социально-демографические характеристики и информация из Яндекс.Директа.
Данные о покупках и сведения из систем учёта клиентов требуют дополнительной настройки. В первом случае это электронная коммерция, во втором – передача параметров посетителей.
Можно сегментировать пользователей с помощью своих или дефолтных сегментов.
Группу отчётов составляют карта ссылок, кликов, скроллинга и аналитика форм. Все они предназначены для анализа поведения посетителей сайта.
Отчёты представляют собой тепловые карты: более тёплые цвета спектра обозначают большую активность, холодные — меньшую.
На карте ссылок отражено, как пользователи переходят по внутренним ссылкам:
Карта кликов позволяет понять, на какие элементы дизайна кликают пользователи и всегда ли они являются ссылками:
Карта скроллинга показывает, как посетители просматривают страницу и долистывают ли до конца:
Виджет «Аналитика форм» показывает, сколько посетителей страницы заполнили форму, процент конверсии, проблемные поля формы, которые посетители не заполняют:
Технология Вебвизор от Яндекса записывает и воспроизводит в видеоформате действия посетителей сайта.
В отчёте Вебвизора можно задать временной отрезок, проанализировать данные по всем пользователям сайта или выбранным сегментам.
Доступны следующие параметры:
Теперь у вас есть доступ к данным о каналах трафика, конверсиях, действиях пользователей на сайте. Используйте эти данные для корректировки стратегии SEO-продвижения, оптимизации рекламных кампаний, доработки дизайна и юзабилити посадочных страниц, корректировки навигации, улучшения контента.
Кроме того, данные Яндекс.Метрики часто используются различными сервисами для рекламы сайтов. Например, если вы рекламируетесь с помощью платформы PromoPult, данные Метрики будут полезны:
Установка Яндекс.Метрики и настройка целей для пользователей системы PromoPult бесплатная. Достаточно запустить рекламу (SEO, контекстную или таргетированную рекламу), и вы можете заказать настройку счетчика у специалистов PromoPult.
Как работает Яндекс.Метрика
В интернете всё можно измерить. Если у вас есть сайт, несложно посмотреть, сколько посетителей на него приходит, на каких страницах они бывают, как долго там задерживаются и что делают. Можно составить портрет своей аудитории: узнать возраст и интересы разных категорий посетителей. Эти данные помогают развивать сайт и делать его понятнее и удобнее для разных людей.
Системы веб-аналитики
Следить за посещаемостью сайта и оценивать качество его работы помогают системы веб-аналитики. Они различаются набором возможностей, скоростью обработки данных и, конечно, интерфейсами, но в целом устроены похожим образом. Обычно аналитические сервисы состоят из трёх частей. Первая — счётчик. На сайте размещается специальный код, и каждый раз, когда страница загружается или пользователь совершает на ней какие-то действия, счётчик отправляет сообщение в базу данных системы. Это вторая часть сервиса, там информация систематизируется и обрабатывается. Третья часть — интерфейс, в котором представлены обработанные данные по тому или иному сайту и отчёты на основе этих данных — в виде таблиц и графиков.
У Яндекса есть своя аналитическая система, которой ежедневного пользуются миллионы владельцев сайтов, — Метрика. Она умеет быстро обрабатывать огромные объёмы данных и строить произвольные отчёты в реальном времени.
Метрика, как и все системы веб-аналитики, оперирует несколькими базовыми понятиями. «Посетитель» — пользователь, зашедший на сайт. Когда он приходит впервые, в его браузер записывается уникальный идентификатор, по которому счётчик Метрики узнаёт его в следующий раз. «Просмотр» — каждое обращение посетителя к сайту, включая простое обновление страницы. «Визит» — один сеанс работы пользователя с сайтом. Визит начинается, когда посетитель попадает на сайт, и заканчивается, если он не предпринимает там никаких действий в течение определённого времени — по умолчанию это 30 минут. Визит может включать в себя множество просмотров разных страниц. В базе Метрики хранятся данные как об отдельных просмотрах, так и о визитах.
Сбор данных
Когда посетитель переходит на сайт со счётчиком Метрики — из поисковой системы, социальной сети, с рекламного баннера или просто введя адрес в адресной строке, — его браузер загружает код страницы. В этот момент счётчик отправляет в Метрику данные: сам факт загрузки страницы, уникальный идентификатор посетителя, адрес страницы, с которой он пришёл, название и версию браузера и операционной системы и так далее. Метрика не знает ничего о конкретном человеке с именем и фамилией, который совершает в интернете конкретные действия. Идентификатор посетителя и все остальные его параметры становятся частью обезличенной статистики — цифрами, которые помогают пользователю Метрики развивать свой сайт.
Пока посетитель находится на сайте, счётчик продолжает собирать статистику и отправлять её Метрике. Каждый раз, когда человек открывает какую-нибудь страницу, счётчик регистрирует просмотр. Если он длится дольше 15 секунд, система снова получает сообщение — о том, что просмотр продолжается. Если же человек зашёл только на одну страницу сайта и пробыл там меньше 15 секунд, счётчик отправляет сообщение об отказе. Процент отказов помогает владельцу сайта узнать, сколько посетителей не заинтересовались страницей или попали туда случайно.
Счётчик фиксирует прокручивание страницы, движения мыши и клики по кнопкам и ссылкам (отчёт об этих действиях владелец сайта может посмотреть в отдельном разделе Метрики — Вебвизоре). Также он сообщает, совершил ли посетитель важные для владельца сайта действия — например, зарегистрировался на форуме, кликнул по рекламному баннеру или оформил заказ в интернет-магазине.
Для системы статистики один человек может стать несколькими посетителями. Например, если он зайдёт на сайт с двух разных устройств, из разных браузеров или из одного браузера, но после его переустановки. Бывает и наоборот: Метрика может считать одним посетителем семью из пяти человек, если все её члены пользуются одним браузером.
Отчёты
В базе данных Метрики хранятся самые разнообразные данные о посещаемости сайта. Владелец составляет на их основе отчёты и смотрит результаты его работы в разных срезах — временных, географических, возрастных или даже сразу нескольких.
Например, чтобы понять, хорошо ли в целом сработала ваша рекламная кампания, можно посмотреть в Метрике общую информацию — увеличилось ли количество посещений, из каких источников приходили люди и как изменилась глубина просмотра. А можно углубиться в детали и попытаться ответить на более конкретный вопрос. Допустим, у вас есть сервис для молодых жителей Санкт-Петербурга и вы хотите проверить, удобен ли его новый мобильный интерфейс. Метрика позволяет узнать, много ли владельцев смартфонов в возрасте от 18 до 34 лет просмотрело больше двух страниц вашего сайта и много ли было отказов, а вам останется только сделать выводы.
Все отчёты составляются сразу: владелец сайта указывает, что хочет посмотреть, и система сразу же извлекает данные из базы и показывает результат — учитывая даже тех посетителей, которые были на сайте только что.
Хранение и обработка данных
Поскольку отчёты создаются в реальном времени, их структура становится известна только в тот момент, когда владелец сайта делает через интерфейс Метрики запрос для получения отчёта. Структура отчёта может быть практически любой, а составляется он за долю секунды. Чтобы владелец сайта получал актуальную и полную информацию, нужно постоянно собирать данные о посещаемости и уметь тут же их обрабатывать. Для этого в 2012 году Яндекс разработал свою систему управления базами данных (СУБД) — ClickHouse.
Есть два варианта подготовки данных для аналитических отчётов. В первом, с которым раньше работала Метрика, данные агрегируются предварительно, и на их основе составляется фиксированный набор отчётов. Это позволяет загружать отчёты достаточно быстро, но ограничивает гибкость аналитики: пользователь может получить только один из набора предусмотренных отчётов. Другой вариант — хранить поступающие в систему события без предварительной агрегации, а вычисления выполнять в онлайне — в тот момент, когда пользователь загружает отчёт. Это сильно расширяет аналитические возможности, но накладывает очень серьёзные требования на скорость обработки данных.
Существует два основных типа СУБД — строковые и столбцовые. Они отличаются организацией хранения данных на физическом уровне. Большинство известных СУБД строковые — в них данные, которые в таблице находятся в разных ячейках одной строки, хранятся рядом, друг за другом. Такие СУБД хорошо подходят, например, для обработки транзакций, так как позволяют быстро обновлять отдельные строки в базе данных. Для аналитических запросов, когда необходимы только данные из нескольких столбцов в большом массиве строк, строковые СУБД подходят хуже. При обработке таких запросов необходимо прочитать и отбросить значения всех остальных столбцов — в том числе в данном случае ненужных. На это уходит время.
В столбцовых СУБД, к которым как раз и относится ClickHouse, данные хранятся в порядке столбцов: значения, относящиеся к одному столбцу, расположены рядом. В Яндекс.Метрике мы храним события (визиты, просмотры и т. п.) в нескольких таблицах, где строки — это всё те же события, а столбцы — их параметры. Такая структура СУБД позволяет увеличивать количество параметров событий без потери производительности. Например, если нам нужно получить отчёт по количеству уникальных посетителей в разрезе регионов, достаточно прочитать с диска только два столбца.
В октябре 2015 года объём данных Метрики только для веб-сайтов составил 10,65 триллиона строк. В наиболее крупной таблице содержится 349 столбцов. Каждый раз, когда владелец сайта открывает страницу в Метрике, в ClickHouse отправляется несколько запросов. Всего база данных получает примерно 2000 запросов в секунду; пиковая скорость обработки данных превышает два терабайта в секунду.
ClickHouse легко масштабируется: добавление новых серверов происходит без перестройки кластера. Один запрос может обрабатываться с использованием вычислительной мощности всех доступных серверов, поэтому данные обрабатываются очень быстро. Другая полезная особенность ClickHouse — отказоустойчивость: даже если какие-то серверы выходят из строя, система продолжает работать. Для этого данные реплицируются в географически распределённых дата-центрах.
ClickHouse позволяет серьёзно уменьшить затраты на хранение и обработку данных. Данные хранятся в нём по столбцам, и за счёт этого их можно эффективно сжимать. В ClickHouse реализован векторный движок выполнения запросов: данные не только хранятся, но и обрабатываются по столбцам, что позволяет оптимальным образом использовать процессор и память. Данные на диске переупорядочиваются (например, по сайту и дате), чтобы для составления отчёта достаточно было прочитать с диска лишь небольшой диапазон строк. Одновременно с этим ClickHouse позволяет добавлять в таблицу новые данные в реальном времени.
Система ClickHouse, разработанная в команде Метрики и для её нужд, оказалась полезна и для других задач Яндекса. В том числе СУБД используется в Маркете, рекламных технологиях, системе мониторинга серверов и внутренней бизнес-аналитике. ClickHouse сравнительно прост для изучения, так как для запросов используется язык SQL.