Объединение данных в Google Data Studio

Что такое Google Data Studio

Google Data Studio — это инструмент, с помощью которого можно строить отчеты и красивые визуализации данных. Если вы еще не знакомы с этим чудо-сервисом, подробнее почитать о его возможностях можно тут. Основная прелесть Data Studio в его простоте и интуитивно понятном для пользователя интерфейсе, а благодаря множеству существующих коннекторов можно очень быстро построить отчеты из разных источников.

Возможность объединения данных в Google Data Studio

Помимо прочих классных штук в Data Studio есть возможность объединять (совмещать) данные из разных систем. В этой статье я хочу подробно рассмотреть этот функционал.

Функция объединения позволяет создать отчет по данным из нескольких источников. Например, в одной таблице вы сможете связать данные из Google Analytics и Google Ads, Google Analytics и Google Spreadsheets и пр. Данные из одного источника можно объединить с данными до 4-х других источников. Для этого необходимо выбрать параметр, который будет определять связь между этими источниками данных. Он называется ключ объединения (ключей может быть несколько).

В результате объединения мы получим все данные из основного источника данных (тот, что слева) плюс совпадающие по условию связывания (ключу) данные из остальных источников.

Такой тип объединения называется LEFT OUTER JOIN (левое внешнее объединение). Как это работает, легко запомнить по диаграмме:

Объединение данные left outer join в Гугл Дата Студио

Результат объединения — данные из обеих таблиц (совпадающие по условию объединения) плюс оставшиеся данные из внешней (левой) таблицы, которые по условию не подходят. Недостающие данные заполняются значением null.

Как настроить совмещенные источники в Data Studio

Чтобы было понятнее, как с этим работать, рассмотрим объединение данных на примере. Предположим, что нам нужно вывести данные по числу достигнутых целей из разных представлений Google Analytics. Такая задача вполне может возникнуть, так как в аналитиксе есть ограничение на число целей — до 20 штук на представление. И часто проблема ограничения решается с помощью создания новых представлений. Для решения нашей задачи в Data Studio мы можем в качестве источников данных выбрать представления с нужными целями и связать записи, например, по ключу “источник или канал”. Приступим!

Выбираем основной источник данных и под ним переходим к функции совмещения.

Функция совмещения данных в Гугл Дата Студии

Затем указываем ключ для объединения. Ключ объединения определяет связь между различными источниками данных.

Выбор ключа для объединения данных в Google Data Studio

Добавляем новый источник данных.

Добавление нового источника данных

Указываем ключ для объединения во втором источнике и выбираем интересующие нас показатели. Например, из первого представления возьмем сеансы и число отправок форм, а из второго количество звонков.

Показатели для совмещения данных в Гугл Дата Студио

Сохраняем.

Данные совмещенных источников в Гугл Дата Студии

Кстати, небольшой совет на случай, если вы все таки подзабыли правило объединения данных в Google Data Studio, и неверно выбрали порядок следования источников, получив в результате не то, что хотели. Не надо переделывать все с нуля, в правом верхнем углу источника кликните на “Сдвинуть влево/вправо” и приведите источники к нужному порядку.

Изменение порядка источников при объединении данных

Также удобно использовать совмещенные источники, если на одном графике хочется увидеть данные сразу по нескольким сайтам.

Используя в качестве ключа объединения дату, как показано на скриншоте,

Совмещение данных по нескольким сайтам в Google Data Studio

мы можем построить диаграмму, отображающую динамику изменения числа сеансов двух сайтов по дням.

График сеансов по двум сайтам

А если нас интересует общее число трафика, которое приводят эти сайты, можно добавить вычисляемый показатель.

Добавление вычисляемого показателя в Google Data Studio

При создании нового поля

Создание поля в Google Data Studio

указываем необходимую формулу

Формула для нового показателя

Новый показатель отобразим на диаграмме.

Новый показатель на графике

По аналогии можно строить отчеты и по важным финансовым показателям. Например, если у вас несколько онлайн-проектов и необходимо видеть возврат инвестиций по всем маркетинговым активностям, также поможет использование объединения данных. Для этого можно создать вычисляемый показатель и в текстовом поле указать формулу для расчета ROMI.

Расчет ROMI в Google Data Studio

В одной диаграмме таким образом можно учесть данные не более чем по пяти источникам.

Диаграмма ROMI в Гугл Дата Студио

Не все пока так радужно, как хотелось бы. В использовании вычисляемых показателей при объединении разных источников есть определенные неудобства. На данный момент поддерживаются только вычисляемые поля уровня диаграммы (chart-specific calculated fields) и не поддерживаются вычисляемые поля, создаваемые на уровне источника данных (data source calculated fields). Подробнее о разнице между ними можно почитать тут. Вычисляемые поля уровня диаграммы доступны для использования только для диаграммы, для которой они были созданы. Кроме того, нельзя использовать один вычисляемый показатель уровня диаграммы при расчете другого вычисляемого показателя уровня диаграммы (даже если он был создан в рамках построения этой же диаграммы).

Как по мне, несмотря на эти ограничения, круто, что функционал Data Studio постоянно расширяется и улучшается, и теперь доступна такая удобная штука, как объединение данных. Удачи в настройках и красивых вам отчетов=)