Combinação de dados no Looker Data Studio e 5 tipos de join
Combinação de dados (data blending) do Google Looker Data Studio na prática: LEFT OUTER (esquerda), INNER (interna), RIGHT OUTER (direita), FULL OUTER (completa) e CROSS (cruzada)
PUBLICADO POR AYLTON INACIO
Tutoriais e Artigos > Google Looker Studio
A combinação de dados (data blending) é um recurso poderoso do Google Looker Data Studio, que permite a junção de várias origens de dados diferentes, e essa junção pode ser feita de formas diferentes.
Por exemplo, imagine uma origem com dados de turmas escolares e outra com dados de alunos. Quando um aluno é cadastrado, um campo deve ter a turma que ele está matriculado. A imagem a seguir mostra essas duas origens e o campo id_turma em alunos para criar a relação.
Analisando as origens, repare que cada turma tem uma identificação única chamada id, e o mesmo vale para os alunos. Essa campo funciona como nosso CPF, ou seja, cada registro tem uma identificação exclusiva e serve para criar combinação de dados entre as tabelas.
Analisando a tabela de alunos, repare que temos o campo id_turma. Dessa forma, podemos dizer que o aluno Carlos (identificação 4) está matriculado na turma Exemplar 35 (identificação 3).
▶ Se preferir, acesse "Combinação de dados no Google Looker Data Studio com 5 tipos de JOIN" no YouTube.
Você pode baixar os arquivos usados neste tutorial aqui e subir no Google Planilhas.
O campo id_turma da tabela de alunos pode ser vinculado com o campo id da tabela de turmas, ou seja, são campos-chave, e com eles é possível combinar os dados das duas tabelas como na imagem a seguir:
Combinação de dados LEFT OUTER (externa à esquerda)
O tipo de combinação de dados usado no exemplo anterior foi o LEFT OUTER JOIN (Externa à esquerda). Com ele é possível retornar todos os registros da tabela da esquerda (alunos) e os dados que combinam na tabela da direita (turma) através da relação dos campos-chave representados com ícone de link.
A combinação de dados usada e outras podem ser feitas através do menu Recursos > Gerenciar Mesclagens ou selecionando a tabela base e clicando em + Combinar Dados na aba Dados. A imagem a seguir mostra o resultado da combinação feita entre as tabelas de alunos e turmas:
E se o valor do campo id_turma na tabela de alunos for alterado? Por exemplo, imagine alterar o id_turma da aluna Fernanda para 6. Qual a turma de código 6? Ele não existe! E qual será o resultado da combinação com LEFT OUTER JOIN? Vamos conferir na imagem a seguir:
A aluna Fernanda aparece na tabela, mas como sua turma não existe, o nome é preenchido com NULO. E a Fernanda só aparece por causa da combinação LEFT OUTER, que traz todos os registros da tabela da esquerda na combinação, mesmo sem vínculo na tabela da direita.
O Google Looker Data Studio oferece os tipos de combinação de dados a seguir:
- LEFT OUTER (Externa à esquerda)
- INNER (interna)
- RIGHT OUTER (Externa à direita)
- FULL OUTER (completa)
- CROSS (cruzada)
Combinação de dados INNER (interna)
O tipo de combinação INNER JOIN retorna apenas as linhas que correspondem nas duas tabelas. Sendo assim, no nosso exemplo anterior, o tipo INNER faz com que a aluna Fernanda não apareça na tabela:
Combinação de dados RIGHT OUTER (Externa à direita)
O tipo de combinação RIGHT OUTER do Google Looker Data Studio retorna as linhas da tabela da direita com os dados correspondentes da tabela da esquerda. Para ver o resultado mais completo dessa combinação, altere o id da turma Graduados, de 5 para 10.
A combinação retornou todas as turmas (tabela da direita na configuração) e todos os alunos relacionados na tabela de alunos (tabela da esquerda). A turma Graduados ficou sem aluno com o novo código, mas mesmo assim ela aparece pela regra do RIGHT OUTER.
Os exemplos até aqui de LEFT E RIGHT JOIN mostram a importância da tabela que fica na esquerda. Importante destacar também que é possível combinar mais de duas origens, adicionar campos novos e criar filtros, tudo dentro da combinação de dados.
Combinação de dados FULL OUTER (Completa)
O tipo de combinação FULL OUTER do Looker Data Studio retorna todas as linhas das tabelas da esquerda e da direita, sejam elas correspondentes ou não.
Esse tipo de combinação de dados do Looker Data Studio é muito usada para fazer "mesclagem" de origens de dados diferentes com a mesma estrutura de campos. É necessário usar funções como IFNULL para unificar campos e remover valores NULOS.
Combinação de dados CROSS (Cruzada)
O tipo de combinação CROSS retorna todas as combinações possíveis de linhas das tabelas da esquerda e da direita. (Não precisa de chave)
Então é isso, eu espero que você tenha gostado desta publicação. Fique à vontade para compartilhar nas suas redes sociais para ajudar na divulgação e crescimento do site.
Aproveite para se inscrever no meu canal do YouTube e também na News do site pra ficar por dentro das novidades em artigos, tutoriais e cursos online.
Abraço e até a próxima!