O BigQuery é um banco de dados de análise NoOps, totalmente gerenciado e de baixo custo desenvolvido pelo Google. Com ele, você pode consultar muitos terabytes de dados sem ter que gerenciar uma infraestrutura nem precisar de um administrador de banco de dados. O BigQuery usa SQL e está disponível no modelo de pagamento por utilização. Assim, você pode se concentrar na análise dos dados para encontrar informações relevantes.
Agora o BigQuery inclui um novo conjunto de dados de e-commerce com milhões de registros do Google Analytics referentes à Google Merchandise Store. Você tem uma cópia do conjunto de dados usado neste laboratório e analisará os campos e linhas disponíveis para extrair insights.
Este laboratório orientará você pela lógica da solução de problemas em consultas. Ele inclui atividades no contexto de uma situação real. Durante o laboratório, imagine que está trabalhando com uma nova analista de dados na sua equipe e que você recebeu dela as consultas abaixo para responder a algumas perguntas sobre o conjunto de dados de comércio eletrônico. Use as respostas para corrigir as consultas e chegar a um resultado significativo.
Atividades deste laboratório
Neste laboratório, você aprenderá a:
consultar o conjunto de dados público para extrair insights;
usar o "Editor de consultas" do BigQuery para resolver problemas comuns de SQL;
usar o validador de consultas;
corrigir erros de sintaxe e lógica no SQL.
Configuração e requisitos
Para cada laboratório, você recebe um novo projeto do Google Cloud e um conjunto de recursos por um determinado período e sem custos financeiros.
Faça login no Qwiklabs em uma janela anônima.
Confira o tempo de acesso do laboratório (por exemplo, 1:15:00) e finalize todas as atividades nesse prazo.
Não é possível pausar o laboratório. Você pode reiniciar o desafio, mas vai precisar refazer todas as etapas.
Quando tudo estiver pronto, clique em Começar o laboratório.
Anote as credenciais (Nome de usuário e Senha). É com elas que você vai fazer login no Console do Google Cloud.
Clique em Abrir Console do Google.
Clique em Usar outra conta, depois copie e cole as credenciais deste laboratório nos locais indicados.
Se você usar outras credenciais, vai receber mensagens de erro ou cobranças.
Aceite os termos e pule a página de recursos de recuperação.
Abra o BigQuery e fixe um projeto na árvore de recursos
Nesta seção, você vai adicionar o projeto data-to-insights aos recursos do seu ambiente.
Clique no Menu de navegação > BigQuery.
A caixa de mensagem Bem-vindo ao BigQuery no Console do Cloud é aberta.
A caixa de mensagem Bem-vindo ao BigQuery no Console do Cloud fornece um link para o guia de início rápido e atualizações da IU.
Clique em Concluído.
Os conjuntos de dados públicos do BigQuery não são exibidos por padrão na IU da Web do BigQuery. Para abrir o projeto de conjuntos de dados públicos
Clique em + Add Dados.
Selecione Fixar projeto > Insira o nome do projeto.
Para o Nome do projeto, insira data-to-insights.
Clique em Fixar.
No painel esquerdo, em Visualizando projetos fixados, você verá o projeto data-to-insights fixado.
Editor de código do BigQuery
As atividades das próximas seções apresentam consultas com erros comuns para você resolver. Este laboratório indicará o que você precisa observar e dará sugestões de como corrigir a sintaxe e retornar resultados significativos.
Para acompanhar a solução de problemas e as sugestões, copie e cole a consulta no EDITOR do BigQuery. Se houver algum erro, você vai encontrar um ponto de exclamação vermelho na linha que contém o erro e no validador de consultas (canto inferior).
Se você executar a consulta com erro, ela falhará. O erro será especificado nas informações do job.
Se nenhum erro for detectado, o validador de consulta mostrará uma marca de seleção verde. Quando aparecer a marca de seleção verde, clique em EXECUTAR a consulta para acessar o resultado.
Encontre o número total de clientes que concluíram uma compra
Nesta seção, você criará uma consulta para encontrar o número de visitantes únicos que concluíram uma compra no seu site. Os dados estão na tabela rev_transactions que sua equipe de analistas de dados enviou. A equipe também enviou consultas de exemplo para ajudar na sua análise, mas você não tem certeza se elas estão escritas corretamente.
Resolva os problemas de alias, de vírgulas e apontados pelo validador de consultas
Confira a consulta abaixo e responda à pergunta a seguir:
#standardSQL
SELECT FROM `data-to-inghts.ecommerce.rev_transactions` LIMIT 1000
E esta consulta atualizada?
#standardSQL
SELECT * FROM [data-to-insights:ecommerce.rev_transactions] LIMIT 1000
E esta consulta que usa SQL padrão?
#standardSQL
SELECT FROM `data-to-insights.ecommerce.rev_transactions`
E agora? Esta consulta tem uma coluna.
#standardSQL
SELECT
fullVisitorId
FROM `data-to-insights.ecommerce.rev_transactions`
E agora? A próxima consulta tem um título de página.
#standardSQL
SELECT fullVisitorId hits_page_pageTitle
FROM `data-to-insights.ecommerce.rev_transactions` LIMIT 1000
E agora? A vírgula que faltava foi corrigida.
#standardSQL
SELECT
fullVisitorId
, hits_page_pageTitle
FROM `data-to-insights.ecommerce.rev_transactions` LIMIT 1000
Resposta: a consulta retorna resultados, mas você tem certeza de que os visitantes não foram contabilizados duas vezes? Além disso, retornar apenas uma linha não responde à pergunta sobre quantos visitantes únicos concluíram uma compra.
Na próxima seção, você verá uma maneira de agregar os resultados.
Resolva problemas de consultas com erros de lógica, instruções GROUP BY e filtros curinga
Agregue a próxima consulta para saber quantos visitantes únicos concluíram uma compra.
#standardSQL
SELECT
fullVisitorId
, hits_page_pageTitle
FROM `data-to-insights.ecommerce.rev_transactions` LIMIT 1000
E esta? A função de agregação COUNT() foi adicionada.
#standardSQL
SELECT
COUNT(fullVisitorId) AS visitor_count
, hits_page_pageTitle
FROM `data-to-insights.ecommerce.rev_transactions`
Na próxima consulta, foram adicionadas instruções GROUP BY e DISTINCT.
#standardSQL
SELECT
COUNT(DISTINCT fullVisitorId) AS visitor_count
, hits_page_pageTitle
FROM `data-to-insights.ecommerce.rev_transactions`
GROUP BY hits_page_pageTitle
Resultados
Ótimo! Os resultados são bons, mas algo não parece correto.
Filtre os resultados para acessar apenas aqueles com "Confirmação do pagamento".
#standardSQL
SELECT
COUNT(DISTINCT fullVisitorId) AS visitor_count
, hits_page_pageTitle
FROM `data-to-insights.ecommerce.rev_transactions`
WHERE hits_page_pageTitle = "Checkout Confirmation"
GROUP BY hits_page_pageTitle
Liste as cidades com mais transações no seu site de e-commerce
Resolva erros de pedidos, campos calculados e filtragem após agregação
Complete a consulta parcialmente escrita:
SELECT
geoNetwork_city,
totals_transactions,
COUNT( DISTINCT fullVisitorId) AS distinct_visitors
FROM
`data-to-insights.ecommerce.rev_transactions`
GROUP BY
Possível solução
#standardSQL
SELECT
geoNetwork_city,
SUM(totals_transactions) AS totals_transactions,
COUNT( DISTINCT fullVisitorId) AS distinct_visitors
FROM
`data-to-insights.ecommerce.rev_transactions`
GROUP BY geoNetwork_city
Atualize sua consulta anterior para listar as cidades com o maior número de transações primeiro.
Possível solução
#standardSQL
SELECT
geoNetwork_city,
SUM(totals_transactions) AS totals_transactions,
COUNT( DISTINCT fullVisitorId) AS distinct_visitors
FROM
`data-to-insights.ecommerce.rev_transactions`
GROUP BY geoNetwork_city
ORDER BY distinct_visitors DESC
Atualize sua consulta e crie um novo campo calculado para retornar o número médio de produtos por pedido em cada cidade.
Possível solução
#standardSQL
SELECT
geoNetwork_city,
SUM(totals_transactions) AS total_products_ordered,
COUNT( DISTINCT fullVisitorId) AS distinct_visitors,
SUM(totals_transactions) / COUNT( DISTINCT fullVisitorId) AS avg_products_ordered
FROM
`data-to-insights.ecommerce.rev_transactions`
GROUP BY geoNetwork_city
ORDER BY avg_products_ordered DESC
Resultados
Filtre seus resultados agregados para retornar somente cidades com o campo avg_products_ordered superior a 20.
Onde está o erro na consulta abaixo?
#standardSQL
SELECT
geoNetwork_city,
SUM(totals_transactions) AS total_products_ordered,
COUNT( DISTINCT fullVisitorId) AS distinct_visitors,
SUM(totals_transactions) / COUNT( DISTINCT fullVisitorId) AS avg_products_ordered
FROM
`data-to-insights.ecommerce.rev_transactions`
WHERE avg_products_ordered > 20
GROUP BY geoNetwork_city
ORDER BY avg_products_ordered DESC
Possível solução
#standardSQL
SELECT
geoNetwork_city,
SUM(totals_transactions) AS total_products_ordered,
COUNT( DISTINCT fullVisitorId) AS distinct_visitors,
SUM(totals_transactions) / COUNT( DISTINCT fullVisitorId) AS avg_products_ordered
FROM
`data-to-insights.ecommerce.rev_transactions`
GROUP BY geoNetwork_city
HAVING avg_products_ordered > 20
ORDER BY avg_products_ordered DESC
Encontre o número total de produtos em cada categoria
Encontre os produtos mais vendidos filtrando por valores NULL
Onde está o erro na consulta abaixo? Como você pode corrigi-lo?
#standardSQL
SELECT hits_product_v2ProductName, hits_product_v2ProductCategory
FROM `data-to-insights.ecommerce.rev_transactions`
GROUP BY 1,2
Onde está o erro na consulta abaixo?
#standardSQL
SELECT
COUNT(hits_product_v2ProductName) as number_of_products,
hits_product_v2ProductCategory
FROM `data-to-insights.ecommerce.rev_transactions`
WHERE hits_product_v2ProductName IS NOT NULL
GROUP BY hits_product_v2ProductCategory
ORDER BY number_of_products DESC
Atualize a consulta anterior para contabilizar apenas produtos diferentes de cada categoria de produto.
Possível solução
#standardSQL
SELECT
COUNT(DISTINCT hits_product_v2ProductName) as number_of_products,
hits_product_v2ProductCategory
FROM `data-to-insights.ecommerce.rev_transactions`
WHERE hits_product_v2ProductName IS NOT NULL
GROUP BY hits_product_v2ProductCategory
ORDER BY number_of_products DESC
LIMIT 5
Parabéns!
Você solucionou problemas e corrigiu erros de consultas usando o SQL padrão no BigQuery. Use o validador de consultas para corrigir sintaxes e conferir os resultados da consulta, mesmo que ela não apresente erros.
Finalize o laboratório
Clique em Terminar o laboratório após a conclusão. O Google Cloud Ensina remove os recursos usados e limpa a conta por você.
Você vai poder avaliar sua experiência no laboratório. Basta selecionar o número de estrelas, digitar um comentário e clicar em Enviar.
O número de estrelas indica o seguinte:
1 estrela = muito insatisfeito
2 estrelas = insatisfeito
3 estrelas = neutro
4 estrelas = satisfeito
5 estrelas = muito satisfeito
Feche a caixa de diálogo se não quiser enviar feedback.
Para enviar seu feedback, fazer sugestões ou correções, use a guia Suporte.
Copyright 2020 Google LLC. Todos os direitos reservados. Google e o logotipo do Google são marcas registradas da Google LLC. Todos os outros nomes de produtos e empresas podem ser marcas registradas das respectivas empresas a que estão associados.
Os laboratórios criam um projeto e recursos do Google Cloud por um período fixo
Os laboratórios têm um limite de tempo e não têm o recurso de pausa. Se você encerrar o laboratório, vai precisar recomeçar do início.
No canto superior esquerdo da tela, clique em Começar o laboratório
Usar a navegação anônima
Copie o nome de usuário e a senha fornecidos para o laboratório
Clique em Abrir console no modo anônimo
Fazer login no console
Faça login usando suas credenciais do laboratório. Usar outras credenciais pode causar erros ou gerar cobranças.
Aceite os termos e pule a página de recursos de recuperação
Não clique em Terminar o laboratório a menos que você tenha concluído ou queira recomeçar, porque isso vai apagar seu trabalho e remover o projeto
Este conteúdo não está disponível no momento
Você vai receber uma notificação por e-mail quando ele estiver disponível
Ótimo!
Vamos entrar em contato por e-mail se ele ficar disponível
Um laboratório por vez
Confirme para encerrar todos os laboratórios atuais e iniciar este
Use a navegação anônima para executar o laboratório
Para executar este laboratório, use o modo de navegação anônima ou uma janela anônima do navegador. Isso evita conflitos entre sua conta pessoal e a conta de estudante, o que poderia causar cobranças extras na sua conta pessoal.
Neste laboratório, você vai usar o BigQuery para solucionar problemas comuns de SQL, consultar o conjunto de dados público data-to-insights, usar o validador de consulta e corrigir erros de sintaxe e lógica no SQL.
Duração:
Configuração: 0 minutos
·
Tempo de acesso: 50 minutos
·
Tempo para conclusão: 50 minutos