arrow_back

Acessar o BigQuery

Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

Acessar o BigQuery

Lab 1 hora 30 minutos universal_currency_alt 2 créditos show_chart Introdutório
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses
ícone de "importante" IMPORTANTE:

ícone de notebook/computador Conclua este laboratório prático usando um computador ou notebook.

ícone de verificação Só 5 tentativas são permitidas por laboratório.

ícone de alvo do teste É comum não acertar todas as questões na primeira tentativa e precisar refazer uma tarefa. Isso faz parte do processo de aprendizado.

ícone de cronômetro Depois que o laboratório é iniciado, não é possível pausar o tempo. Depois de 1h30, o laboratório será finalizado, e você vai precisar recomeçar.

ícone de dica Para saber mais, confira as Dicas técnicas do laboratório.

Informações gerais da atividade

A análise de dados em nuvem usa uma série de ferramentas que podem ajudar em cada fase do processo de análise. Entre elas, podemos destacar duas ferramentas conhecidas e poderosas que funcionam com muitas das principais plataformas de nuvem: o BigQuery e o Looker.

O BigQuery é um data warehouse empresarial totalmente gerenciado que ajuda a gerenciar e analisar dados usando a interface do console do Google Cloud. Com ele, você pode usar consultas SQL para recuperar, limpar e organizar dados, garantindo que você tenha os dados de qualidade necessários para gerar relatórios e análises. Também é possível usar o BigQuery para criar consultas SQL que combinam dados de várias tabelas usando JOINs.

Já o Looker é uma plataforma de Business Intelligence (BI) que ajuda a conhecer, analisar, visualizar e compartilhar seus dados. Compondo a plataforma do Looker e sendo facilmente acessível na interface do BigQuery, o Looker Studio é uma ferramenta que transforma seus dados em painéis e relatórios informativos e totalmente personalizáveis.

Neste laboratório, você vai conhecer dois conjuntos de dados no BigQuery e executar consultas SQL para filtrar os dados. Depois, você vai analisar os resultados visualizados usando o Looker Studio.

Cenário

Parabéns! Você agora é analista de dados na TheLook eCommerce, uma empresa global que vende produtos de vestuário em lojas físicas e canais digitais, incluindo um site próprio, um app para dispositivos móveis próprio e vários apps de redes sociais de terceiros. A TheLook eCommerce está crescendo rapidamente graças à grande variedade de estilos de roupas da empresa, o foco em inovação e o compromisso com a escolha de fornecedores éticos e sustentáveis.

A TheLook eCommerce está planejando uma campanha publicitária mostrando os jogadores de basquete universitário que mais marcam cestas na National Collegiate Athletic Association (NCAA) usando os produtos da empresa. Martina, a gerente de marketing, quer que a primeira fase da campanha promova roupas de banho.

Para identificar os produtos desse tipo mais vendidos em junho, historicamente o mês com mais vendas no setor de roupas de banho para a empresa, Martina pede para você gerar um relatório com os dados de vendas da categoria de roupas de banho em junho de 2023. Para determinar quais atletas serão destacados na campanha, você vai usar o conjunto de dados público da NCAA para gerar um relatório com os jogadores de basquete que mais marcam cestas.

Saiba como fazer isso: primeiro acesse as tabelas no conjunto de dados thelook_gcda. Em seguida, filtre os dados para recuperar as informações sobre roupas de banho vendidas nos últimos 30 dias. Terceiro, acesse as tabelas no conjunto de dados público ncaa_basketball. Por fim, filtre os dados para recuperar as informações sobre os 10 jogadores que mais marcam cestas.

Configuração

Antes de clicar em "Começar o laboratório"

Leia as instruções a seguir. Os laboratórios são cronometrados e não podem ser pausados. O timer é iniciado quando você clica em Começar o laboratório e mostra por quanto tempo os recursos do Google Cloud vão ficar disponíveis.

Neste laboratório prático, você pode fazer as atividades por conta própria em um ambiente cloud de verdade, não em uma simulação ou demonstração. Você vai receber novas credenciais temporárias para fazer login e acessar o Google Cloud durante o laboratório.

Confira os requisitos para concluir o laboratório:

  • Acesso a um navegador de Internet padrão (recomendamos o Chrome).
Observação: para executar este laboratório, use o modo de navegação anônima ou uma janela anônima do navegador. Isso evita conflitos entre sua conta pessoal e a conta de estudante, o que poderia causar cobranças extras na sua conta pessoal.
  • Tempo para concluir o laboratório---não se esqueça: depois de começar, não será possível pausar o laboratório.
Observação: não use seu projeto ou conta do Google Cloud neste laboratório para evitar cobranças extras na sua conta.

Como iniciar seu laboratório e fazer login no console do Google Cloud

  1. Clique no botão Começar o laboratório. No painel Detalhes do laboratório à esquerda, você verá o seguinte:

    • Tempo restante
    • O botão Abrir console do Google Cloud
    • As credenciais temporárias que você vai usar neste laboratório
    • Outras informações, se forem necessárias
    Observação: se for preciso pagar pelo laboratório, um pop-up vai aparecer para você escolher a forma de pagamento.
  2. Se você estiver usando o navegador Chrome, clique em Abrir console do Google Cloud (ou clique com o botão direito do mouse e selecione Abrir link em uma janela anônima). A página de login será aberta em uma nova guia do navegador.

    Dica: é possível organizar as guias em janelas separadas, lado a lado, para alternar facilmente entre elas.

    Observação: se a caixa de diálogo Escolha uma conta aparecer, clique em Usar outra conta.
  3. Se necessário, copie o Nome de usuário do Google Cloud abaixo e cole na caixa de diálogo de login. Clique em Próximo.

{{{user_0.username | "Nome de usuário do Google Cloud"}}}

Você também encontra o Nome de usuário do Google Cloud no painel Detalhes do laboratório.

  1. Copie a Senha do Google Cloud abaixo e cole na caixa de diálogo seguinte. Clique em Próximo.
{{{user_0.password | "Senha do Google Cloud"}}}

Você também encontra a Senha do Google Cloud no painel Detalhes do laboratório.

Importante: você precisa usar as credenciais fornecidas no laboratório, e não as da sua conta do Google Cloud. Observação: usar sua própria conta do Google Cloud neste laboratório pode gerar cobranças extras.
  1. Nas próximas páginas:
    • Aceite os Termos e Condições
    • Não adicione opções de recuperação nem autenticação de dois fatores nesta conta temporária
    • Não se inscreva em testes gratuitos

Depois de alguns instantes, o console será aberto nesta guia.

Observação: para acessar a lista dos produtos e serviços do Google Cloud, clique no Menu de navegação no canto superior esquerdo. Menu do console do Google Cloud com o ícone do menu de navegação em destaque

Tarefa 1: acesse o conjunto de dados thelook_gcda

Nesta tarefa, você vai acessar o conjunto de dados thelook_gcda e as tabelas contidas nele. Depois, você vai executar uma consulta que une duas tabelas e recupera os dados sobre as roupas de banho vendidas em junho de 2023.

  1. No Menu de navegação do console do Google Cloud (Menu de navegação), clique em BigQuery > BigQuery Studio.
Observação: a caixa de mensagem Olá! Este é o BigQuery no console do Cloud pode aparecer, com links para o guia de início rápido e as notas da versão das atualizações da interface. Clique em Concluído para continuar.
  1. No campo de pesquisa do Explorador, digite thelook e pressione ENTER.
  2. Selecione o conjunto de dados thelook_gcda.
  3. No painel Explorador, expanda o conjunto de dados thelook_gcda. As tabelas desse conjunto de dados serão exibidas. Pode ser necessário rolar a tela para acessar a lista completa de tabelas.

Nesta parte da tarefa, você vai analisar os produtos vendidos em junho de 2023.

  1. Selecione a tabela products. O esquema da tabela será exibido.
  2. Selecione a guia Visualização para analisar os dados. Cada produto contém um identificador exclusivo na coluna "id".

Agora, analise as tabelas order_items e product. Para determinar quantos produtos foram vendidos na categoria de roupas de banho em junho de 2023, essas duas tabelas precisam ser unidas por uma coluna em comum.

  1. No Editor de consultas, clique no ícone Escrever nova consulta (+) para abrir uma nova guia Sem título em que a consulta será executada.
  2. Copie e cole o seguinte comando na guia Sem título:
Observação: sempre que você executa uma nova consulta no Editor de consultas, é possível substituir a consulta antiga ao copiar e colando a nova sobre a anterior na mesma guia Sem título ou clicar no ícone Escrever nova consulta (+) para abrir uma nova guia Sem título e executar a consulta. SELECT o.order_id,p.name,p.brand,o.sale_price,o.created_at, o.status FROM `thelook_gcda.order_items` as o JOIN `thelook_gcda.products` as p ON o.product_id=p.id WHERE UPPER(p.category) like "SWIM" AND UPPER(o.status) NOT in ('RETURNED','CANCELED','CANCELLED') AND o.created_at >= '2023-06-01' AND o.created_at < '2023-07-01';
  1. Clique em Executar.

Essa consulta vai unir as tabelas order_items e product e retornar todos os pedidos relacionados a roupas de banho que não foram devolvidos ou cancelados em junho de 2023.

Por fim, analise os resultados usando o Looker Studio.

  1. Clique em Explorar dados no painel "Resultados da consulta" e selecione Explorar com o Looker Studio.

Clique em Verificar meu progresso para confirmar que você concluiu a tarefa corretamente.

Acessar o conjunto de dados thelook_gcda

Tarefa 2: acesse o conjunto de dados público NCAA Basketball

Nesta tarefa, você vai acessar o conjunto de dados ncaa_basketball e as tabelas contidas nele. Depois, você vai executar uma consulta para recuperar os dados sobre os jogadores de basquete que mais marcam cestas na NCAA. Por fim, você vai executar uma consulta que classifica os 10 jogadores que mais marcam cestas em uma única partida.

  1. Se você ainda não está no BigQuery Studio, clique em BigQuery > BigQuery Studio no menu de navegação (Menu de navegação) do console do Google Cloud,
  2. Na barra do Explorador, clique em + Adicionar para adicionar uma fonte de dados ao projeto.
  3. Na página Adicionar, na lista Fontes adicionais, selecione Conjuntos de dados públicos. A página do Marketplace será exibida.
  4. No campo de pesquisa, digite ncaa e pressione ENTER.
  5. Selecione o conjunto de dados NCAA Basketball.
  6. Na página Detalhes do produto, clique em Ver conjunto de dados para conferir o esquema de dados detalhado desse conjunto de dados público do BigQuery.
  7. No painel Explorador, expanda o conjunto de dados ncaa_basketball. As tabelas desse conjunto de dados serão exibidas.

Primeiro, você precisa somar todos os pontos acumulados pelos jogadores em todas as partidas.

  1. Confira uma prévia de cada uma dessas tabelas no conjunto de dados ncaa_basketball.
  2. Selecione a tabela mbb_players_games_sr. Quais colunas você acha que serão úteis para encontrar os jogadores com o maior número de pontos?

Cada linha em mbb_players_games_sr apresenta os resultados de cada jogador e de cada partida jogada. Para reunir o número total de pontos do jogador por partida, será preciso executar uma consulta para resumir os dados em todas as partidas.

  1. Copie a consulta a seguir no Editor de consultas:
SELECT first_name, last_name, team_name, sum(points) as total_points FROM `bigquery-public-data.ncaa_basketball.mbb_players_games_sr` group by first_name, last_name, team_name order by total_points desc;

Essa consulta vai retornar uma linha para cada jogador, o respectivo time e a soma de pontos em todas as partidas jogadas.

  1. Clique em Executar.

Agora, você precisa descobrir quais são os 10 jogadores com a maior pontuação em uma única partida.

  1. Copie a consulta a seguir no Editor de consultas:
WITH rankings AS ( SELECT RANK() OVER (ORDER BY points DESC) AS ranking, first_name, last_name, team_name, points FROM `bigquery-public-data.ncaa_basketball.mbb_players_games_sr` ) SELECT ranking , first_name, last_name, team_name, points FROM rankings WHERE ranking<=10 ORDER BY ranking;

Essa consulta vai retornar as informações sobre os 10 principais jogadores de basquete da NCAA de acordo com os pontos que marcaram nas partidas e classificá-los em ordem, do número 1 ao 10.

Observe que essa consulta tem duas instruções SELECT. A primeira instrução SELECT cria uma tabela temporária intitulada "rankings". A segunda seleciona as colunas a seguir na tabela "rankings".

A função RANK() é usada para atribuir uma classificação a cada jogador com base no número de pontos.

  1. Clique em Executar.
Observação: mais uma vez, você pode analisar o resultado usando o Looker Studio clicando em Explorar dados e selecionando Explorar com o Looker Studio. Observação: os resultados mostram que há jogadores com o mesmo número de pontos e que a função RANK() atribui a mesma classificação nesses casos.

Sempre que você classifica um valor que inclui empates, é bom saber a diferença entre ROW_NUMBER, DENSE_RANK e RANK.

  • ROW_NUMBER() ignora empates. Isso pode ser útil se você quiser retornar arbitrariamente os 10 principais jogadores.
  • DENSE_RANK() e RANK() terão classificações diferentes com base nos empates.
  • DENSE_RANK() não pula nenhum número, então essa função mostraria 1, 2, 2, 3.
  • RANK() pula números, então o resultado seria 1, 2, 2, 4.

Clique em Verificar meu progresso para confirmar que você concluiu a tarefa corretamente.

Analisar o conjunto de dados público NCAA Basketball

Conclusão

Bom trabalho!

Como analista de dados em nuvem da TheLook eCommerce, você forneceu os dados necessários para a equipe de marketing lançar a primeira fase de uma campanha publicitária incrível com jogadores de basquete da NCAA que promove roupas de banho.

Ao acessar e filtrar as tabelas no conjunto de dados thelook_gcda, você conseguiu as informações sobre produtos do setor de roupas de banho vendidos em junho de 2023.

Você também filtrou o conjunto de dados público ncaa_basketball para recuperar informações sobre os jogadores de basquete que mais marcaram cestas.

Com essas informações, a equipe de marketing poderá tomar decisões bem informadas sobre quais produtos destacar na campanha publicitária e quais jogadores de alta performance convidar para serem modelos do produto.

Agora você sabe como usar ferramentas poderosas na nuvem para analisar dados. Parabéns!

Finalize o laboratório

Antes de encerrar o laboratório, certifique-se de que você concluiu todas as tarefas. Quando tudo estiver pronto, clique em Terminar o laboratório e depois em Enviar.

Depois que você finalizar um laboratório, não será mais possível acessar o ambiente do laboratório nem o trabalho que você concluiu nele.

Copyright 2024 Google LLC. Todos os direitos reservados. Google e o logotipo do Google são marcas registradas da Google LLC. Todos os outros nomes de empresas e produtos podem ser marcas registradas das empresas a que estão associados.