Checkpoints
Explore thelook_ecommerce public dataset
/ 50
Explore NCAA Basketball public dataset
/ 50
Acessar o BigQuery
Conclua este laboratório prático usando um computador ou notebook.
Só 5 tentativas são permitidas por laboratório.
É comum não acertar todas as questões na primeira tentativa e precisar refazer uma tarefa. Isso faz parte do processo de aprendizado.
Depois que o laboratório é iniciado, não é possível pausar o tempo. Depois de 1h30, o laboratório será finalizado, e você vai precisar recomeçar.
Para saber mais, confira as Dicas técnicas do laboratório.
Informações gerais da atividade
A análise de dados em nuvem usa uma série de ferramentas que podem ajudar em cada fase do processo de análise. Entre elas, podemos destacar duas ferramentas conhecidas e poderosas que funcionam com muitas das principais plataformas de nuvem: o BigQuery e o Looker.
O BigQuery é um data warehouse empresarial totalmente gerenciado que ajuda a gerenciar e analisar dados usando a interface do console do Google Cloud. Com ele, você pode usar consultas SQL para recuperar, limpar e organizar dados, garantindo que você tenha os dados de qualidade necessários para gerar relatórios e análises. Também é possível usar o BigQuery para criar consultas SQL que combinam dados de várias tabelas usando JOINs.
Já o Looker é uma plataforma de Business Intelligence (BI) que ajuda a conhecer, analisar, visualizar e compartilhar seus dados. Compondo a plataforma do Looker e sendo facilmente acessível na interface do BigQuery, o Looker Studio é uma ferramenta que transforma seus dados em painéis e relatórios informativos e totalmente personalizáveis.
Neste laboratório, você vai conhecer dois conjuntos de dados no BigQuery e executar consultas SQL para filtrar os dados. Depois, você vai analisar os resultados visualizados usando o Looker Studio.
Cenário
Parabéns! Você agora é analista de dados na TheLook eCommerce, uma empresa global que vende produtos de vestuário em lojas físicas e canais digitais, incluindo um site próprio, um app para dispositivos móveis próprio e vários apps de redes sociais de terceiros. A TheLook eCommerce está crescendo rapidamente graças à grande variedade de estilos de roupas da empresa, o foco em inovação e o compromisso com a escolha de fornecedores éticos e sustentáveis.
A TheLook eCommerce está planejando uma campanha publicitária mostrando os jogadores de basquete universitário que mais marcam cestas na National Collegiate Athletic Association (NCAA) usando os produtos da empresa. Martina, a gerente de marketing, quer que a primeira fase da campanha promova roupas de banho.
Para identificar os produtos desse tipo mais vendidos em junho, historicamente o mês com mais vendas no setor de roupas de banho para a empresa, Martina pede para você gerar um relatório com os dados de vendas da categoria de roupas de banho em junho de 2023. Para determinar quais atletas serão destacados na campanha, você vai usar o conjunto de dados público da NCAA para gerar um relatório com os jogadores de basquete que mais marcam cestas.
Saiba como fazer isso: primeiro acesse as tabelas no conjunto de dados thelook_gcda. Em seguida, filtre os dados para recuperar as informações sobre roupas de banho vendidas nos últimos 30 dias. Terceiro, acesse as tabelas no conjunto de dados público ncaa_basketball. Por fim, filtre os dados para recuperar as informações sobre os 10 jogadores que mais marcam cestas.
Configuração
Antes de clicar em "Começar o laboratório"
Leia as instruções a seguir. Os laboratórios são cronometrados e não podem ser pausados. O timer é iniciado quando você clica em Começar o laboratório e mostra por quanto tempo os recursos do Google Cloud vão ficar disponíveis.
Neste laboratório prático, você pode fazer as atividades por conta própria em um ambiente cloud de verdade, não em uma simulação ou demonstração. Você vai receber novas credenciais temporárias para fazer login e acessar o Google Cloud durante o laboratório.
Confira os requisitos para concluir o laboratório:
- Acesso a um navegador de Internet padrão (recomendamos o Chrome).
- Tempo para concluir o laboratório---não se esqueça: depois de começar, não será possível pausar o laboratório.
Como iniciar seu laboratório e fazer login no console do Google Cloud
-
Clique no botão Começar o laboratório. No painel Detalhes do laboratório à esquerda, você verá o seguinte:
- Tempo restante
- O botão Abrir console do Google Cloud
- As credenciais temporárias que você vai usar neste laboratório
- Outras informações, se forem necessárias
Observação: se for preciso pagar pelo laboratório, um pop-up vai aparecer para você escolher a forma de pagamento. -
Se você estiver usando o navegador Chrome, clique em Abrir console do Google Cloud (ou clique com o botão direito do mouse e selecione Abrir link em uma janela anônima). A página de login será aberta em uma nova guia do navegador.
Dica: é possível organizar as guias em janelas separadas, lado a lado, para alternar facilmente entre elas.
Observação: se a caixa de diálogo Escolha uma conta aparecer, clique em Usar outra conta. -
Se necessário, copie o Nome de usuário do Google Cloud abaixo e cole na caixa de diálogo de login. Clique em Próximo.
Você também encontra o Nome de usuário do Google Cloud no painel Detalhes do laboratório.
- Copie a Senha do Google Cloud abaixo e cole na caixa de diálogo seguinte. Clique em Próximo.
Você também encontra a Senha do Google Cloud no painel Detalhes do laboratório.
- Nas próximas páginas:
- Aceite os Termos e Condições
- Não adicione opções de recuperação nem autenticação de dois fatores nesta conta temporária
- Não se inscreva em testes gratuitos
Depois de alguns instantes, o console será aberto nesta guia.
Tarefa 1: acesse o conjunto de dados thelook_gcda
Nesta tarefa, você vai acessar o conjunto de dados thelook_gcda e as tabelas contidas nele. Depois, você vai executar uma consulta que une duas tabelas e recupera os dados sobre as roupas de banho vendidas em junho de 2023.
- No Menu de navegação do console do Google Cloud (), clique em BigQuery > BigQuery Studio.
- No campo de pesquisa do Explorador, digite thelook e pressione ENTER.
- Selecione o conjunto de dados thelook_gcda.
- No painel Explorador, expanda o conjunto de dados thelook_gcda. As tabelas desse conjunto de dados serão exibidas. Pode ser necessário rolar a tela para acessar a lista completa de tabelas.
Nesta parte da tarefa, você vai analisar os produtos vendidos em junho de 2023.
- Selecione a tabela products. O esquema da tabela será exibido.
- Selecione a guia Visualização para analisar os dados. Cada produto contém um identificador exclusivo na coluna "id".
Agora, analise as tabelas order_items e product. Para determinar quantos produtos foram vendidos na categoria de roupas de banho em junho de 2023, essas duas tabelas precisam ser unidas por uma coluna em comum.
- No Editor de consultas, clique no ícone Escrever nova consulta (+) para abrir uma nova guia Sem título em que a consulta será executada.
- Copie e cole o seguinte comando na guia Sem título:
- Clique em Executar.
Essa consulta vai unir as tabelas order_items e product e retornar todos os pedidos relacionados a roupas de banho que não foram devolvidos ou cancelados em junho de 2023.
Por fim, analise os resultados usando o Looker Studio.
- Clique em Explorar dados no painel "Resultados da consulta" e selecione Explorar com o Looker Studio.
Clique em Verificar meu progresso para confirmar que você concluiu a tarefa corretamente.
Tarefa 2: acesse o conjunto de dados público NCAA Basketball
Nesta tarefa, você vai acessar o conjunto de dados ncaa_basketball e as tabelas contidas nele. Depois, você vai executar uma consulta para recuperar os dados sobre os jogadores de basquete que mais marcam cestas na NCAA. Por fim, você vai executar uma consulta que classifica os 10 jogadores que mais marcam cestas em uma única partida.
- Se você ainda não está no BigQuery Studio, clique em BigQuery > BigQuery Studio no menu de navegação () do console do Google Cloud,
- Na barra do Explorador, clique em + Adicionar para adicionar uma fonte de dados ao projeto.
- Na página Adicionar, na lista Fontes adicionais, selecione Conjuntos de dados públicos. A página do Marketplace será exibida.
- No campo de pesquisa, digite ncaa e pressione ENTER.
- Selecione o conjunto de dados NCAA Basketball.
- Na página Detalhes do produto, clique em Ver conjunto de dados para conferir o esquema de dados detalhado desse conjunto de dados público do BigQuery.
- No painel Explorador, expanda o conjunto de dados ncaa_basketball. As tabelas desse conjunto de dados serão exibidas.
Primeiro, você precisa somar todos os pontos acumulados pelos jogadores em todas as partidas.
- Confira uma prévia de cada uma dessas tabelas no conjunto de dados ncaa_basketball.
- Selecione a tabela mbb_players_games_sr. Quais colunas você acha que serão úteis para encontrar os jogadores com o maior número de pontos?
Cada linha em mbb_players_games_sr apresenta os resultados de cada jogador e de cada partida jogada. Para reunir o número total de pontos do jogador por partida, será preciso executar uma consulta para resumir os dados em todas as partidas.
- Copie a consulta a seguir no Editor de consultas:
Essa consulta vai retornar uma linha para cada jogador, o respectivo time e a soma de pontos em todas as partidas jogadas.
- Clique em Executar.
Agora, você precisa descobrir quais são os 10 jogadores com a maior pontuação em uma única partida.
- Copie a consulta a seguir no Editor de consultas:
Essa consulta vai retornar as informações sobre os 10 principais jogadores de basquete da NCAA de acordo com os pontos que marcaram nas partidas e classificá-los em ordem, do número 1 ao 10.
Observe que essa consulta tem duas instruções SELECT
. A primeira instrução SELECT
cria uma tabela temporária intitulada "rankings". A segunda seleciona as colunas a seguir na tabela "rankings".
A função RANK()
é usada para atribuir uma classificação a cada jogador com base no número de pontos.
- Clique em Executar.
Sempre que você classifica um valor que inclui empates, é bom saber a diferença entre ROW_NUMBER, DENSE_RANK e RANK.
- ROW_NUMBER() ignora empates. Isso pode ser útil se você quiser retornar arbitrariamente os 10 principais jogadores.
- DENSE_RANK() e RANK() terão classificações diferentes com base nos empates.
- DENSE_RANK() não pula nenhum número, então essa função mostraria 1, 2, 2, 3.
- RANK() pula números, então o resultado seria 1, 2, 2, 4.
Clique em Verificar meu progresso para confirmar que você concluiu a tarefa corretamente.
Conclusão
Bom trabalho!
Como analista de dados em nuvem da TheLook eCommerce, você forneceu os dados necessários para a equipe de marketing lançar a primeira fase de uma campanha publicitária incrível com jogadores de basquete da NCAA que promove roupas de banho.
Ao acessar e filtrar as tabelas no conjunto de dados thelook_gcda, você conseguiu as informações sobre produtos do setor de roupas de banho vendidos em junho de 2023.
Você também filtrou o conjunto de dados público ncaa_basketball para recuperar informações sobre os jogadores de basquete que mais marcaram cestas.
Com essas informações, a equipe de marketing poderá tomar decisões bem informadas sobre quais produtos destacar na campanha publicitária e quais jogadores de alta performance convidar para serem modelos do produto.
Agora você sabe como usar ferramentas poderosas na nuvem para analisar dados. Parabéns!
Finalize o laboratório
Antes de encerrar o laboratório, certifique-se de que você concluiu todas as tarefas. Quando tudo estiver pronto, clique em Terminar o laboratório e depois em Enviar.
Depois que você finalizar um laboratório, não será mais possível acessar o ambiente do laboratório nem o trabalho que você concluiu nele.
Copyright 2024 Google LLC. Todos os direitos reservados. Google e o logotipo do Google são marcas registradas da Google LLC. Todos os outros nomes de empresas e produtos podem ser marcas registradas das empresas a que estão associados.