arrow_back

Como criar uma malha de dados com o Dataplex: laboratório com desafio

Acesse mais de 700 laboratórios e cursos

Como criar uma malha de dados com o Dataplex: laboratório com desafio

Laboratório 1 hora 30 minutos universal_currency_alt 1 crédito show_chart Introdutório
info Este laboratório pode incorporar ferramentas de IA para ajudar no seu aprendizado.
Acesse mais de 700 laboratórios e cursos

GSP514

Logotipo dos laboratórios autoguiados do Google Cloud

Informações gerais

Nos laboratórios com desafio, apresentamos uma situação e um conjunto de tarefas. Para concluí-las, em vez de seguir instruções detalhadas, você usará o que aprendeu nos laboratórios do curso. Um sistema automático de pontuação (mostrado nesta página) vai avaliar seu desempenho.

Nos laboratórios com desafio, não ensinamos novos conceitos do Google Cloud. O objetivo dessas tarefas é aprimorar aquilo que você já aprendeu, como a alteração de valores padrão ou a leitura e pesquisa de mensagens para corrigir seus próprios erros.

Para alcançar a pontuação de 100%, você precisa concluir todas as tarefas no tempo definido.

Este laboratório é recomendado para quem se inscreveu no curso com o selo de habilidade Como criar uma malha de dados com o Dataplex. Tudo pronto para começar o desafio?

Configuração e requisitos

Antes de clicar no botão Começar o Laboratório

Leia estas instruções. Os laboratórios são cronometrados e não podem ser pausados. O timer é ativado quando você clica em Iniciar laboratório e mostra por quanto tempo os recursos do Google Cloud vão ficar disponíveis.

Este laboratório prático permite que você realize as atividades em um ambiente real de nuvem, e não em uma simulação ou demonstração. Você vai receber novas credenciais temporárias para fazer login e acessar o Google Cloud durante o laboratório.

Confira os requisitos para concluir o laboratório:

  • Acesso a um navegador de Internet padrão (recomendamos o Chrome).
Observação: para executar este laboratório, use o modo de navegação anônima (recomendado) ou uma janela anônima do navegador. Isso evita conflitos entre sua conta pessoal e de estudante, o que poderia causar cobranças extras na sua conta pessoal.
  • Tempo para concluir o laboratório: não se esqueça que, depois de começar, não será possível pausar o laboratório.
Observação: use apenas a conta de estudante neste laboratório. Se usar outra conta do Google Cloud, você poderá receber cobranças nela.

Cenário do desafio

Você começou a trabalhar como engenheiro de dados júnior, onde ajuda as equipes a criar e gerenciar os recursos do Dataplex.

Você precisa ter conhecimento suficiente para realizar essas tarefas.

Seu desafio

Você precisa ajudar uma nova equipe de desenvolvimento a criar uma malha de dados usando o Dataplex. Mais especificamente, um lake do Dataplex com várias zonas e recursos. Você também precisa criar tipos de aspectos e adicioná-los a recursos do novo lake, além de avaliar a qualidade de dados. Você recebeu um pedido para concluir as seguintes tarefas:

  • Criar um lake do Dataplex com duas zonas e dois recursos
  • Criar um tipo de aspecto de dados protegidos e adicioná-lo a uma zona
  • Atribuir um papel do IAM do Dataplex a outro usuário
  • Criar e fazer upload de um arquivo de especificação de qualidade de dados no Cloud Storage
  • Definir e executar um job de qualidade de dados no Dataplex

Você precisa seguir estes padrões:

  • Confirmar se as APIs necessárias (como Dataplex, Data Catalog e Dataproc) foram ativadas corretamente
  • Criar todos os recursos na região, a menos que haja uma instrução diferente

As tarefas estão descritas abaixo em detalhes. Boa sorte!

Tarefa 1: criar um lake do Dataplex com duas zonas e dois recursos

Observação: crie os recursos na região para todas as tarefas neste laboratório com desafio, a menos que receba uma instrução diferente.

O bucket do Cloud Storage e o conjunto de dados do BigQuery para a etapa 2 foram pré-criados neste laboratório.

  1. Crie um lake do Dataplex chamado Lake de vendas com duas zonas regionais:
  • Uma zona de originais chamada Zona de originais do cliente
  • Uma zona de curadoria com o nome Zona de curadoria do cliente
  1. Anexe um recurso pré-criado a cada zona:
  • Na zona de originais, anexe o bucket do Cloud Storage com o nome -customer-online-sessions como um novo recurso chamado Engajamentos do cliente.
  • Na zona de curadoria, anexe o conjunto de dados do BigQuery com o nome .customer_orders como um novo recurso chamado Pedidos do cliente.

Dica para criar um lake do Dataplex:

Clique em Verificar meu progresso para conferir o objetivo. Criar um lake do Dataplex com duas zonas e dois recursos

Tarefa 2: criar um tipo de aspecto e adicioná-lo a uma zona

  1. Crie um tipo de aspecto chamado Aspecto de dados protegidos do cliente com dois campos enumerados:
  • O primeiro será chamado de Flag de dados brutos e terá dois valores: Sim e Não.
  • O segundo campo será chamado Flag de informações de contatos protegidos e terá dois valores: Sim e Não.
  1. Adicione esse aspecto à Zona de originais do cliente usando o valor Sim em ambas as flags.

Dica para criar e aplicar tipos de aspecto:

Clique em Verificar meu progresso para conferir o objetivo. Criar um tipo de aspecto e adicioná-lo a uma zona

Tarefa 3: atribuir um papel do IAM do Dataplex a outro usuário

  • Usando o princípio de privilégio mínimo, atribua o papel apropriado do IAM do Dataplex ao Usuário 2 () que permita fazer upload de novos arquivos do Cloud Storage no recurso do Dataplex chamado Engajamentos do cliente.

Dica para atribuir papéis do IAM do Dataplex:

Clique em Verificar meu progresso para conferir o objetivo. Atribuir um papel do IAM do Dataplex a outro usuário

Tarefa 4: criar e fazer upload de um arquivo de especificação de qualidade de dados no Cloud Storage

O bucket do Cloud Storage para a etapa 2 foi pré-criado neste laboratório.

  1. Crie um arquivo de especificação de qualidade de dados chamado dq-customer-orders.yaml com estas especificações:
  • A regra NOT NULL aplicada (com um limite de 100%) à coluna user_id da tabela customer_orders.ordered_items
  • A regra NOT NULL aplicada (com um limite de 100%) à coluna order_id da tabela customer_orders.ordered_items
  • Tabela de destino do BigQuery para os resultados: .orders_dq_dataset.results
  1. Faça upload do arquivo no bucket do Cloud Storage denominado -dq-config.

Dica para criar arquivos de especificação de qualidade de dados:

Clique em Verificar meu progresso para conferir o objetivo. Criar e fazer upload de um arquivo de especificação de qualidade de dados

Tarefa 5: definir e executar um job de qualidade de dados automático no Dataplex

O conjunto de dados do BigQuery para a etapa 1 foi pré-criado neste laboratório.

  1. Defina um job de qualidade de dados usando o arquivo dq-customer-orders.yaml com estas especificações:
Propriedade Valor
Nome do job de qualidade de dados customer-orders-data-quality-job
Dados de origem .customer_orders.ordered_items
Conta de serviço de usuário Conta de serviço padrão do Compute Engine
  1. Execute o job de qualidade de dados imediatamente.
Pode levar vários minutos para esse processo ser concluído. Talvez você precise atualizar a página para verificar se ele foi executado com êxito.

Dica para definir e executar jobs de qualidade de dados:

Clique em Verificar meu progresso para conferir o objetivo. Definir e executar um job de qualidade de dados no Dataplex

Parabéns!

Você criou uma malha de dados usando um lake do Dataplex com várias zonas e recursos, criando um tipo de aspecto e adicionando-o a um recurso, além de avaliar a qualidade dos dados.

Selo "Como criar uma malha de dados com o Dataplex"

Conquiste seu próximo selo de habilidade

Este laboratório autoguiado faz parte do selo de habilidade Como criar uma malha de dados com o Dataplex. Ao concluir o curso, você ganha o selo acima como reconhecimento pela sua conquista. Compartilhe o selo no seu currículo e nas redes sociais e use #GoogleCloudBadge para anunciar sua conquista.

Este selo de habilidade faz parte do programa de aprendizado Data Engineer do Google Cloud. Se você já completou outros cursos com selo de habilidade nesse programa de aprendizado, confira no catálogo outras opções disponíveis.

Treinamento e certificação do Google Cloud

Esses treinamentos ajudam você a aproveitar as tecnologias do Google Cloud ao máximo. Nossas aulas incluem habilidades técnicas e práticas recomendadas para ajudar você a alcançar rapidamente o nível esperado e continuar sua jornada de aprendizado. Oferecemos treinamentos que vão do nível básico ao avançado, com opções de aulas virtuais, sob demanda e por meio de transmissões ao vivo para que você possa encaixá-las na correria do seu dia a dia. As certificações validam sua experiência e comprovam suas habilidades com as tecnologias do Google Cloud.

Manual atualizado em 4 de setembro de 2025.

Laboratório testado em 4 de setembro de 2025.

Copyright 2025 Google LLC. Todos os direitos reservados. Google e o logotipo do Google são marcas registradas da Google LLC. Todos os outros nomes de produtos e empresas podem ser marcas registradas das respectivas empresas a que estão associados.

Antes de começar

  1. Os laboratórios criam um projeto e recursos do Google Cloud por um período fixo
  2. Os laboratórios têm um limite de tempo e não têm o recurso de pausa. Se você encerrar o laboratório, vai precisar recomeçar do início.
  3. No canto superior esquerdo da tela, clique em Começar o laboratório

Usar a navegação anônima

  1. Copie o nome de usuário e a senha fornecidos para o laboratório
  2. Clique em Abrir console no modo anônimo

Fazer login no console

  1. Faça login usando suas credenciais do laboratório. Usar outras credenciais pode causar erros ou gerar cobranças.
  2. Aceite os termos e pule a página de recursos de recuperação
  3. Não clique em Terminar o laboratório a menos que você tenha concluído ou queira recomeçar, porque isso vai apagar seu trabalho e remover o projeto

Este conteúdo não está disponível no momento

Você vai receber uma notificação por e-mail quando ele estiver disponível

Ótimo!

Vamos entrar em contato por e-mail se ele ficar disponível

Um laboratório por vez

Confirme para encerrar todos os laboratórios atuais e iniciar este

Use a navegação anônima para executar o laboratório

Para executar este laboratório, use o modo de navegação anônima ou uma janela anônima do navegador. Isso evita conflitos entre sua conta pessoal e a conta de estudante, o que poderia causar cobranças extras na sua conta pessoal.