GSP1143

Informações gerais
O Dataplex Universal Catalog é a malha de dados inteligente que as organizações usam para conhecer, gerenciar, monitorar e supervisionar em um só lugar os dados de data lakes, data warehouses e data marts, permitindo análises em larga escala. Especificamente, é possível usar o Dataplex Universal Catalog para criar uma arquitetura de malha de dados, que é uma abordagem organizacional e técnica que descentraliza a propriedade dos dados entre os proprietários dos dados do domínio.
O Dataplex Universal Catalog oferece um gerenciamento que não exige movimentação ou cópia de dados. Conforme você adiciona novos recursos de dados, o Dataplex Universal Catalog coleta os metadados de dados estruturados e não estruturados e os registra automaticamente em um metastore unificado e seguro. Os dados e os metadados podem então ser avaliados por serviços do Google Cloud, como o Data Catalog e o BigQuery.
Neste laboratório, você vai aprender a produzir sua própria malha de dados com a criação e remoção de lakes, zonas e recursos no Dataplex Universal Catalog usando o console do Google Cloud.
Atividades deste laboratório
- Ativar a API Dataplex
- Criar um lake
- Adicionar uma zona a um lake
- Anexar e remover recursos
- Excluir zonas e lakes
Configuração e requisitos
Antes de clicar no botão Começar o Laboratório
Leia estas instruções. Os laboratórios são cronometrados e não podem ser pausados. O timer é ativado quando você clica em Iniciar laboratório e mostra por quanto tempo os recursos do Google Cloud vão ficar disponíveis.
Este laboratório prático permite que você realize as atividades em um ambiente real de nuvem, e não em uma simulação ou demonstração. Você vai receber novas credenciais temporárias para fazer login e acessar o Google Cloud durante o laboratório.
Confira os requisitos para concluir o laboratório:
- Acesso a um navegador de Internet padrão (recomendamos o Chrome).
Observação: para executar este laboratório, use o modo de navegação anônima (recomendado) ou uma janela anônima do navegador. Isso evita conflitos entre sua conta pessoal e de estudante, o que poderia causar cobranças extras na sua conta pessoal.
- Tempo para concluir o laboratório: não se esqueça que, depois de começar, não será possível pausar o laboratório.
Observação: use apenas a conta de estudante neste laboratório. Se usar outra conta do Google Cloud, você poderá receber cobranças nela.
Como iniciar seu laboratório e fazer login no console do Google Cloud
-
Clique no botão Começar o laboratório. Se for preciso pagar por ele, uma caixa de diálogo vai aparecer para você selecionar a forma de pagamento.
No painel Detalhes do Laboratório, à esquerda, você vai encontrar o seguinte:
- O botão Abrir Console do Google Cloud
- O tempo restante
- As credenciais temporárias que você vai usar neste laboratório
- Outras informações, se forem necessárias
-
Se você estiver usando o navegador Chrome, clique em Abrir console do Google Cloud ou clique com o botão direito do mouse e selecione Abrir link em uma janela anônima.
O laboratório ativa os recursos e depois abre a página Fazer Login em outra guia.
Dica: coloque as guias em janelas separadas lado a lado.
Observação: se aparecer a caixa de diálogo Escolher uma conta, clique em Usar outra conta.
-
Se necessário, copie o Nome de usuário abaixo e cole na caixa de diálogo Fazer login.
{{{user_0.username | "Username"}}}
Você também encontra o nome de usuário no painel Detalhes do Laboratório.
-
Clique em Próxima.
-
Copie a Senha abaixo e cole na caixa de diálogo de Olá.
{{{user_0.password | "Password"}}}
Você também encontra a senha no painel Detalhes do Laboratório.
-
Clique em Próxima.
Importante: você precisa usar as credenciais fornecidas no laboratório, e não as da sua conta do Google Cloud.
Observação: se você usar sua própria conta do Google Cloud neste laboratório, é possível que receba cobranças adicionais.
-
Acesse as próximas páginas:
- Aceite os Termos e Condições.
- Não adicione opções de recuperação nem autenticação de dois fatores (porque essa é uma conta temporária).
- Não se inscreva em testes gratuitos.
Depois de alguns instantes, o console do Google Cloud será aberto nesta guia.
Observação: para acessar os produtos e serviços do Google Cloud, clique no Menu de navegação ou digite o nome do serviço ou produto no campo Pesquisar.
Ativar a API Cloud Dataplex
-
No console do Google Cloud, insira API Cloud Dataplex na barra de pesquisa da parte de cima.
-
Clique no resultado para API Cloud Dataplex no Marketplace.
-
Clique em ATIVAR.
Tarefa 1: criar um lake
No Dataplex Universal Catalog, um lake é o domínio organizacional mais elevado que representa uma área de dados ou unidade de negócios específica. Por exemplo, é possível criar um lake para cada departamento ou domínio de dados da sua organização. Dessa forma, é possível organizar e fornecer dados para grupos de usuários específicos.
Nesta tarefa, você cria um lake para começar a criar uma malha de dados.
- No console do Google Cloud, selecione Menu de navegação (
) > Ver todos os produtos. Em Analytics, selecione Dataplex Universal Catalog.
Se a mensagem Welcome to the new Dataplex Universal Catalog experience
aparecer, clique em Fechar.
-
Em Gerenciar lakes, clique em Gerenciar.
-
Clique em +Criar lake.
-
Insira as informações necessárias para criar um lake:
Propriedade |
Valor |
Nome de exibição |
sensors |
ID |
Mantenha o valor padrão. |
Região |
|
Não mude os outros valores.
- Clique em Criar.
A criação do lake pode levar até três minutos.
Clique em Verificar meu progresso para conferir o objetivo.
Criar sensores de data lake
Tarefa 2: adicionar uma zona a um lake
Depois da criação de um lake, é possível adicionar zonas a ele. Zonas são subdomínios dentro de um lake que podem ser usados para categorizar ainda mais os dados. Por exemplo, é possível categorizar os dados por estágio, uso ou restrições.
Há dois tipos de zonas:
- As zonas brutas contêm dados em formatos brutos (como arquivos em buckets do Cloud Storage) e não estão sujeitas a verificações de tipo rigorosas.
- As zonas selecionadas contêm dados limpos, formatados e prontos para análise, como tabelas do BigQuery.
Nesta tarefa, você vai criar uma zona de originais para trabalhar com arquivos em um bucket do Cloud Storage.
-
Na guia Gerenciar, clique no nome do seu lake.
-
Clique em +Adicionar zona.
-
Insira as informações necessárias para criar uma nova zona:
Propriedade |
Valor |
Nome de exibição |
temperature raw data |
ID |
Mantenha o valor padrão. |
Tipo |
Zona de originais |
Locais dos dados |
Regional |
Não mude os outros valores.
Por exemplo, a opção Ativar descoberta de metadados em Configurações de descoberta está ativada por padrão e permite que usuários autorizados descubram os dados na zona.
- Clique em Criar.
Pode levar até dois minutos para a criação da zona.
Realize a próxima tarefa quando o status da zona for Ativo.
Clique em Verificar meu progresso para conferir o objetivo.
Adicionar dados brutos de temperatura da zona aos sensores do lake
Tarefa 3: anexar um recurso a uma zona
Os dados armazenados em buckets do Cloud Storage ou em conjuntos de dados do BigQuery podem ser anexados como recursos a zonas em um lake do Dataplex Universal Catalog.
Nesta tarefa, você anexa um bucket do Cloud Storage criado no console do Google Cloud.
-
Na guia Zonas, clique no nome da sua zona.
-
Na guia Recursos, clique em +ADICIONAR RECURSO.
-
Clique em +ADICIONAR UM RECURSO.
-
Insira as informações necessárias para anexar um novo recurso:
Propriedade |
Valor |
Tipo |
Bucket de armazenamento |
Nome de exibição |
measurements |
ID |
Mantenha o valor padrão. |
Não mude os outros valores.
- Em Bucket, clique em Procurar.
É possível anexar um bucket atual do Cloud Storage ou criar um novo sem sair do Dataplex Universal Catalog. Nas próximas etapas, você vai criar um novo bucket do Cloud Storage e anexá-lo à zona.
-
Clique em +Criar novo bucket (
).
-
Forneça o ID do projeto como nome do bucket () e clique em Continuar.
-
Em Tipo de local, selecione Região e selecione .
Não altere os valores.
- Clique em Criar.
Se a mensagem O acesso público será bloqueado
aparecer, clique em Confirmar.
-
Clique em Selecionar para selecionar o bucket que você acabou de criar e clique em Continuar.
-
Em Configurações de descoberta, selecione Herdar para herdar as configurações de descoberta no nível da zona e clique em Continuar.
-
Clique em Enviar.
Clique em Verificar meu progresso para conferir o objetivo.
Crie um bucket do Cloud Storage e anexe medições de recurso aos dados brutos de temperatura da zona
Tarefa 4: excluir recursos, zonas e lakes
Para excluir um lake, é preciso primeiro remover os recursos e depois excluir as zonas.
Nesta tarefa, você vai remover o recurso da zona, excluir a zona e, por último, eliminar o lake.
Remover um recurso
-
No menu à esquerda, clique na guia Gerenciar e depois no nome do lake.
-
Na guia Zonas, clique no nome da sua zona.
-
Na guia Recursos, marque a caixa de seleção à esquerda do nome do recurso.
-
Clique em Excluir recursos.
-
Clique em Excluir para confirmar.
Esta ação exclui os dados subjacentes no bucket do Cloud Storage. Ela impede que o bucket do Cloud Storage possa ser acessado ou detectado com o uso do lake no Dataplex Universal Catalog.
Excluir uma zona
-
No menu à esquerda, clique na guia Gerenciar e depois no nome do lake.
-
Na guia Zonas, marque a caixa de seleção à esquerda do nome da zona.
-
Clique em Excluir zona.
-
Clique em Excluir para confirmar.
Excluir o lake
-
No menu à esquerda, clique na guia Gerenciar e depois no nome do lake.
-
Na parte de cima da página, clique em Excluir.
-
Confirme a exclusão digitando delete na caixa de texto.
-
Clique em Excluir lake para confirmar.
Clique em Verificar meu progresso para conferir o objetivo.
Excluir sensores do lake e recursos aninhados
Parabéns!
Você usou o console do Google Cloud para criar e excluir lakes, zonas e recursos no Dataplex Universal Catalog.
Treinamento e certificação do Google Cloud
Esses treinamentos ajudam você a aproveitar as tecnologias do Google Cloud ao máximo. Nossas aulas incluem habilidades técnicas e práticas recomendadas para ajudar você a alcançar rapidamente o nível esperado e continuar sua jornada de aprendizado. Oferecemos treinamentos que vão do nível básico ao avançado, com opções de aulas virtuais, sob demanda e por meio de transmissões ao vivo para que você possa encaixá-las na correria do seu dia a dia. As certificações validam sua experiência e comprovam suas habilidades com as tecnologias do Google Cloud.
Manual atualizado em 4 de junho de 2025
Laboratório testado em 4 de junho de 2025
Copyright 2025 Google LLC. Todos os direitos reservados. Google e o logotipo do Google são marcas registradas da Google LLC. Todos os outros nomes de produtos e empresas podem ser marcas registradas das respectivas empresas a que estão associados.