arrow_back

Dataplex: Qwik Start - Consola

Acceder Unirse
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

Dataplex: Qwik Start - Consola

Lab 30 minutos universal_currency_alt 1 crédito show_chart Introductorio
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

GSP1143

Labs de autoaprendizaje de Google Cloud

Descripción general

Dataplex es un tejido de datos inteligente que permite a las organizaciones descubrir, administrar, supervisar y controlar de forma centralizada sus datos en todos los data lakes, almacenes de datos y data marts para potenciar la analítica a gran escala. En específico, puedes usar Dataplex para crear una arquitectura de malla de datos, que es un enfoque organizacional y técnico que descentraliza la propiedad de los datos entre los propietarios de datos de dominios.

Dataplex administra los datos de un modo que no requiere movimientos ni duplicación de datos. Cuando agregas nuevos recursos de datos, Dataplex recolecta los metadatos de los datos estructurados y no estructurados y los registra automáticamente en un almacén de metadatos unificado y seguro. Luego, los datos y los metadatos se pueden evaluar con servicios de Google Cloud, como Data Catalog y BigQuery.

En este lab, aprenderás cómo empezar a crear tu propia malla de datos creando y quitando lakes, zonas y recursos en Dataplex con la consola de Google Cloud.

Actividades

  • Habilitar la API de Dataplex
  • Crear un lake
  • Agregar una zona a tu lake
  • Conectar y desconectar recursos
  • Borrar zonas y lakes

Configuración y requisitos

Antes de hacer clic en el botón Comenzar lab

Lee estas instrucciones. Los labs son cronometrados y no se pueden pausar. El cronómetro, que comienza a funcionar cuando haces clic en Comenzar lab, indica por cuánto tiempo tendrás a tu disposición los recursos de Google Cloud.

Este lab práctico te permitirá realizar las actividades correspondientes en un entorno de nube real, no en uno de simulación o demostración. Para ello, se te proporcionan credenciales temporales nuevas que utilizarás para acceder a Google Cloud durante todo el lab.

Para completar este lab, necesitarás lo siguiente:

  • Acceso a un navegador de Internet estándar (se recomienda el navegador Chrome)
Nota: Usa una ventana de navegador privada o de Incógnito para ejecutar este lab. Así evitarás cualquier conflicto entre tu cuenta personal y la cuenta de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.
  • Tiempo para completar el lab: Recuerda que, una vez que comienzas un lab, no puedes pausarlo.
Nota: Si ya tienes un proyecto o una cuenta personal de Google Cloud, no los uses en este lab para evitar cargos adicionales en tu cuenta.

Cómo iniciar su lab y acceder a la consola de Google Cloud

  1. Haga clic en el botón Comenzar lab. Si debe pagar por el lab, se abrirá una ventana emergente para que seleccione su forma de pago. A la izquierda, se encuentra el panel Detalles del lab que tiene estos elementos:

    • El botón Abrir la consola de Google
    • Tiempo restante
    • Las credenciales temporales que debe usar para el lab
    • Otra información para completar el lab, si es necesaria
  2. Haga clic en Abrir la consola de Google. El lab inicia recursos y abre otra pestaña en la que se muestra la página de acceso.

    Sugerencia: Ordene las pestañas en ventanas separadas, una junto a la otra.

    Nota: Si ve el diálogo Elegir una cuenta, haga clic en Usar otra cuenta.
  3. Si es necesario, copie el nombre de usuario del panel Detalles del lab y péguelo en el cuadro de diálogo Acceder. Haga clic en Siguiente.

  4. Copie la contraseña del panel Detalles del lab y péguela en el cuadro de diálogo de bienvenida. Haga clic en Siguiente.

    Importante: Debe usar las credenciales del panel de la izquierda. No use sus credenciales de Google Cloud Skills Boost. Nota: Usar su propia Cuenta de Google podría generar cargos adicionales.
  5. Haga clic para avanzar por las páginas siguientes:

    • Acepte los términos y condiciones.
    • No agregue opciones de recuperación o autenticación de dos factores (esta es una cuenta temporal).
    • No se registre para obtener pruebas gratuitas.

Después de un momento, se abrirá la consola de Cloud en esta pestaña.

Nota: Para ver el menú con una lista de los productos y servicios de Google Cloud, haga clic en el Menú de navegación que se encuentra en la parte superior izquierda de la pantalla. Ícono del menú de navegación

Habilita la API de Cloud Dataplex

  1. En la consola de Google Cloud, ingresa Cloud Dataplex API (API de Cloud Dataplex) en la barra de búsqueda superior.

  2. Haz clic en el resultado de API de Cloud Dataplex en Marketplace.

  3. Haz clic en Habilitar.

Tarea 1: Crea un lake

En Dataplex, un lake es el dominio más alto de la organización que representa un área de datos o una unidad de negocios específicos. Por ejemplo, puedes crear un lake para cada departamento o dominio de datos de tu organización y, así, organizar y proporcionar datos para grupos de usuarios específicos.

En esta tarea, crearás un lake para comenzar a crear una malla de datos.

  1. En el menú de navegación (Menú de navegación) de la consola de Google Cloud, navega a Análisis > Dataplex.

Si aparece el mensaje Te damos la bienvenida a la nueva experiencia de Dataplex, haz clic en Cerrar.

  1. En Administrar lakes, haz clic en Administrar.

  2. Haz clic en Crear lake.

  3. Ingresa la siguiente información requerida para crear un nuevo lake:

Propiedad Valor
Nombre visible sensors
ID Conserva el valor predeterminado.
Región

Conserva los otros valores predeterminados.

  1. Haz clic en Crear.

El lake puede tardar hasta 3 minutos en crearse.

Haz clic en Revisar mi progreso para verificar el objetivo. Crear el data lake sensors

Tarea 2: Agrega una zona a tu lake

Después de crear un lake, puedes agregarle zonas. Las zonas son subdominios en un lake que puedes usar para categorizar más los datos. Por ejemplo, puedes categorizar datos por etapa, uso o restricciones.

Existen dos tipos de zonas:

  • Las zonas sin procesar contienen datos en formatos sin procesar (como archivos en buckets de Cloud Storage) y no están sujetos a verificaciones estrictas de tipos.
  • Las zonas seleccionadas contienen datos limpios, con formato y listos para el análisis, como tablas de BigQuery.

En esta tarea, crearás una zona sin procesar para trabajar con archivos en un bucket de Cloud Storage.

  1. En la pestaña Administrar, haz clic en el nombre de tu lake.

  2. Haz clic en Agregar zona.

  3. Ingresa la siguiente información requerida para crear una nueva zona:

Propiedad Valor
Nombre visible temperature raw data
ID Conserva el valor predeterminado.
Tipo Zona sin procesar
Ubicaciones de los datos Regional

Conserva los otros valores predeterminados.

Por ejemplo, la opción para Habilitar el descubrimiento de metadatos en Configuración de descubrimiento está habilitada de forma predeterminada y les permite a los usuarios autorizados detectar los datos de la zona.

  1. Haz clic en Crear.

La zona puede tardar hasta 2 minutos en crearse.

Podrás realizar la tarea siguiente cuando el estado de la zona sea Activa.

Haz clic en Revisar mi progreso para verificar el objetivo. Agregar la zona temperature raw data al lake sensors

Tarea 3: Conecta un recurso a una zona

Los datos almacenados en buckets de Cloud Storage o los conjuntos de datos de BigQuery se pueden conectar como recursos a zonas en un lake de Dataplex.

En esta tarea, conectarás un bucket de Cloud Storage que creaste en la consola de Google Cloud.

  1. En la pestaña Zonas, haz clic en el nombre de tu zona.

  2. En la pestaña Recursos, haz clic en Agregar recursos.

  3. Haz clic en Agregar un recurso.

  4. Ingresa la siguiente información requerida para conectar un recurso nuevo:

Propiedad Valor
Tipo Bucket de almacenamiento
Nombre visible measurements
ID Conserva el valor predeterminado.

Conserva los otros valores predeterminados.

  1. En Bucket, haz clic en Explorar.

Puedes conectar un bucket de Cloud Storage existente o crear uno nuevo sin salir de Dataplex. En los próximos pasos, crearás un nuevo bucket de Cloud Storage y lo conectarás a la zona.

  1. Haz clic en Crear nuevo bucket (ícono de canasto de compras).

  2. Proporciona el ID del proyecto como nombre del bucket () y, luego, haz clic en Continuar.

  3. En Tipo de ubicación, selecciona Región y, luego, .

Deja los otros valores predeterminados.

  1. Haz clic en Crear.

Si aparece el mensaje Se impedirá el acceso público, haz clic en Confirmar.

  1. Haz clic en Seleccionar para seleccionar el bucket que acabas de crear y, luego, haz clic en Continuar.

  2. En la Configuración de descubrimiento, selecciona Heredar para heredar los parámetros a nivel de la zona y, luego, haz clic en Continuar.

  3. Haz clic en Enviar.

Haz clic en Revisar mi progreso para verificar el objetivo. Crear un bucket de Cloud Storage y conectar el recurso measurements a la zona temperature raw data

Tarea 4: Borra recursos, zonas y lakes

Para borrar un lake, primero debes desconectar los recursos y, luego, borrar las zonas.

En esta tarea, desconectarás el recurso de la zona; luego, borrarás la zona y, por último, borrarás el lake.

Cómo desconectar un recurso

  1. En el menú de la izquierda, haz clic en la pestaña Administrar y luego en el nombre de tu lake.

  2. En la pestaña Zonas, haz clic en el nombre de tu zona.

  3. En la pestaña Recursos, marca la casilla de verificación que está a la izquierda del nombre del recurso.

  4. Haz clic en Borrar recursos.

  5. Haz clic en Borrar para confirmar tu decisión.

No se borrarán los datos subyacentes en el bucket de Cloud Storage. Simplemente ya no se podrá acceder a este bucket (ni será detectable) con el lake en Dataplex.

Cómo borrar una zona

  1. En el menú de la izquierda, haz clic en la pestaña Administrar y luego en el nombre de tu lake.

  2. En la pestaña Zonas, marca la casilla de verificación que está a la izquierda del nombre de la zona.

  3. Haz clic en Borrar la zona.

  4. Haz clic en Borrar para confirmar tu decisión.

Cómo borrar el lake

  1. En el menú de la izquierda, haz clic en la pestaña Administrar y luego en el nombre de tu lake.

  2. Haz clic en Borrar en la parte superior de la página.

  3. Escribe delete en el cuadro de texto para confirmar la eliminación.

  4. Haz clic en Borrar lake para confirmar.

Haz clic en Revisar mi progreso para verificar el objetivo. Borrar el lake sensors y los recursos anidados

¡Felicitaciones!

Usaste la consola de Google Cloud para crear y borrar lakes, zonas y recursos en Dataplex.

Capacitación y certificación de Google Cloud

Recibe la formación que necesitas para aprovechar al máximo las tecnologías de Google Cloud. Nuestras clases incluyen habilidades técnicas y recomendaciones para ayudarte a avanzar rápidamente y a seguir aprendiendo. Para que puedas realizar nuestros cursos cuando más te convenga, ofrecemos distintos tipos de capacitación de nivel básico a avanzado: a pedido, presenciales y virtuales. Las certificaciones te ayudan a validar y demostrar tus habilidades y tu conocimiento técnico respecto a las tecnologías de Google Cloud.

Actualización más reciente del manual: 20 de septiembre de 2023

Prueba más reciente del lab: 20 de septiembre de 2023

Copyright 2024 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.