
Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
- On the top left of your screen, click Start lab to begin
Create the connection resource
/ 20
Set up access to a Cloud Storage data lake
/ 30
Create the BigLake table
/ 20
Create the external table
/ 10
Update external table to Biglake table
/ 20
BigLake es un motor de almacenamiento unificado que simplifica el acceso a los datos para almacenes de datos y data lakes a través de un control de acceso uniforme y detallado en el almacenamiento en múltiples nubes y formatos abiertos.
BigLake extiende la seguridad detallada de BigQuery a nivel de filas y de columnas a las tablas en almacenes de objetos residentes de datos, como Amazon S3, Azure Data Lake Storage Gen2 y Google Cloud Storage. BigLake separa el acceso a la tabla de los datos subyacentes de Cloud Storage a través de la delegación de acceso. Esta función te ayuda a otorgar acceso de forma segura a nivel de fila y de columna a los usuarios y las canalizaciones de la organización sin proporcionarles acceso completo a la tabla.
Después de crear una tabla de BigLake, puedes consultarla como otras tablas de BigQuery. BigQuery aplica controles de acceso a nivel de fila y columna, y cada usuario ve solo la porción de datos que está autorizado a ver. Las políticas de administración se aplican a todo el acceso a los datos a través de las APIs de BigQuery. Por ejemplo, la API de BigQuery Storage permite a los usuarios acceder a datos autorizados a través de motores de consultas de código abierto, como Apache Spark, como se muestra en el siguiente diagrama:
En este lab, aprenderás a hacer lo siguiente:
Lee estas instrucciones. Los labs cuentan con un temporizador que no se puede pausar. El temporizador, que comienza a funcionar cuando haces clic en Comenzar lab, indica por cuánto tiempo tendrás a tu disposición los recursos de Google Cloud.
Este lab práctico te permitirá realizar las actividades correspondientes en un entorno de nube real, no en uno de simulación o demostración. Para ello, se te proporcionan credenciales temporales nuevas que utilizarás para acceder a Google Cloud durante todo el lab.
Para completar este lab, necesitarás lo siguiente:
Haz clic en el botón Comenzar lab. Si debes pagar por el lab, se abrirá un diálogo para que selecciones la forma de pago. A la izquierda, se encuentra el panel Detalles del lab, que tiene estos elementos:
Haz clic en Abrir la consola de Google Cloud (o haz clic con el botón derecho y selecciona Abrir el vínculo en una ventana de incógnito si ejecutas el navegador Chrome).
El lab inicia recursos y abre otra pestaña en la que se muestra la página de acceso.
Sugerencia: Ordena las pestañas en ventanas separadas, una junto a la otra.
De ser necesario, copia el nombre de usuario a continuación y pégalo en el diálogo Acceder.
También puedes encontrar el nombre de usuario en el panel Detalles del lab.
Haz clic en Siguiente.
Copia la contraseña que aparece a continuación y pégala en el diálogo Te damos la bienvenida.
También puedes encontrar la contraseña en el panel Detalles del lab.
Haz clic en Siguiente.
Haz clic para avanzar por las páginas siguientes:
Después de un momento, se abrirá la consola de Google Cloud en esta pestaña.
Cloud Shell es una máquina virtual que cuenta con herramientas para desarrolladores. Ofrece un directorio principal persistente de 5 GB y se ejecuta en Google Cloud. Cloud Shell proporciona acceso de línea de comandos a tus recursos de Google Cloud.
Haz clic en Activar Cloud Shell en la parte superior de la consola de Google Cloud.
Haz clic para avanzar por las siguientes ventanas:
Cuando te conectes, habrás completado la autenticación, y el proyecto estará configurado con tu Project_ID,
gcloud
es la herramienta de línea de comandos de Google Cloud. Viene preinstalada en Cloud Shell y es compatible con la función de autocompletado con tabulador.
Resultado:
Resultado:
gcloud
, en Google Cloud, consulta la guía con la descripción general de gcloud CLI.
Las tablas de BigLake acceden a los datos de Google Cloud Storage a través de un recurso de conexión. Un recurso de conexión puede estar asociado con una sola tabla o un grupo arbitrario de tablas en el proyecto.
En el menú de navegación, ve a BigQuery > BigQuery Studio. Haz clic en Listo.
Para crear una conexión, haz clic en +AGREGAR y, a continuación, en Conexiones a fuentes de datos externas.
En el campo ID de conexión, ingresa my-connection
.
En Tipo de ubicación, elige Multirregional y selecciona EE.UU. (varias regiones en Estados Unidos) en el menú desplegable.
Haz clic en Crear conexión.
Para ver la información de conexión, selecciona la conexión en el menú de navegación.
Haz clic en Revisar mi progreso para verificar el objetivo.
En esta sección, le otorgarás al recurso de conexión nuevo acceso de solo lectura al data lake de Cloud Storage para que BigQuery pueda acceder a los archivos en nombre de los usuarios. Recomendamos que otorgues a la cuenta de servicio del recurso de conexión el rol de IAM de Visualizador de objetos de Storage, que permite que la cuenta de servicio acceda a los buckets de Cloud Storage.
En el menú de navegación, ve a IAM y administración > IAM.
Haz clic en OTORGAR ACCESO.
En el campo Principales nuevas, ingresa el ID de cuenta de servicio que copiaste antes.
En el campo Seleccionar un rol, elige Cloud Storage y, luego, Visualizador de objetos de Storage.
Haz clic en Revisar mi progreso para verificar el objetivo.
En el siguiente ejemplo, se usa el formato de archivo CSV, pero puedes usar cualquier formato que admita BigLake, como se muestra en Limitaciones. Si conoces la creación de tablas en BigQuery, este proceso debe ser similar. La única diferencia es que debes especificar la conexión de los recursos en la nube asociados.
Si no se proporcionó un esquema y a la cuenta de servicio no se le otorgó acceso al bucket en el paso anterior, este paso fallará con un mensaje de acceso denegado.
Regresa a BigQuery > BigQuery Studio.
Haz clic en los tres puntos que se ubican junto al nombre de tu proyecto y selecciona Crear conjunto de datos.
Para el ID del conjunto de datos, usa demo_dataset
.
En Tipo de ubicación, elige Multirregional y selecciona EE.UU. (varias regiones en Estados Unidos) en el menú desplegable.
Deja el resto de los campos con los valores predeterminados y haz clic en Crear conjunto de datos.
Ahora que creaste un conjunto de datos, puedes copiar un conjunto de datos existente de Cloud Storage a BigQuery.
Haz clic en Explorar para seleccionar el conjunto de datos. Navega al bucket llamado customer.csv
para importarlo a BigQuery, después, haz clic en Seleccionar.
En Destino, verifica que se seleccionó tu proyecto de lab y que estás utilizando el demo_dataset.
Para el nombre de la tabla, utiliza biglake_table
.
Cambia el tipo de tabla a Tabla externa.
Selecciona la casilla para Crear una tabla de BigLake mediante una conexión de Cloud Resource.
Verifica que tu ID de conexión us.my-connection esté seleccionado. Tu configuración debería ser similar a la siguiente:
Haz clic en Revisar mi progreso para verificar el objetivo.
Ahora que creaste la tabla de BigLake, puedes usar cualquier cliente de BigQuery para enviar una consulta.
En la barra de herramientas de vista previa de biglake_table, haz clic en Consultar > En una pestaña nueva.
Ejecuta lo siguiente para consultar la tabla de BigLake a través del editor de BigQuery:
Haz clic en Ejecutar.
Verifica que puedes ver todas las columnas y los datos en la tabla resultante.
Una vez que se crea una tabla de BigLake, se puede administrar de manera similar que las tablas de BigQuery. Para crear políticas de control de acceso para tablas de BigLake, primero crearás una taxonomía de etiquetas de políticas en BigQuery. Luego, debes aplicar las etiquetas de política a las filas o columnas sensibles. En esta sección, crearás una política a nivel de la columna. Para obtener instrucciones para configurar la seguridad a nivel de fila, consulta la guía de seguridad a nivel de fila.
Para este propósito, se crearon para ti una taxonomía de BigQuery llamada
Ahora, usarás la etiqueta de política que creaste para restringir el acceso a determinadas columnas de la tabla de BigQuery. Para este ejemplo, restringirás el acceso a información sensible, como la dirección, el código postal y el número de teléfono.
En el menú de navegación, ve a BigQuery > BigQuery Studio.
Navega a demo-dataset > biglake_table y haz clic en la tabla para abrir la página del esquema de la tabla.
Haz clic en Editar esquema.
Marca las casillas junto a los campos address, postal_code y phone.
Haz clic en Agregar etiqueta de política.
Haz clic en
Haz clic en Seleccionar.
Ahora, tus columnas deben tener adjuntas las etiquetas de política.
Haz clic en Guardar.
Verifica que tu esquema de tablas ahora se ve de la siguiente manera.
Abre el editor de consultas de biglake_table.
Ejecuta lo siguiente para consultar la tabla de BigLake a través del editor de BigQuery:
Haz clic en Ejecutar.
Deberías recibir un error de acceso denegado:
La consulta debe ejecutarse sin problemas y devolver las columnas a las que tienes acceso. En este ejemplo, se muestra que la seguridad a nivel de la columna aplicada a través de BigQuery también se puede aplicar a tablas de BigLake.
Para actualizar las tablas existentes a las tablas de BigLake, asocia la tabla existente con una conexión de recursos en la nube. Para obtener una lista completa de marcas y argumentos, consulta bq update
y bq mkdef
.
Haz clic en los tres puntos junto a demo_dataset, luego, elige Crear tabla.
En Fuente para Crear tabla desde, elige Google Cloud Storage.
Haz clic en Explorar para seleccionar el conjunto de datos. Navega al bucket denominado invoice.csv
para importarlo a BigQuery y haz clic en Seleccionar.
En Destino, verifica que se seleccionó tu proyecto de lab y que estás utilizando el demo_dataset.
Para el nombre de la tabla, utiliza external_table
.
Cambia el tipo de tabla a Tabla externa.
Haz clic en Revisar mi progreso para verificar el objetivo.
Haz clic en Revisar mi progreso para verificar el objetivo.
En el menú de navegación, ve a BigQuery > BigQuery Studio.
Navega a demo-dataset y haz doble clic en external_table.
Abre la pestaña Detalles.
Verifica en la configuración de datos externos que la tabla ahora esté usando el ID de conexión correcto.
¡Genial! Actualizaste correctamente la tabla externa existente a una tabla de BigLake asociándola a una conexión de recurso de nube.
En este lab, creaste un recurso de conexión, configuraste el acceso a un data lake de Cloud Storage y creaste una tabla de BigLake a partir de él. Luego, consultaste la tabla de BigLake a través de BigQuery y configuraste las políticas de control de acceso a nivel de columna. Por último, actualizaste una tabla externa existente a una tabla de BigLake con el recurso de conexión.
Asegúrate de consultar la siguiente documentación para practicar más con BigLake:
Recibe la formación que necesitas para aprovechar al máximo las tecnologías de Google Cloud. Nuestras clases incluyen habilidades técnicas y recomendaciones para ayudarte a avanzar rápidamente y a seguir aprendiendo. Para que puedas realizar nuestros cursos cuando más te convenga, ofrecemos distintos tipos de capacitación de nivel básico a avanzado: a pedido, presenciales y virtuales. Las certificaciones te ayudan a validar y demostrar tus habilidades y tu conocimiento técnico respecto a las tecnologías de Google Cloud.
Última actualización del manual: 16 de enero de 2024
Prueba más reciente del lab: 16 de enero de 2024
Copyright 2025 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.
Este contenido no está disponible en este momento
Te enviaremos una notificación por correo electrónico cuando esté disponible
¡Genial!
Nos comunicaremos contigo por correo electrónico si está disponible
One lab at a time
Confirm to end all existing labs and start this one