En este lab, aprenderás el proceso para analizar un conjunto de datos almacenado en BigQuery a través de un notebook de instancia de Workbench para realizar consultas y presentar los datos utilizando varias técnicas de trazado de datos estadísticos. El análisis te ayudará a descubrir patrones en los datos.
Objetivos de aprendizaje
Crear un notebook de instancia de Workbench
Conectarte a conjuntos de datos de BigQuery
Realizar un análisis estadístico en un DataFrame de Pandas
Crear diagramas de Seaborn para realizar análisis de datos exploratorios en Python
Escribir una consulta en SQL para seleccionar campos específicos de un conjunto de datos de BigQuery
Vertex AI es una plataforma unificada para compilar, implementar y administrar aplicaciones de aprendizaje automático (AA).
Los notebooks de Vertex AI Workbench proporcionan una solución flexible y escalable para desarrollar y, posteriormente, implementar modelos de AA en Google Cloud. Elige Workbench si necesitas más opciones de personalización y control total sobre tu entorno de aprendizaje automático. Ofrece las funciones de seguridad y cumplimiento necesarias para las organizaciones empresariales y se integra en otros servicios de Google Cloud, como Vertex AI y BigQuery, para mejorar el flujo de trabajo de ciencia de datos y aprendizaje automático.
BigQuery es un almacén de datos sin servidores, potente y completamente administrado que te permite analizar y administrar grandes conjuntos de datos con facilidad. BigQuery usa un dialecto de SQL estándar conocido, lo que facilita su uso para los analistas y científicos de datos sin necesidad de aprender un lenguaje nuevo.
Vertex AI ofrece dos soluciones de notebook, Workbench y Colab Enterprise.
Workbench
Vertex AI Workbench es una buena opción para los proyectos que priorizan el control y la personalización. Es excelente para proyectos complejos que abarcan múltiples archivos, con dependencias complejas. También es una buena opción para científicos de datos que están haciendo la transición a la nube desde una estación de trabajo o laptop.
Las instancias de Vertex AI Workbench tienen un conjunto preinstalado de paquetes de aprendizaje profundo, lo que incluye la compatibilidad con los frameworks de TensorFlow y PyTorch.
Configura tus entornos de Qwiklabs
Configuración de Qwiklabs
En cada lab, recibirá un proyecto de Google Cloud y un conjunto de recursos nuevos por tiempo limitado y sin costo adicional.
Accede a Qwiklabs desde una ventana de incógnito.
Ten en cuenta el tiempo de acceso del lab (por ejemplo, 1:15:00) y asegúrate de finalizarlo en el plazo asignado.
No existe una función de pausa. Si lo necesita, puede reiniciar el lab, pero deberá hacerlo desde el comienzo.
Cuando esté listo, haga clic en Comenzar lab.
Anote las credenciales del lab (el nombre de usuario y la contraseña). Las usarás para acceder a la consola de Google Cloud.
Haga clic en Abrir Google Console.
Haga clic en Usar otra cuenta, copie las credenciales para este lab y péguelas en el mensaje emergente que aparece.
Si usa otras credenciales, se generarán errores o incurrirá en cargos.
Acepta las condiciones y omite la página de recursos de recuperación.
Tarea 1: crea un notebook de Workbench
En el menú de navegación () de la consola de Google Cloud, selecciona Vertex AI.
Haz clic en Habilitar todas las APIs recomendadas.
En el menú de navegación, haz clic en Workbench.
En la parte superior de la página de Workbench, asegúrate de estar en la vista Instances.
Haz clic en Create New.
Configura la instancia:
Name: lab-workbench
Region: Configura la región como
Zone: Establece la zona en
Advanced Options: Si es necesario, haz clic en "Advanced Options" para realizar personalizaciones adicionales (p. ej., tipo de máquina, tamaño del disco).
Haz clic en Create.
La instancia tardará algunos minutos en crearse. Se mostrará una marca de verificación verde junto a su nombre cuando esté lista.
Haz clic en ABRIR JUPYTERLAB junto al nombre de la instancia para iniciar la interfaz de JupyterLab. Se abrirá una pestaña nueva en el navegador.
Haz clic en el ícono de Python 3 para iniciar un nuevo notebook de Python.
Haz clic con el botón derecho en el archivo Untitled.ipynb en la barra de menú y selecciona Cambiar el nombre del notebook para asignarle un nombre significativo.
Acabas de configurar el entorno. Ya tienes todo listo para comenzar a trabajar con tu notebook de Vertex AI Workbench.
Tarea 2: clona el repo en tu instancia de notebook de Vertex AI
El repo de GitHub contiene el archivo del lab y los archivos de soluciones del curso.
Copia y ejecuta el siguiente código en la primera celda de tu notebook para clonar el repositorio training-data-analyst.
Para confirmar que se haya clonado el repositorio, haz doble clic en el directorio training-data-analyst y confirma que puedes ver el contenido.
En la interfaz del notebook, navega a training-data-analyst > courses > machine_learning > deepdive2 > launching_into_ml > solutions y abre workbench_explore_data.ipynb.
En la interfaz del notebook, haz clic en Editar > Borrar todos los resultados (haz clic en Editar y, luego, selecciona Borrar todos los resultados en el menú desplegable).
En el cuadro de diálogo Seleccionar kernel, elige Python 3 en la lista de kernels disponibles.
Lee con atención las instrucciones del notebook.
¡Felicitaciones!
En este lab, aprendiste a realizar las siguientes tareas:
Crear un notebook de instancia de Workbench
Clonar un repositorio de GitHub
Conectarte a un conjunto de datos de BigQuery
Realizar un análisis estadístico en un DataFrame de Pandas
Crear diagramas de Seaborn para realizar análisis de datos exploratorios en Python
Escribir una consulta en SQL para seleccionar campos específicos de un conjunto de datos de BigQuery
Finalice su lab
Cuando haya completado su lab, haga clic en Finalizar lab. Qwiklabs quitará los recursos que usó y limpiará la cuenta por usted.
Tendrá la oportunidad de calificar su experiencia en el lab. Seleccione la cantidad de estrellas que corresponda, ingrese un comentario y haga clic en Enviar.
La cantidad de estrellas indica lo siguiente:
1 estrella = Muy insatisfecho
2 estrellas = Insatisfecho
3 estrellas = Neutral
4 estrellas = Satisfecho
5 estrellas = Muy satisfecho
Puede cerrar el cuadro de diálogo si no desea proporcionar comentarios.
Para enviar comentarios, sugerencias o correcciones, use la pestaña Asistencia.
Actualización más reciente del manual: 25 de noviembre de 2024
Prueba más reciente del lab: 25 de noviembre de 2024
Copyright 2020 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.
Los labs crean un proyecto de Google Cloud y recursos por un tiempo determinado
.
Los labs tienen un límite de tiempo y no tienen la función de pausa. Si finalizas el lab, deberás reiniciarlo desde el principio.
En la parte superior izquierda de la pantalla, haz clic en Comenzar lab para empezar
Usa la navegación privada
Copia el nombre de usuario y la contraseña proporcionados para el lab
Haz clic en Abrir la consola en modo privado
Accede a la consola
Accede con tus credenciales del lab. Si usas otras credenciales, se generarán errores o se incurrirá en cargos.
Acepta las condiciones y omite la página de recursos de recuperación
No hagas clic en Finalizar lab, a menos que lo hayas terminado o quieras reiniciarlo, ya que se borrará tu trabajo y se quitará el proyecto
Este contenido no está disponible en este momento
Te enviaremos una notificación por correo electrónico cuando esté disponible
¡Genial!
Nos comunicaremos contigo por correo electrónico si está disponible
Un lab a la vez
Confirma para finalizar todos los labs existentes y comenzar este
Usa la navegación privada para ejecutar el lab
Usa una ventana de navegación privada o de Incógnito para ejecutar el lab. Así
evitarás cualquier conflicto entre tu cuenta personal y la cuenta
de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.
Análisis exploratorio de datos con instancias de Workbench y BigQuery
Duración:
0 min de configuración
·
Acceso por 120 min
·
120 min para completar