arrow_back

Create ML Models with BigQuery ML: Lab de desafío

Unirse Acceder

Create ML Models with BigQuery ML: Lab de desafío

1 hora 30 minutos 7 créditos

GSP341

Labs de autoaprendizaje de Google Cloud

Descripción general

En un lab de desafío, se le proporcionarán una situación y un conjunto de tareas. En lugar de seguir instrucciones paso a paso, deberá utilizar las habilidades aprendidas en los labs de la Quest a fin de decidir cómo completar las tareas por su cuenta. Un sistema de puntuación automatizado (que se muestra en esta página) le proporcionará comentarios acerca de si completó las tareas correctamente.

En un lab de desafío, no se explican conceptos nuevos de Google Cloud, sino que se espera que amplíe las habilidades que adquirió, como cambiar los valores predeterminados y leer o investigar los mensajes de error para corregir sus propios errores.

Debe completar correctamente todas las tareas dentro del período establecido para obtener una puntuación del 100%.

Se recomienda este lab a los alumnos inscritos en la Quest Create ML Models with BigQuery ML. ¿Todo listo para el desafío?

Temas evaluados

  • Cree un nuevo conjunto de datos de BigQuery que almacenará sus modelos de BigQuery ML.
  • Cree modelos de previsión (regresión lineal) en BigQuery ML.
  • Evalúe el rendimiento de sus modelos de aprendizaje automático.
  • Haga predicciones sobre la duración de los viajes con los modelos de BigQuery ML.

Configuración

Antes de hacer clic en el botón Comenzar lab

Lea estas instrucciones. Los labs son cronometrados y no se pueden pausar. El cronómetro, que comienza a funcionar cuando hace clic en Comenzar lab, indica por cuánto tiempo tendrá a su disposición los recursos de Google Cloud.

Este lab práctico de Qwiklabs le permitirá llevar a cabo las actividades correspondientes en un entorno de nube real, no en uno de simulación o demostración. Para ello, le proporciona credenciales temporales nuevas que utilizará para acceder a Google Cloud durante todo el lab.

Qué necesita

Para completar este lab, necesitará lo siguiente:

  • Acceso a un navegador de Internet estándar (se recomienda el navegador Chrome)
  • Tiempo para completar el lab

Nota: Si ya tiene un proyecto o una cuenta personal de Google Cloud, no los use para este lab.

Nota: Si usa un dispositivo con Chrome OS, ejecute este lab en una ventana de incógnito.

Situación del desafío

Comenzó una nueva función como miembro junior del departamento de Ciencia de Datos de Jooli Inc. Su equipo está trabajando en varias iniciativas de aprendizaje automático relacionadas con los servicios de movilidad urbana. Se espera que ayude a desarrollar y evaluar conjuntos de datos y modelos de aprendizaje automático para proporcionar estadísticas basadas en conjuntos de datos del mundo real.

Se espera que tenga las habilidades y el conocimiento necesarios para realizar estas tareas, por lo que no se le proporcionarán guías paso a paso.

Su desafío

Para uno de los proyectos en los que está trabajando, debe proporcionar un análisis basado en datos del mundo real que ayude a seleccionar nuevos modelos de bicicletas para los sistemas públicos de bicicletas compartidas. Su función en este proyecto es desarrollar y evaluar modelos de aprendizaje automático que puedan predecir las duraciones promedio de los viajes de los sistemas de bicicletas. Para ello, deberá usar los datos públicos del sistema público de bicicletas compartidas de Austin a fin de entrenar y evaluar sus modelos.

Dos de los científicos de datos sénior de su equipo tienen teorías diferentes sobre qué factores son importantes para determinar la duración de un viaje de bicicleta compartida y le solicitaron que las priorice para comenzar. El primer científico de datos sostiene que los factores principales son la estación de partida, la ubicación de esta estación, el día de la semana y la hora a la que comenzó el viaje. Por su parte, el segundo científico de datos argumenta que ese enfoque conlleva una complicación innecesaria y que los factores principales son simplemente la estación de partida, el tipo de suscriptor y la hora a la que comenzó el viaje.

Se le solicitó que desarrolle un modelo de aprendizaje automático basado en cada uno de estos atributos de entrada. A causa del COVID-19, durante distintos períodos del año 2021, en Austin rigió la orden de quedarse en casa. Por este motivo, trabajará con datos de años anteriores. Se le indicó que entrene sus modelos con los datos de y que, luego, los evalúe frente a los datos de sobre la base del error absoluto medio y la raíz cuadrada del error cuadrático medio.

Abra este vínculo al conjunto de datos de bicicletas compartidas de Austin en la pestaña del navegador del lab para acceder a los datos públicos del esquema de bicicletas compartidas de Austin en su proyecto.

Como último paso, debe crear y ejecutar una consulta que use el modelo que incluye el tipo de suscriptor como atributo para predecir la duración promedio de todos los viajes desde la estación de bicicletas compartidas con mayor actividad en (según la cantidad de viajes por estación en ) donde el tipo de suscriptor sea “Viaje único”.

Tarea 1: Cree un conjunto de datos para almacenar sus modelos de aprendizaje automático

Cree un nuevo conjunto de datos en el que pueda almacenar sus modelos de aprendizaje automático. Verifique que se haya creado un nuevo conjunto de datos.

Tarea 2: Cree un modelo de aprendizaje automático de BigQuery de previsión

Cree el primer modelo de aprendizaje automático para predecir la duración de los viajes en bicicleta. Los atributos de este modelo deben incluir el nombre de la estación de partida, la hora de salida, el día de la semana del viaje y la dirección de la estación de partida, la cual debe etiquetarse como location. Para entrenar este modelo, solo debe usar datos de . Verifique que se haya creado un modelo de aprendizaje automático de BigQuery.

Tarea 3: Cree el segundo modelo de aprendizaje automático

Cree el segundo modelo de aprendizaje automático para predecir la duración de los viajes en bicicleta. Los atributos de este modelo deben incluir el nombre de la estación de partida, el tipo de suscriptor del servicio de bicicletas compartidas y la hora de inicio del viaje. Para entrenar este modelo, también debe usar solo datos de . Verifique que se haya creado un segundo modelo de aprendizaje automático de BigQuery.

Tarea 4: Evalúe los dos modelos de aprendizaje automático

Evalúe cada uno de los modelos de aprendizaje automático frente a datos de . Para ello, use consultas separadas. Sus consultas deben informar tanto el error absoluto medio como la raíz cuadrada del error cuadrático medio. Confirme que se hayan evaluado ambos modelos de aprendizaje automático.

Tarea 5: Use el modelo de aprendizaje automático del tipo de suscriptor para predecir las duraciones promedio de los viajes

Una vez que haya creado y evaluado ambos modelos, use el segundo modelo, que utiliza el código subscriber_type como atributo para predecir la duración promedio de los viajes desde la estación de bicicletas compartidas con mayor actividad en donde el tipo de suscriptor sea Single Trip. Verifique que se hayan realizado correctamente las predicciones para los suscriptores de viajes únicos correspondientes a la estación de alquiler de bicicletas con mayor actividad en .

Sugerencias y trucos

  • Sugerencia 1. Deberá combinar la información de ambas tablas de bicicletas compartidas de Austin en el conjunto de datos público para crear su primer modelo mediante una instrucción JOIN.

  • Sugerencia 2. Debe entrenar ambos modelos con datos únicamente de y evaluarlos solo con datos de .

  • Sugerencia 3. Debe elegir un tipo de modelo que sea adecuado para predecir valores de etiqueta. Al evaluar los modelos, debe usar SELECT SQRT(mean_squared_error) AS rmse, mean_absolute_error FROM ML.EVALUATE(...) para mostrar las métricas de rendimiento del modelo específicas que quieren usar los científicos de datos.

  • Sugerencia 4. Sus consultas de predicción deben mostrar el promedio de la salida de valores previstos por el modelo para la duración del viaje y no solo el promedio de la duración real de los viajes.

¡Felicitaciones!

Create_ML_Models_with_BQ_ML_Skill_WBG.png

Obtenga su próxima insignia de habilidad

Este lab de autoaprendizaje forma parte de la Quest con insignia de habilidad Create ML Models with BigQuery ML. Si completa esta Quest, obtendrá la insignia de habilidad que se muestra arriba como reconocimiento de su logro. Comparta la insignia en su currículum y sus plataformas de redes sociales, y anuncie su logro con el hashtag #GoogleCloudBadge.

Esta Quest con insignia de habilidad forma parte de la ruta de aprendizaje de Data Analyst de Google Cloud. Si ya completó las otras Quests con insignia de habilidad de esta ruta de aprendizaje, revise el catálogo y encuentre más de 20 Quests con insignia de habilidad a los que puede inscribirse.

Google Cloud Training & Certification

Aproveche al máximo las tecnologías de Google Cloud. Nuestras clases incluyen habilidades técnicas y recomendaciones para ayudarlo a ponerse en marcha rápidamente y a seguir aprendiendo. Para que pueda realizar nuestros cursos cuando más le convenga, ofrecemos distintos tipos de capacitación de nivel básico a avanzado: según demanda, presenciales y virtuales. Las certificaciones lo ayudan a validar y demostrar sus habilidades y experiencia en las tecnologías de Google Cloud.

Última actualización del manual: 14 de abril de 2021
Prueba más reciente del lab: 14 de abril de 2021

Copyright 2020 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.