Puntos de control
Create a BigQuery dataset to store models
/ 20
Create a bike rental ML model
/ 20
Create a second bike rental ML model
/ 20
Evaluate the classification model performance for both ML models
/ 20
Predict duration of rental
/ 20
Create ML Models with BigQuery ML: Lab de desafío
GSP341
Descripción general
En un lab de desafío, se le proporcionarán una situación y un conjunto de tareas. En lugar de seguir instrucciones paso a paso, deberá utilizar las habilidades aprendidas en los labs de la Quest a fin de decidir cómo completar las tareas por su cuenta. Un sistema de puntuación automatizado (que se muestra en esta página) le proporcionará comentarios acerca de si completó las tareas correctamente.
En un lab de desafío, no se explican conceptos nuevos de Google Cloud, sino que se espera que amplíe las habilidades que adquirió, como cambiar los valores predeterminados y leer o investigar los mensajes de error para corregir sus propios errores.
Debe completar correctamente todas las tareas dentro del período establecido para obtener una puntuación del 100%.
Se recomienda este lab a los alumnos inscritos en la Quest Create ML Models with BigQuery ML. ¿Todo listo para el desafío?
Temas evaluados
- Cree un nuevo conjunto de datos de BigQuery que almacenará sus modelos de BigQuery ML.
- Cree modelos de previsión (regresión lineal) en BigQuery ML.
- Evalúe el rendimiento de sus modelos de aprendizaje automático.
- Haga predicciones sobre la duración de los viajes con los modelos de BigQuery ML.
Configuración
Antes de hacer clic en el botón Comenzar lab
Lea estas instrucciones. Los labs son cronometrados y no se pueden pausar. El cronómetro, que comienza a funcionar cuando hace clic en Comenzar lab, indica por cuánto tiempo tendrá a su disposición los recursos de Google Cloud.
Este lab práctico de Qwiklabs le permitirá llevar a cabo las actividades correspondientes en un entorno de nube real, no en uno de simulación o demostración. Para ello, le proporciona credenciales temporales nuevas que utilizará para acceder a Google Cloud durante todo el lab.
Qué necesita
Para completar este lab, necesitará lo siguiente:
- Acceso a un navegador de Internet estándar (se recomienda el navegador Chrome)
- Tiempo para completar el lab
Nota: Si ya tiene un proyecto o una cuenta personal de Google Cloud, no los use para este lab.
Nota: Si usa un dispositivo con Chrome OS, ejecute este lab en una ventana de incógnito.
Situación del desafío
Comenzó una nueva función como miembro junior del departamento de Ciencia de Datos de Jooli Inc. Su equipo está trabajando en varias iniciativas de aprendizaje automático relacionadas con los servicios de movilidad urbana. Se espera que ayude a desarrollar y evaluar conjuntos de datos y modelos de aprendizaje automático para proporcionar estadísticas basadas en conjuntos de datos del mundo real.
Se espera que tenga las habilidades y el conocimiento necesarios para realizar estas tareas, por lo que no se le proporcionarán guías paso a paso.
Su desafío
Para uno de los proyectos en los que está trabajando, debe proporcionar un análisis basado en datos del mundo real que ayude a seleccionar nuevos modelos de bicicletas para los sistemas públicos de bicicletas compartidas. Su función en este proyecto es desarrollar y evaluar modelos de aprendizaje automático que puedan predecir las duraciones promedio de los viajes de los sistemas de bicicletas. Para ello, deberá usar los datos públicos del sistema público de bicicletas compartidas de Austin a fin de entrenar y evaluar sus modelos.
Dos de los científicos de datos sénior de su equipo tienen teorías diferentes sobre qué factores son importantes para determinar la duración de un viaje de bicicleta compartida y le solicitaron que las priorice para comenzar. El primer científico de datos sostiene que los factores principales son la estación de partida, la ubicación de esta estación, el día de la semana y la hora a la que comenzó el viaje. Por su parte, el segundo científico de datos argumenta que ese enfoque conlleva una complicación innecesaria y que los factores principales son simplemente la estación de partida, el tipo de suscriptor y la hora a la que comenzó el viaje.
Se le solicitó que desarrolle un modelo de aprendizaje automático basado en cada uno de estos atributos de entrada. A causa del COVID-19, durante distintos períodos del año 2021, en Austin rigió la orden de quedarse en casa. Por este motivo, trabajará con datos de años anteriores. Se le indicó que entrene sus modelos con los datos de
Abra este vínculo al conjunto de datos de bicicletas compartidas de Austin en la pestaña del navegador del lab para acceder a los datos públicos del esquema de bicicletas compartidas de Austin en su proyecto.
Como último paso, debe crear y ejecutar una consulta que use el modelo que incluye el tipo de suscriptor como atributo para predecir la duración promedio de todos los viajes desde la estación de bicicletas compartidas con mayor actividad en
Tarea 1: Cree un conjunto de datos para almacenar sus modelos de aprendizaje automático
Cree un nuevo conjunto de datos en el que pueda almacenar sus modelos de aprendizaje automático.
Tarea 2: Cree un modelo de aprendizaje automático de BigQuery de previsión
Cree el primer modelo de aprendizaje automático para predecir la duración de los viajes en bicicleta. Los atributos de este modelo deben incluir el nombre de la estación de partida, la hora de salida, el día de la semana del viaje y la dirección de la estación de partida, la cual debe etiquetarse como location
. Para entrenar este modelo, solo debe usar datos de
Tarea 3: Cree el segundo modelo de aprendizaje automático
Cree el segundo modelo de aprendizaje automático para predecir la duración de los viajes en bicicleta. Los atributos de este modelo deben incluir el nombre de la estación de partida, el tipo de suscriptor del servicio de bicicletas compartidas y la hora de inicio del viaje. Para entrenar este modelo, también debe usar solo datos de
Tarea 4: Evalúe los dos modelos de aprendizaje automático
Evalúe cada uno de los modelos de aprendizaje automático frente a datos de
Tarea 5: Use el modelo de aprendizaje automático del tipo de suscriptor para predecir las duraciones promedio de los viajes
Una vez que haya creado y evaluado ambos modelos, use el segundo modelo, que utiliza el código subscriber_type
como atributo para predecir la duración promedio de los viajes desde la estación de bicicletas compartidas con mayor actividad en Single Trip
.
Sugerencias y trucos
-
Sugerencia 1. Deberá combinar la información de ambas tablas de bicicletas compartidas de Austin en el conjunto de datos público para crear su primer modelo mediante una instrucción JOIN.
-
Sugerencia 2. Debe entrenar ambos modelos con datos únicamente de
y evaluarlos solo con datos de . -
Sugerencia 3. Debe elegir un tipo de modelo que sea adecuado para predecir valores de etiqueta. Al evaluar los modelos, debe usar
SELECT SQRT(mean_squared_error) AS rmse, mean_absolute_error FROM ML.EVALUATE(...)
para mostrar las métricas de rendimiento del modelo específicas que quieren usar los científicos de datos. -
Sugerencia 4. Sus consultas de predicción deben mostrar el promedio de la salida de valores previstos por el modelo para la duración del viaje y no solo el promedio de la duración real de los viajes.
¡Felicitaciones!
Obtenga su próxima insignia de habilidad
Este lab de autoaprendizaje forma parte de la Quest con insignia de habilidad Create ML Models with BigQuery ML. Si completa esta Quest, obtendrá la insignia de habilidad que se muestra arriba como reconocimiento de su logro. Comparta la insignia en su currículum y sus plataformas de redes sociales, y anuncie su logro con el hashtag #GoogleCloudBadge.
Esta Quest con insignia de habilidad forma parte de la ruta de aprendizaje de Data Analyst de Google Cloud. Si ya completó las otras Quests con insignia de habilidad de esta ruta de aprendizaje, revise el catálogo y encuentre más de 20 Quests con insignia de habilidad a los que puede inscribirse.
Google Cloud Training & Certification
Aproveche al máximo las tecnologías de Google Cloud. Nuestras clases incluyen habilidades técnicas y recomendaciones para ayudarlo a ponerse en marcha rápidamente y a seguir aprendiendo. Para que pueda realizar nuestros cursos cuando más le convenga, ofrecemos distintos tipos de capacitación de nivel básico a avanzado: según demanda, presenciales y virtuales. Las certificaciones lo ayudan a validar y demostrar sus habilidades y experiencia en las tecnologías de Google Cloud.
Última actualización del manual: 14 de abril de 2021
Prueba más reciente del lab: 14 de abril de 2021
Copyright 2020 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.