arrow_back

Introducción a las llamadas a funciones con Gemini

Acceder Unirse
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

Introducción a las llamadas a funciones con Gemini

Lab 1 hora universal_currency_alt 5 créditos show_chart Intermedio
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

GSP1227

Labs de autoaprendizaje de Google Cloud

Descripción general

Gemini es una familia de modelos de IA generativa que desarrolló Google DeepMind y que están diseñados para casos de uso multimodales. La API de Gemini te da acceso a los modelos de Gemini Pro Vision y Gemini Pro. En este lab, aprenderás a usar la API de Vertex AI Gemini para generar llamadas a funciones a partir de instrucciones de texto.

Llama a funciones desde Gemini

Las llamadas a funciones permiten que los desarrolladores creen una descripción de una función en su código y, luego, pasen esa descripción a un modelo de lenguaje en una solicitud. La respuesta del modelo incluye el nombre de una función que coincide con la descripción y los argumentos con los que se la llama.

Las llamadas a función son similares a las extensiones de Vertex AI, pues ambas generan información sobre funciones. La diferencia entre ellas es que la llamada a función devuelve datos de JSON con el nombre de una función y los argumentos para usarla en tu código, mientras que las extensiones de Vertex AI devuelven la función y la llaman por ti.

Objetivos

En este lab, aprenderás a realizar las siguientes tareas:

  • Instalar el SDK de Vertex AI para Python
  • Usar la API de Vertex AI Gemini para interactuar con el modelo de Gemini Pro (gemini-pro):
    • Generar llamadas a funciones a partir de una instrucción de texto para ayudar a los clientes a obtener información sobre los productos de Google Store
    • Generar llamadas a funciones a partir de una instrucción de texto y llamar a una API externa para geocodificar direcciones
    • Generar llamadas a funciones a partir de una instrucción de texto para extraer entidades de datos de registro

Configuración y requisitos

Antes de hacer clic en el botón Comenzar lab

Lee estas instrucciones. Los labs son cronometrados y no se pueden pausar. El cronómetro, que comienza a funcionar cuando haces clic en Comenzar lab, indica por cuánto tiempo tendrás a tu disposición los recursos de Google Cloud.

Este lab práctico te permitirá realizar las actividades correspondientes en un entorno de nube real, no en uno de simulación o demostración. Para ello, se te proporcionan credenciales temporales nuevas que utilizarás para acceder a Google Cloud durante todo el lab.

Para completar este lab, necesitarás lo siguiente:

  • Acceso a un navegador de Internet estándar (se recomienda el navegador Chrome)
Nota: Usa una ventana de navegador privada o de Incógnito para ejecutar este lab. Así evitarás cualquier conflicto entre tu cuenta personal y la cuenta de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.
  • Tiempo para completar el lab: Recuerda que, una vez que comienzas un lab, no puedes pausarlo.
Nota: Si ya tienes un proyecto o una cuenta personal de Google Cloud, no los uses en este lab para evitar cargos adicionales en tu cuenta.

Cómo iniciar su lab y acceder a la consola de Google Cloud

  1. Haga clic en el botón Comenzar lab. Si debe pagar por el lab, se abrirá una ventana emergente para que seleccione su forma de pago. A la izquierda, se encuentra el panel Detalles del lab que tiene estos elementos:

    • El botón Abrir la consola de Google
    • Tiempo restante
    • Las credenciales temporales que debe usar para el lab
    • Otra información para completar el lab, si es necesaria
  2. Haga clic en Abrir la consola de Google. El lab inicia recursos y abre otra pestaña en la que se muestra la página de acceso.

    Sugerencia: Ordene las pestañas en ventanas separadas, una junto a la otra.

    Nota: Si ve el diálogo Elegir una cuenta, haga clic en Usar otra cuenta.
  3. Si es necesario, copie el nombre de usuario del panel Detalles del lab y péguelo en el cuadro de diálogo Acceder. Haga clic en Siguiente.

  4. Copie la contraseña del panel Detalles del lab y péguela en el cuadro de diálogo de bienvenida. Haga clic en Siguiente.

    Importante: Debe usar las credenciales del panel de la izquierda. No use sus credenciales de Google Cloud Skills Boost. Nota: Usar su propia Cuenta de Google podría generar cargos adicionales.
  5. Haga clic para avanzar por las páginas siguientes:

    • Acepte los términos y condiciones.
    • No agregue opciones de recuperación o autenticación de dos factores (esta es una cuenta temporal).
    • No se registre para obtener pruebas gratuitas.

Después de un momento, se abrirá la consola de Cloud en esta pestaña.

Nota: Para ver el menú con una lista de los productos y servicios de Google Cloud, haga clic en el Menú de navegación que se encuentra en la parte superior izquierda de la pantalla. Ícono del menú de navegación

Tarea 1. Abre el notebook en Vertex AI Workbench

  1. En el menú de navegación de la consola de Google Cloud, haz clic en Vertex AI > Workbench.

  2. En la página Notebooks administrados por el usuario, busca el notebook generative-ai-jupyterlab y haz clic en el botón Abrir JupyterLab.

La interfaz de JupyterLab se abre en una pestaña nueva del navegador.

Tarea 2. Abre la carpeta generative-ai

  1. Navega a la carpeta generative-ai en la parte izquierda del notebook.

  2. Navega a la carpeta /gemini/function-calling.

  3. Haz clic en el archivo intro_function_calling.ipynb.

  4. Ejecuta las secciones Getting Started, Set Google Cloud project information e Import libraries del notebook.

    • Para Project ID, usa y para Location, usa .
Nota: Puedes omitir las celdas del notebook que tienen la indicación Colab only.

En las siguientes secciones, ejecutarás las celdas del notebook para ver cómo usar la API de Vertex AI Gemini con el SDK de Vertex AI para Python.

Haz clic en Revisar mi progreso para verificar el objetivo. Instalar el SDK de Vertex AI para Python e importar bibliotecas

Tarea 3. Usa llamadas a funciones para realizar consultas estructuradas de Google Store

Cuando trabajas con un modelo de texto generativo, puede ser difícil obligar al LLM a que ofrezca respuestas constantes en un formato estructurado como JSON. Las llamadas a función facilitan el trabajo con un LLM a través de instrucciones y entradas no estructuradas, y hacen que el LLM devuelva una respuesta estructurada que se pueda usar para llamar a una función externa.

Puedes concebir las llamadas a función como una manera de obtener resultados estructurados a partir de instrucciones del usuario y definiciones de función, usar ese resultado estructurado para hacer una solicitud a la API en un sistema externo y, luego, devolver la respuesta de la función al LLM para generar una respuesta para el usuario. En otras palabras, las llamadas a funciones en Gemini extraen parámetros estructurados de texto o mensajes no estructurados de los usuarios. En este ejemplo, usarás las llamadas a funciones junto con la modalidad de chat en el modelo de Gemini para ayudar a los clientes a obtener información sobre los productos en Google Store.

  1. En esta tarea, ejecuta las celdas del notebook y descubre cómo usar el modelo de Gemini para ayudar a los clientes a obtener información sobre los productos en Google Store.

Haz clic en Revisar mi progreso para verificar el objetivo. Generar una llamada a función simple de clima

Tarea 4. Usa llamadas a funciones para geocodificar direcciones con una API de Google Maps

En este ejemplo, usarás la modalidad de texto en la API de Gemini para definir una función que tome varios parámetros como entradas. Usarás la respuesta de la llamada a función para realizar una llamada a la API en vivo y convertir una dirección en coordenadas de latitud y longitud.

  1. En esta tarea, ejecuta las celdas del notebook para ver cómo usar el modelo de Gemini Pro para generar una llamada a función que geocodifique una dirección.
Aquí usamos la API de Nominatim de OpenStreetMap para geocodificar una dirección de manera que sea fácil de usar y aprender en este notebook. Si trabajas con grandes cantidades de mapas o datos de ubicación geográfica, puedes usar la API de Geocoding de Google Maps.

Haz clic en Revisar mi progreso para verificar el objetivo. Generar una llamada a función compleja

Tarea 5. Usa las llamadas a funciones para extraer entidades

En los ejemplos anteriores, utilizaste la funcionalidad de extracción de entidades en las llamadas a funciones de Gemini para poder pasar los parámetros resultantes a una API de REST o una biblioteca cliente. Sin embargo, es posible que solo quieras realizar el paso de extracción de entidades con las llamadas a funciones de Gemini sin llamar a una API. Puedes considerar esta funcionalidad como una forma conveniente de transformar datos de texto no estructurado en campos estructurados.

En este ejemplo, compilarás un extractor de registros que tome los datos de registro sin procesar y los transforme en datos estructurados con detalles sobre los mensajes de error.

  1. En esta tarea, ejecuta las celdas del notebook para descubrir cómo usar el modelo de Gemini Pro para generar llamadas a funciones y extraer entidades de los datos de registro.

Haz clic en Revisar mi progreso para verificar el objetivo. Generar llamadas a función a partir de una instrucción de chat

¡Felicitaciones!

¡Felicitaciones! En este lab, aprendiste a usar la API de Vertex AI Gemini para generar llamadas a funciones a partir de instrucciones de texto. Utilizaste el modelo de Gemini Pro para generar llamadas a funciones y ayudar a los clientes a obtener información sobre productos en Google Store, geocodificar direcciones y extraer entidades de los datos de registro.

Próximos pasos y más información

Capacitación y certificación de Google Cloud

Recibe la formación que necesitas para aprovechar al máximo las tecnologías de Google Cloud. Nuestras clases incluyen habilidades técnicas y recomendaciones para ayudarte a avanzar rápidamente y a seguir aprendiendo. Para que puedas realizar nuestros cursos cuando más te convenga, ofrecemos distintos tipos de capacitación de nivel básico a avanzado: a pedido, presenciales y virtuales. Las certificaciones te ayudan a validar y demostrar tus habilidades y tu conocimiento técnico respecto a las tecnologías de Google Cloud.

Última actualización del manual: 23 de abril de 2024

Prueba más reciente del lab: 23 de abril de 2024

Copyright 2024 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.