Obtén acceso a más de 700 labs y cursos

Tres formas de usar la API de Cloud Speech: Lab de desafío

Lab 45 minutos universal_currency_alt 1 crédito show_chart Introductorio

info Es posible que este lab incorpore herramientas de IA para facilitar tu aprendizaje.

ARC132
Descripción general
Configuración y requisitos
Situación del desafío
Tarea 1: Crea una clave de API
Tarea 2: Crea voces sintéticas a partir de texto con la API de Text-to-Speech
Tarea 3: Realiza transcripción de voz a texto con la API de Cloud Speech
Tarea 4: Traduce texto con la API de Cloud Translation
Tarea 5: Detecta un idioma con la API de Cloud Translation
¡Felicitaciones!

Obtén acceso a más de 700 labs y cursos

ARC132

Logotipo de los labs de autoaprendizaje de Google Cloud

Descripción general

En un lab de desafío, se le proporcionarán una situación y un conjunto de tareas. En lugar de seguir instrucciones paso a paso, deberás utilizar las habilidades aprendidas en los labs del curso para decidir cómo completar las tareas por tu cuenta. Un sistema automatizado de puntuación (en esta página) mostrará comentarios y determinará si completaste tus tareas correctamente.

En un lab de desafío, no se explican conceptos nuevos de Google Cloud, sino que se espera que amplíes las habilidades que adquiriste, como cambiar los valores predeterminados y leer o investigar los mensajes de error para corregir sus propios errores.

Debe completar correctamente todas las tareas dentro del período establecido para obtener una puntuación del 100%.

Configuración y requisitos

Antes de hacer clic en el botón Comenzar lab

Lee estas instrucciones. Los labs cuentan con un temporizador que no se puede pausar. El temporizador, que comienza a funcionar cuando haces clic en Comenzar lab, indica por cuánto tiempo tendrás a tu disposición los recursos de Google Cloud.

Este lab práctico te permitirá realizar las actividades correspondientes en un entorno de nube real, no en uno de simulación o demostración. Para ello, se te proporcionan credenciales temporales nuevas que utilizarás para acceder a Google Cloud durante todo el lab.

Para completar este lab, necesitarás lo siguiente:

Acceso a un navegador de Internet estándar. Se recomienda el navegador Chrome.

Nota: Usa una ventana del navegador privada o de incógnito (opción recomendada) para ejecutar el lab. Así evitarás conflictos entre tu cuenta personal y la cuenta de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.

Tiempo para completar el lab (recuerda que, una vez que comienzas un lab, no puedes pausarlo).

Nota: Usa solo la cuenta de estudiante para este lab. Si usas otra cuenta de Google Cloud, es posible que se apliquen cargos a esa cuenta.

Situación del desafío

Estás comenzando tu carrera en arquitectura de nube (nivel junior). En este puesto, se te asignó trabajar en un proyecto de equipo que requiere que uses los servicios de la API de Cloud Speech en Google Cloud.

Se espera que tengas las habilidades y el conocimiento necesarios para completar las tareas que se indican a continuación.

Tu desafío

Para este desafío, debes transcribir voz a texto en diferentes idiomas con la API de Cloud Speech.

Haz lo siguiente:

Crea voces sintéticas a partir de texto con la API de Text-to-Speech.
Crea una clave de API.
Realiza transcripción de voz a texto con la API de Cloud Speech.
Traduce texto con la API de Cloud Translation.
Detecta un idioma con la API de Cloud Translation.

Para este lab de desafío, se configuró una instancia de máquina virtual (VM) llamada para que completes las tareas de la 2 a la 5.

A continuación, se describe cada tarea en detalle. ¡Buena suerte!

Tarea 1: Crea una clave de API

Para esta tarea, debes crear una clave de API que usarás en esta y otras tareas cuando envíes una solicitud a la API de Speech-to-Text.

Guarda la clave de API para usarla en otras tareas.

Haz clic en Revisar mi progreso para verificar el objetivo. Crea una clave de API

Tarea 2: Crea voces sintéticas a partir de texto con la API de Text-to-Speech

Para esta tarea, conéctate a la instancia de VM que se te aprovisionó a través de SSH.
Activa el entorno virtual con el comando source venv/bin/activate.
Con un editor de texto (como nano o vim), crea un archivo llamado synthesize-text.json y pega lo siguiente en él:

{ 'input':{ 'text':'Cloud Text-to-Speech API allows developers to include natural-sounding, synthetic human speech as playable audio in their applications. The Text-to-Speech API converts text or Speech Synthesis Markup Language (SSML) input into audio data like MP3 or LINEAR16 (the encoding used in WAV files).' }, 'voice':{ 'languageCode':'en-gb', 'name':'en-GB-Standard-A', 'ssmlGender':'FEMALE' }, 'audioConfig':{ 'audioEncoding':'MP3' } }

Llama a la API de Text-to-Speech para sintetizar el texto del archivo synthesize-text.json y almacena el resultado en un archivo llamado .
Con un editor de texto (como nano o vim), crea un archivo llamado tts_decode.py y pega el siguiente código en él:

import argparse from base64 import decodebytes import json """ Usage: python tts_decode.py --input "{{{project_0.startup_script.synthesize_response | Filled in at lab start}}}" \ --output "synthesize-text-audio.mp3" """ def decode_tts_output(input_file, output_file): """ Decode output from Cloud Text-to-Speech. input_file: the response from Cloud Text-to-Speech output_file: the name of the audio file to create """ with open(input_file) as input: response = json.load(input) audio_data = response['audioContent'] with open(output_file, "wb") as new_file: new_file.write(decodebytes(audio_data.encode('utf-8'))) if __name__ == '__main__': parser = argparse.ArgumentParser( description="Decode output from Cloud Text-to-Speech", formatter_class=argparse.RawDescriptionHelpFormatter) parser.add_argument('--input', help='The response from the Text-to-Speech API.', required=True) parser.add_argument('--output', help='The name of the audio file to create', required=True) args = parser.parse_args() decode_tts_output(args.input, args.output)

Ahora, para crear un archivo de audio con la respuesta que recibiste de la API de Text-to-Speech, ejecuta el siguiente comando desde Cloud Shell:

python tts_decode.py --input "synthesize-text.txt" --output "synthesize-text-audio.mp3"

Esto crea un nuevo archivo MP3 llamado synthesize-text-audio.mp3.

Por último, para escuchar el archivo de audio, descárgalo con la opción DESCARGAR EL ARCHIVO de la sesión SSH de la instancia de VM.

Haz clic en Revisar mi progreso para verificar el objetivo. Crear voces sintéticas a partir de texto con la API de Text-to-Speech

Tarea 3: Realiza transcripción de voz a texto con la API de Cloud Speech

Nota: En este lab, se usa un archivo ya registrado que está disponible en Cloud Storage: gs://cloud-samples-data/speech/corbeau_renard.flac. Puedes escuchar este archivo.

Para esta tarea, conéctate a la instancia de VM que se te aprovisionó a través de SSH.
Con un editor de texto (como nano o vim), crea un archivo llamado como tu solicitud a la API para transcribir el archivo de audio disponible en la ubicación gs://cloud-samples-data/speech/corbeau_renard.flac al francés.
Llama a y almacena el resultado en un archivo llamado .

Haz clic en Revisar mi progreso para verificar el objetivo. Crear la solicitud a la API para la transcripción al francés

Tarea 4: Traduce texto con la API de Cloud Translation

Para esta tarea, conéctate a la instancia de VM que se te aprovisionó a través de SSH.
Traduce la oración al idioma inglés llamando a la API de Cloud Translation y almacena el resultado en el archivo .

Haz clic en Revisar mi progreso para verificar el objetivo. Traducir texto con la API de Cloud Translation

Tarea 5: Detecta un idioma con la API de Cloud Translation

Para esta tarea, conéctate a la instancia de VM que se te aprovisionó a través de SSH.
Detecta el idioma de la oración llamando a la API de Cloud Translation y almacena el resultado en el archivo .

Haz clic en Revisar mi progreso para verificar el objetivo. Detectar un idioma con la API de Cloud Translation

¡Felicitaciones!

Creaste correctamente voz sintética a partir de texto con la API de Text-to-Speech, transcribiste voz a texto con la API de Cloud Speech y, además, tradujiste texto y detectaste un idioma con la API de Cloud Translation.

Capacitación y certificación de Google Cloud

Recibe la formación que necesitas para aprovechar al máximo las tecnologías de Google Cloud. Nuestras clases incluyen habilidades técnicas y recomendaciones para ayudarte a avanzar rápidamente y a seguir aprendiendo. Para que puedas realizar nuestros cursos cuando más te convenga, ofrecemos distintos tipos de capacitación de nivel básico a avanzado: a pedido, presenciales y virtuales. Las certificaciones te ayudan a validar y demostrar tus habilidades y tu conocimiento técnico respecto a las tecnologías de Google Cloud.

Actualización más reciente del manual: 30 de noviembre de 2023

Prueba más reciente del lab: 4 de diciembre de 2023

Copyright 2025 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.

Tres formas de usar la API de Cloud Speech: Lab de desafío

Tres formas de usar la API de Cloud Speech: Lab de desafío

ARC132

Descripción general

Configuración y requisitos

Antes de hacer clic en el botón Comenzar lab

Situación del desafío

Tu desafío

Tarea 1: Crea una clave de API

Tarea 2: Crea voces sintéticas a partir de texto con la API de Text-to-Speech

Tarea 3: Realiza transcripción de voz a texto con la API de Cloud Speech

Tarea 4: Traduce texto con la API de Cloud Translation

Tarea 5: Detecta un idioma con la API de Cloud Translation

¡Felicitaciones!

Capacitación y certificación de Google Cloud

Antes de comenzar

Usa la navegación privada

Accede a la consola

Usa la navegación privada para ejecutar el lab