arrow_back

Google Cloud Speech API: Qwik Start

Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

Google Cloud Speech API: Qwik Start

Lab 30 годин universal_currency_alt 1 кредит show_chart Початковий
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

GSP119

Логотип Google Cloud Self-Paced Labs

Огляд

Google Cloud Speech API забезпечує зручну інтеграцію технологій розпізнавання мовлення Google із додатками розробників. Speech API дає змогу надсилати аудіофайли й отримувати із сервісу транскрибований текст. Щоб дізнатися більше, перегляньте статтю Що таке Google Cloud Speech API?

Чого ви навчитесь

У цій практичній роботі ви навчитеся виконувати наведені нижче дії, щоб налаштувати й використовувати Speech API.

  • Створювати ключ API
  • Створювати запит до Speech API
  • Виконувати запит до Speech API

Налаштування й вимоги

Перш ніж натиснути кнопку Start Lab (Почати практичну роботу)

Ознайомтеся з наведеними нижче вказівками. На виконання практичної роботи відводиться обмежений час, і її не можна призупинити. Щойно ви натиснете Start Lab (Почати практичну роботу), з’явиться таймер, який показуватиме, скільки часу для роботи з ресурсами Google Cloud у вас залишилося.

Ви зможете виконати практичну роботу в дійсному робочому хмарному середовищі (не в симуляції або демонстраційному середовищі). Для цього на час виконання практичної роботи вам надаються тимчасові облікові дані для реєстрації і входу в Google Cloud.

Щоб виконати цю практичну роботу, потрібно мати:

  • стандартний веб-переглядач, наприклад Chrome (рекомендовано)
Примітка. Виконуйте практичну роботу в режимі анонімного перегляду. Так ви уникнете додаткової плати, що може стягуватися з вашого особистого облікового запису внаслідок його конфліктів з обліковим записом для навчання.
  • достатню кількість часу, оскільки почавши практичну роботу, ви не зможете призупинити її
Примітка. Якщо ви маєте особистий обліковий запис або проект Google Cloud, не використовуйте їх для доступу до цієї практичної роботи. Так ви уникнете додаткових стягнень з вашого облікового запису.

Для виконання практичної роботи вам потрібно ввійти в консоль Google Cloud.

Як почати виконувати практичну роботу й увійти в Google Cloud Console

  1. Натисніть кнопку Start Lab (Почати практичну роботу). Якщо за практичну роботу необхідно заплатити, відкриється спливаюче вікно, де ви зможете обрати спосіб оплати. Ліворуч розміщено панель Lab Details (Відомості про практичну роботу) з такими даними:

    • кнопка Open Google Console (Відкрити Google Console);
    • час до закінчення;
    • тимчасові облікові дані, які потрібно використовувати для доступу до цієї практичної роботи;
    • інша необхідна для виконання цієї практичної роботи інформація.
  2. Натисніть Open Google Console (Відкрити Google Console). Завантажаться необхідні ресурси. Потім відкриється нова вкладка зі сторінкою Sign in (Вхід).

    Порада. Упорядковуйте вкладки в окремих вікнах, розміщуючи їх поруч.

    Примітка. Якщо з’явиться вікно Choose an account (Виберіть обліковий запис), натисніть Use Another Account (Увійти в інший обліковий запис).
  3. За потреби скопіюйте Username (Ім’я користувача) з панелі Lab Details (Відомості про практичну роботу) і вставте його у вікні Sign in (Вхід). Натисніть Next (Далі).

  4. Скопіюйте Password (Пароль) з панелі Lab Details (Відомості про практичну роботу) і вставте його у вікні Welcome (Привітання). Натисніть Next (Далі).

    Важливо. Обов’язково використовуйте облікові дані з панелі ліворуч. Не використовуйте облікові дані Google Cloud Skills Boost. Примітка. Якщо ввійти у власний обліковий запис Google Cloud, може стягуватися додаткова плата.
  5. Виконайте наведені нижче дії.

    • Прийміть Умови використання.
    • Не додавайте способи відновлення та двохетапну перевірку (оскільки це тимчасовий обліковий запис).
    • Не реєструйте безкоштовні пробні версії.

Через кілька секунд Cloud Console відкриється в новій вкладці.

Примітка. Ви можете переглянути меню зі списком продуктів і сервісів Google Cloud, натиснувши меню навігації вгорі ліворуч. Значок меню навігації

Завдання 1. Створіть ключ API

Оскільки ви надсилатимете запит до Speech API за допомогою команди curl, вам потрібно згенерувати ключ API, який передаватиметься в URL-адресі цього запиту.

  1. Для створення ключа API натисніть меню навігації > APIs & services (API і сервіси) > Credentials (Облікові дані).

  2. Потім натисніть Create credentials (Створити облікові дані).

  3. У спадному меню виберіть API key (Ключ API).

  4. Скопіюйте щойно згенерований ключ і натисніть Close (Закрити).

Щоб підтвердити виконання завдання, натисніть Check my progress (Підтвердити виконання).

Створіть ключ API

Збережіть отриманий ключ API як змінну середовища, щоб вам не потрібно було вводити його значення в кожному запиті.

Для виконання наступних кроків підключіться через протокол SSH до наданого вам екземпляра.

  1. У меню навігації виберіть Compute Engine. У вікні VM instances (Екземпляри віртуальних машин) з’явиться екземпляр linux-instance.

  2. Натисніть кнопку SSH у рядку з екземпляром linux-instance. Відкриється інтерактивна оболонка.

  3. У командному рядку введіть наведений нижче фрагмент коду, замінивши <YOUR_API_KEY> на згенерований раніше ключ API.

export API_KEY=<YOUR_API_KEY>

Залишайтеся в цьому сеансі SSH до завершення практичної роботи.

Завдання 2. Створіть запит до Speech API

Примітка. Скористайтеся попередньо записаним файлом, доступним у Cloud Storage за цим посиланням: gs://cloud-samples-tests/speech/brooklyn.flac. Прослухайте аудіофайл, перш ніж надсилати його до Speech API.
  1. Створіть файл request.json у командному рядку SSH. За допомогою цього файлу ви надішлете свій запит до speech API.
touch request.json
  1. Відкрийте файл request.json:
nano request.json Примітка. Виберіть редактор для командного рядка, у якому вам зручно працювати: Nano, Vim, Emacs або gcloud. У цій практичній роботі надано вказівки для текстового редактора Nano.
  1. Додайте наведений нижче фрагмент коду у файл request.json зі значенням uri для тестового необробленого аудіофайлу.
{ "config": { "encoding":"FLAC", "languageCode": "en-US" }, "audio": { "uri":"gs://cloud-samples-tests/speech/brooklyn.flac" } }
  1. Натисніть Ctrl + X, а потім – Y, щоб зберегти файл request.json, і Enter, щоб закрити його.

У тілі запиту містяться об’єкти config і audio.

В об’єкті config ви вказуєте, як Speech API має обробити запит. Параметр encoding надає API інформацію про тип аудіокодування для файлу, який ви надсилаєте. FLAC – це тип кодування для файлів із розширенням .raw. Докладніше про типи кодування можна дізнатися в посібнику з RecognitionConfig.

Ви також можете додати інші параметри в об’єкт config, але лише параметр encoding є обов’язковим.

За допомогою об’єкта audio ви передаєте API параметр uri для аудіофайлу в Cloud Storage.

Щоб підтвердити виконання завдання, натисніть Check my progress (Підтвердити виконання).

Створіть запит Speech API

Час виконати запит до Speech API.

Завдання 3. Виконайте запит до Speech API

  1. Передайте тіло запиту разом зі змінною середовища ключа API до Speech API за допомогою команди curl (в одному командному рядку):
curl -s -X POST -H "Content-Type: application/json" --data-binary @request.json \ "https://speech.googleapis.com/v1/speech:recognize?key=${API_KEY}"

Вивід виглядатиме приблизно так:

{ "results": [ { "alternatives": [ { "transcript": "how old is the Brooklyn Bridge", "confidence": 0.98267895 } ] } ] }

Значення transcript поверне від Speech API транскрибований текст вашого аудіофайлу, а значення confidence указуватиме, наскільки точно транскрибовано цей файл.

У запиті вище ви використовували метод syncrecognize. Speech API підтримує синхронне й асинхронне перетворення мовлення на текст. У цьому прикладі ви надіслали окремий аудіофайл, але за допомогою методу syncrecognize можна також виконувати потокове транскрибування мовлення користувача.

Ви створили запит до Speech API, а потім виконали його.

  1. Виконайте наведену нижче команду, щоб зберегти вивід у файлі result.json.
curl -s -X POST -H "Content-Type: application/json" --data-binary @request.json \ "https://speech.googleapis.com/v1/speech:recognize?key=${API_KEY}" > result.json

Щоб підтвердити виконання завдання, натисніть Check my progress (Підтвердити виконання).

Виконайте запит до Speech API

Вітаємо!

Практичну роботу Google Cloud Speech API: Qwik Start, яку можна виконувати у власному темпі, завершено. Ви інтегрували технологію розпізнавання мовлення в додаток, а потім згенерували транскрипцію із сервісу.

Пройдіть квест

Цю практичну роботу можна виконувати у власному темпі. Вона входить до квестів Початок роботи з даними, машинним навчанням і штучним інтелектом та Початок роботи з машинним навчанням: обробка мови. Квест – це низка пов’язаних практичних робіт, що разом складають план навчання. Виконавши всю серію, ви отримаєте значок як відзнаку за досягнення. Значки можна зробити видимими для інших, додавши посилання на них в онлайн-резюме або обліковий запис у соціальній мережі. Зареєструйтеся на цей або будь-який інший квест із цією практичною роботою і відразу отримайте бонус за завершення. Усі доступні квести можна переглянути в каталозі.

Виконайте наступну практичну роботу

Це завдання також входить до низки практичних робіт під назвою Qwik Starts. Вони призначені для ознайомлення з функціями Google Cloud. Такі практичні роботи можна знайти в каталозі за запитом "Qwik Starts".

Наступні кроки/Докладніше

Навчання й сертифікація Google Cloud

…допомагають ефективно використовувати технології Google Cloud. Наші курси передбачають опанування технічних навичок, а також ознайомлення з рекомендаціями, що допоможуть вам швидко зорієнтуватися й вивчити матеріал. Ми пропонуємо курси різних рівнів – від базового до високого. Ви можете вибрати формат навчання (за запитом, онлайн або офлайн) відповідно до власного розкладу. Пройшовши сертифікацію, ви перевірите й підтвердите свої навички та досвід роботи з технологіями Google Cloud.

Посібник востаннє оновлено 15 вересня 2023 року

Практичну роботу востаннє протестовано 13 жовтня 2023 року

© Google LLC 2024. Усі права захищено. Назва та логотип Google є торговельними марками Google LLC. Усі інші назви компаній і продуктів можуть бути торговельними марками відповідних компаній, з якими вони пов’язані.