arrow_back

Cloud Speech API 3 つの方法: チャレンジラボ

ログイン 参加
700 以上のラボとコースにアクセス

Cloud Speech API 3 つの方法: チャレンジラボ

ラボ 45分 universal_currency_alt クレジット: 1 show_chart 入門
info このラボでは、学習をサポートする AI ツールが組み込まれている場合があります。
700 以上のラボとコースにアクセス

ARC132

Google Cloud セルフペース ラボのロゴ

概要

チャレンジラボでは、シナリオと一連のタスクが提供されます。手順ガイドに沿って進める形式ではなく、コース内のラボで習得したスキルを駆使して、ご自身でタスクを完了していただきます。タスクが適切に完了したかどうかは、このページに表示される自動スコアリング システムで確認できます。

チャレンジラボは、Google Cloud の新しいコンセプトについて学習するためのものではありません。デフォルト値を変更する、エラー メッセージを読み調査を行ってミスを修正するなど、習得したスキルを応用する能力が求められます。

100% のスコアを達成するには、制限時間内に全タスクを完了する必要があります。

設定と要件

[ラボを開始] ボタンをクリックする前に

こちらの説明をお読みください。ラボには時間制限があり、一時停止することはできません。タイマーは、Google Cloud のリソースを利用できる時間を示しており、[ラボを開始] をクリックするとスタートします。

このハンズオンラボでは、シミュレーションやデモ環境ではなく実際のクラウド環境を使って、ラボのアクティビティを行います。そのため、ラボの受講中に Google Cloud にログインおよびアクセスするための、新しい一時的な認証情報が提供されます。

このラボを完了するためには、下記が必要です。

  • 標準的なインターネット ブラウザ(Chrome を推奨)
注: このラボの実行には、シークレット モード(推奨)またはシークレット ブラウジング ウィンドウを使用してください。これにより、個人アカウントと受講者アカウント間の競合を防ぎ、個人アカウントに追加料金が発生しないようにすることができます。
  • ラボを完了するための時間(開始後は一時停止できません)
注: このラボでは、受講者アカウントのみを使用してください。別の Google Cloud アカウントを使用すると、そのアカウントに料金が発生する可能性があります。

チャレンジ シナリオ

あなたは新米のクラウド アーキテクトとしてキャリアをスタートします。この役割でチーム プロジェクトの一員となり、Google Cloud の Cloud Speech API サービスを使用する仕事を割り当てられました。

また、以下のタスクを完了するために必要なスキルと知識があると想定されています。

チャレンジ

このチャレンジでは、Cloud Speech API を使用して、さまざまな言語の音声入力を文字起こしする必要があります。

次の操作を行う必要があります。

  • Text-to-Speech API を使用して、テキストから合成音声を作成する。
  • API キーを作成する。
  • Cloud Speech API を使用して音声入力を文字起こしする。
  • Cloud Translation API を使用してテキストを翻訳する。
  • Cloud Translation API を使用して言語を検出する。

このチャレンジラボでは、タスク 2~5 を完了するために、「」という名前の仮想マシン(VM)インスタンスが構成されています。

それぞれのタスクについて以下に詳しく説明します。それでは始めましょう。

タスク 1. API キーを作成する

  1. このタスクでは、Speech-to-Text API にリクエストを送信する際に、このタスクや他のタスクで使用する API キーを作成する必要があります。
  1. 他のタスクでも使用できるよう、作成した API キーを保存します。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。 API キーを作成する

タスク 2. Text-to-Speech API を使用してテキストから合成音声を作成する

  1. このタスクでは、プロビジョニングされた VM インスタンス SSH を介して接続します。

  2. source venv/bin/activate コマンドを使用して仮想環境を有効にします。

  3. テキスト エディタ(nanovim など)を使用して、synthesize-text.json という名前のファイルを作成し、次の内容を貼り付けます。

{ 'input':{ 'text':'Cloud Text-to-Speech API allows developers to include natural-sounding, synthetic human speech as playable audio in their applications. The Text-to-Speech API converts text or Speech Synthesis Markup Language (SSML) input into audio data like MP3 or LINEAR16 (the encoding used in WAV files).' }, 'voice':{ 'languageCode':'en-gb', 'name':'en-GB-Standard-A', 'ssmlGender':'FEMALE' }, 'audioConfig':{ 'audioEncoding':'MP3' } }
  1. Text-to-Speech API を呼び出して synthesize-text.json ファイルのテキストを合成し、結果を という名前のファイルに保存します。

  2. テキスト エディタ(nanovim など)を使用して、tts_decode.py という名前のファイルを作成し、次のコードを貼り付けます。

import argparse from base64 import decodebytes import json """ Usage: python tts_decode.py --input "{{{project_0.startup_script.synthesize_response | Filled in at lab start}}}" \ --output "synthesize-text-audio.mp3" """ def decode_tts_output(input_file, output_file): """ Decode output from Cloud Text-to-Speech. input_file: the response from Cloud Text-to-Speech output_file: the name of the audio file to create """ with open(input_file) as input: response = json.load(input) audio_data = response['audioContent'] with open(output_file, "wb") as new_file: new_file.write(decodebytes(audio_data.encode('utf-8'))) if __name__ == '__main__': parser = argparse.ArgumentParser( description="Decode output from Cloud Text-to-Speech", formatter_class=argparse.RawDescriptionHelpFormatter) parser.add_argument('--input', help='The response from the Text-to-Speech API.', required=True) parser.add_argument('--output', help='The name of the audio file to create', required=True) args = parser.parse_args() decode_tts_output(args.input, args.output)
  1. 次に Cloud Shell から次のコマンドを実行し、Text-to-Speech API から受け取ったレスポンスを使用して音声ファイルを作成します。
python tts_decode.py --input "synthesize-text.txt" --output "synthesize-text-audio.mp3"

これにより、synthesize-text-audio.mp3 という名前の新しい MP3 ファイルが作成されます。

  1. 最後に、VM インスタンスの SSH セッションの [DOWNLOAD FILE] オプションを使用して音声ファイルをダウンロードし、再生します。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。 Text-to-Speech API を使用してテキストから合成音声を作成する

タスク 3. Cloud Speech API を使用して音声入力を文字起こしする。

注: このラボでは、あらかじめ録音されているファイルを使用します。このファイルは Cloud Storage(gs://cloud-samples-data/speech/corbeau_renard.flac)に用意されています。ここをクリックすると、このファイルを聞くことができます。
  1. このタスクでは、プロビジョニングされた VM インスタンス SSH を介して接続します。

  2. テキスト エディタ(nanovim など)を使用して、gs://cloud-samples-data/speech/corbeau_renard.flac にある音声ファイルをフランス語で文字起こしする API リクエストとして、「」という名前のファイルを作成します。

  3. を呼び出し、結果を「」という名前のファイルに保存します。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。 フランス語で音声文字変換するための API リクエストを作成する

タスク 4. Cloud Translation API を使用してテキストを翻訳する

  1. このタスクでは、プロビジョニングされた VM インスタンス SSH を介して接続します。

  2. Cloud Translation API を呼び出して、「」という文を英語に翻訳し、結果を ファイルに保存します。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。 Cloud Translation API を使用してテキストを翻訳する

タスク 5. Cloud Translation API を使用して言語を検出する

  1. このタスクでは、プロビジョニングされた VM インスタンス SSH を介して接続します。

  2. Cloud Translation API を呼び出して「」という文の言語を検出し、結果を ファイルに保存します。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。 Cloud Translation API を使用して言語を検出する

お疲れさまでした

Text-to-Speech API を使用してテキストからの合成音声の作成を、Cloud Speech API を使用して音声文字変換を、Cloud Translation API を使用してテキストの翻訳と言語の検出を完了しました。

Google Cloud トレーニングと認定資格

Google Cloud トレーニングと認定資格を通して、Google Cloud 技術を最大限に活用できるようになります。必要な技術スキルとベスト プラクティスについて取り扱うクラスでは、学習を継続的に進めることができます。トレーニングは基礎レベルから上級レベルまであり、オンデマンド、ライブ、バーチャル参加など、多忙なスケジュールにも対応できるオプションが用意されています。認定資格を取得することで、Google Cloud テクノロジーに関するスキルと知識を証明できます。

マニュアルの最終更新日: 2023年 11 月 30 日

ラボの最終テスト日: 2023 年 12 月 4 日

Copyright 2025 Google LLC. All rights reserved. Google および Google のロゴは Google LLC の商標です。その他すべての企業名および商品名はそれぞれ各社の商標または登録商標です。

始める前に

  1. ラボでは、Google Cloud プロジェクトとリソースを一定の時間利用します
  2. ラボには時間制限があり、一時停止機能はありません。ラボを終了した場合は、最初からやり直す必要があります。
  3. 画面左上の [ラボを開始] をクリックして開始します

シークレット ブラウジングを使用する

  1. ラボで使用するユーザー名パスワードをコピーします
  2. プライベート モードで [コンソールを開く] をクリックします

コンソールにログインする

    ラボの認証情報を使用して
  1. ログインします。他の認証情報を使用すると、エラーが発生したり、料金が発生したりする可能性があります。
  2. 利用規約に同意し、再設定用のリソースページをスキップします
  3. ラボを終了する場合や最初からやり直す場合を除き、[ラボを終了] はクリックしないでください。クリックすると、作業内容がクリアされ、プロジェクトが削除されます

このコンテンツは現在ご利用いただけません

利用可能になりましたら、メールでお知らせいたします

ありがとうございます。

利用可能になりましたら、メールでご連絡いたします

1 回に 1 つのラボ

既存のラボをすべて終了して、このラボを開始することを確認してください

シークレット ブラウジングを使用してラボを実行する

このラボの実行には、シークレット モードまたはシークレット ブラウジング ウィンドウを使用してください。これにより、個人アカウントと受講者アカウントの競合を防ぎ、個人アカウントに追加料金が発生することを防ぎます。