
准备工作
- 实验会创建一个 Google Cloud 项目和一些资源,供您使用限定的一段时间
- 实验有时间限制,并且没有暂停功能。如果您中途结束实验,则必须重新开始。
- 在屏幕左上角,点击开始实验即可开始
Create an API Key
/ 30
Create your Speech API request
/ 30
Call the Speech API for English language
/ 20
Call the Speech API for French language
/ 20
Speech-to-Text API 可將語音檔轉錄成 80 多種語言的文字檔。
在本實驗室,您將傳送音訊檔案至 Speech API 來製作轉錄稿。
本實驗室的學習內容包括:
curl
呼叫 API請詳閱以下操作說明。實驗室活動會計時,且中途無法暫停。點選「Start Lab」後就會開始計時,顯示可使用 Google Cloud 資源的時間。
您將在真正的雲端環境完成實作實驗室活動,而不是模擬或示範環境。為此,我們會提供新的暫時憑證,供您在實驗室活動期間登入及存取 Google Cloud。
為了順利完成這個實驗室,請先確認:
點選「Start Lab」按鈕。如果實驗室會產生費用,畫面上會出現選擇付款方式的對話方塊。左側的「Lab Details」窗格會顯示下列項目:
點選「Open Google Cloud console」;如果使用 Chrome 瀏覽器,也能按一下滑鼠右鍵,選取「在無痕視窗中開啟連結」。
接著,實驗室會啟動相關資源,並開啟另一個分頁,顯示「登入」頁面。
提示:您可以在不同的視窗中並排開啟分頁。
如有必要,請將下方的 Username 貼到「登入」對話方塊。
您也可以在「Lab Details」窗格找到 Username。
點選「下一步」。
複製下方的 Password,並貼到「歡迎使用」對話方塊。
您也可以在「Lab Details」窗格找到 Password。
點選「下一步」。
按過後續的所有頁面:
Google Cloud 控制台稍後會在這個分頁開啟。
您將使用 curl
傳送要求至 Speech-to-Text API,因此必須產生 API 金鑰來傳遞要求網址。
建立 API 金鑰的第一步是打開「導覽選單」 (),依序點選「API 和服務」>「憑證」。
接著按一下「建立憑證」並選取「API 金鑰」。
複製並記下剛產生的金鑰,之後會在本實驗室用到。
點選「關閉」。
點選「Check my progress」確認目標已達成。
請將 API 金鑰儲存為環境變數,這樣就不必在每個要求插入金鑰值。
打開「導覽選單」(),依序點選「Compute Engine」>「VM 執行個體」。
在「VM 執行個體」清單,找出名為 linux-instance 的 VM。VM 名稱右側會顯示詳細資料。
互動式殼層會隨即開啟,請在殼層中完成後續步驟。
<YOUR_API_KEY>
替換成先前複製的金鑰:gs://cloud-samples-data/speech/brooklyn_bridge.flac
。將音訊檔案傳送至 Speech-to-Text API 前,您可以聆聽內容。
request.json
檔案中建立 API 要求。建立 request.json
檔案:gcloud
或您偏好的指令列編輯器 (nano
、vim
、emacs
) 開啟檔案,然後使用原始音訊檔案範本的 uri
值,將下列指令新增至 request.json
檔案:要求主體包含 config
和 audio
物件。
您可以透過 config
,指示 Speech-to-Text API 如何處理要求:
encoding
參數可說明檔案傳送至 API 時使用的音訊編碼類型,FLAC
則是 .raw 檔案的編碼類型 (請參閱 RecognitionConfig 參考文件,進一步瞭解編碼類型)。languageCode
,該項目會預設為英文。您也可以新增其他參數至 config
物件,但 encoding
是唯一必填項目。
在本實驗室的 Cloud Storage 找出音訊檔案後,使用 audio
物件即可將檔案的 uri 傳遞至 API。
點選「Check my progress」確認目標已達成。
現在,您可以呼叫 Speech-to-Text API 了!
curl
指令,傳遞要求主體及 API 金鑰環境變數至 Speech API。請在單一指令列中輸入所有指令:回應內容會儲存於名為 result.json 的檔案,
curl
指令傳回的內容如下:
transcript
值傳回 Speech API 轉錄音訊檔案的成果,confidence
值則表示 API 對正確轉錄音訊的信心程度。
您會發現上述要求呼叫了 syncrecognize
方法。Speech-to-Text API 支援同步和非同步的語音轉文字作業。
在這個例子,您傳送的是談話已結束的音訊檔,但您也能透過 syncrecognize
方法,在使用者還在說話時,即時將語音轉錄為文字。
點選「Check my progress」確認目標已達成。
您說多種語言嗎?Speech-to-Text API 語音轉文字功能支援超過 100 種語言!
只要變更 request.json
的 language_code
參數,就能調整語言。您可以在語言支援指南查看支援的語言清單。
現在來試試法語音訊檔案。您可以在這裡預先聆聽內容。
request.json
,將內容調整如下:再次執行 curl
指令來呼叫 Speech-to-Text API。
查看結果:
您應會看到以下回應內容:
這個句子取自法國詩人尚德拉封丹所寫的著名童話。如果您有其他語言的音訊檔案,也可以試著轉錄。方法一樣:將檔案新增至 Cloud Storage,並變更要求中的 languageCode
參數。
您順利用 Speech API 將語音轉錄為文字了。您將音訊檔案的 Cloud Storage URI 傳遞至 API,並學到傳遞音訊內容的另一種做法:使用 base64 編碼字串。
協助您瞭解如何充分運用 Google Cloud 的技術。我們的課程會介紹專業技能和最佳做法,讓您可以快速掌握要領並持續進修。我們提供從基本到進階等級的訓練課程,並有隨選、線上和虛擬課程等選項,方便您抽空參加。認證可協助您驗證及證明自己在 Google Cloud 技術方面的技能和專業知識。
使用手冊上次更新日期:2024 年 11 月 4 日
實驗室上次測試日期:2024 年 11 月 4 日
Copyright 2025 Google LLC 保留所有權利。Google 和 Google 標誌是 Google LLC 的商標,其他公司和產品名稱則有可能是其關聯公司的商標。
此内容目前不可用
一旦可用,我们会通过电子邮件告知您
太好了!
一旦可用,我们会通过电子邮件告知您
一次一个实验
确认结束所有现有实验并开始此实验