GSP119

Ringkasan
Speech-to-Text API memungkinkan integrasi teknologi pengenalan ucapan Google ke dalam aplikasi developer dengan mudah. Dengan Speech-to-Text API, Anda dapat mengirim audio dan menerima transkripsi teks dari layanan.
Yang akan Anda pelajari
Di lab ini, Anda akan mempelajari cara:
- Membuat Kunci API
- Membuat permintaan Speech-to-Text API
- Memanggil Speech-to-Text API
Penyiapan dan persyaratan
Sebelum mengklik tombol Start Lab
Baca petunjuk ini. Lab memiliki timer dan Anda tidak dapat menjedanya. Timer yang dimulai saat Anda mengklik Start Lab akan menampilkan durasi ketersediaan resource Google Cloud untuk Anda.
Lab interaktif ini dapat Anda gunakan untuk melakukan aktivitas lab di lingkungan cloud sungguhan, bukan di lingkungan demo atau simulasi. Untuk mengakses lab ini, Anda akan diberi kredensial baru yang bersifat sementara dan dapat digunakan untuk login serta mengakses Google Cloud selama durasi lab.
Untuk menyelesaikan lab ini, Anda memerlukan:
- Akses ke browser internet standar (disarankan browser Chrome).
Catatan: Gunakan jendela Samaran (direkomendasikan) atau browser pribadi untuk menjalankan lab ini. Hal ini akan mencegah konflik antara akun pribadi Anda dan akun siswa yang dapat menyebabkan tagihan ekstra pada akun pribadi Anda.
- Waktu untuk menyelesaikan lab. Ingat, setelah dimulai, lab tidak dapat dijeda.
Catatan: Hanya gunakan akun siswa untuk lab ini. Jika Anda menggunakan akun Google Cloud yang berbeda, Anda mungkin akan dikenai tagihan ke akun tersebut.
Cara memulai lab dan login ke Google Cloud Console
-
Klik tombol Start Lab. Jika Anda perlu membayar lab, dialog akan terbuka untuk memilih metode pembayaran.
Di sebelah kiri ada panel Lab Details yang berisi hal-hal berikut:
- Tombol Open Google Cloud console
- Waktu tersisa
- Kredensial sementara yang harus Anda gunakan untuk lab ini
- Informasi lain, jika diperlukan, untuk menyelesaikan lab ini
-
Klik Open Google Cloud console (atau klik kanan dan pilih Open Link in Incognito Window jika Anda menjalankan browser Chrome).
Lab akan menjalankan resource, lalu membuka tab lain yang menampilkan halaman Sign in.
Tips: Atur tab di jendela terpisah secara berdampingan.
Catatan: Jika Anda melihat dialog Choose an account, klik Use Another Account.
-
Jika perlu, salin Username di bawah dan tempel ke dialog Sign in.
{{{user_0.username | "Username"}}}
Anda juga dapat menemukan Username di panel Lab Details.
-
Klik Next.
-
Salin Password di bawah dan tempel ke dialog Welcome.
{{{user_0.password | "Password"}}}
Anda juga dapat menemukan Password di panel Lab Details.
-
Klik Next.
Penting: Anda harus menggunakan kredensial yang diberikan lab. Jangan menggunakan kredensial akun Google Cloud Anda.
Catatan: Menggunakan akun Google Cloud sendiri untuk lab ini dapat dikenai biaya tambahan.
-
Klik halaman berikutnya:
- Setujui persyaratan dan ketentuan.
- Jangan tambahkan opsi pemulihan atau autentikasi 2 langkah (karena ini akun sementara).
- Jangan mendaftar uji coba gratis.
Setelah beberapa saat, Konsol Google Cloud akan terbuka di tab ini.
Catatan: Untuk mengakses produk dan layanan Google Cloud, klik Navigation menu atau ketik nama layanan atau produk di kolom Search.
Tugas 1. Membuat Kunci API
Karena curl
akan digunakan untuk mengirim permintaan ke Speech-to-Text API, Anda harus membuat kunci API untuk meneruskan URL permintaan kami.
-
Untuk membuat kunci API, klik Navigation menu > APIs & services > Credentials.
-
Kemudian klik Create credentials.
-
Di menu drop-down, pilih API key.
-
Salin kunci yang baru saja Anda buat dan klik Close.
Klik Check my progress untuk memverifikasi tujuan.
Membuat Kunci API
Setelah memiliki kunci API, simpan kunci sebagai variabel lingkungan untuk menghindari keharusan memasukkan nilai kunci API pada setiap permintaan.
Untuk melakukan langkah selanjutnya, hubungkan ke instance yang disediakan untuk Anda menggunakan SSH.
-
Di Navigation menu, pilih Compute Engine. Anda akan melihat linux-instance
yang tercantum di jendela VM instances.
-
Klik tombol SSH yang sesuai dengan linux-instance
. Anda akan diarahkan ke shell interaktif.
-
Di command line, masukkan baris berikut, dengan mengganti <YOUR_API_KEY>
dengan kunci API yang baru saja Anda salin dari kunci yang dibuat sebelumnya:
export API_KEY=<YOUR_API_KEY>
Anda akan tetap berada pada sesi SSH ini hingga akhir lab.
Tugas 2. Membuat permintaan Speech-to-Text API
Catatan: Anda akan menggunakan file rekaman bawaan yang tersedia di Cloud Storage: gs://cloud-samples-tests/speech/brooklyn.flac
.
Dengarkan file audio sebelum mengirimnya ke Speech-to-Text API.
- Buat
request.json
di command line SSH. Anda akan menggunakannya untuk membuat permintaan ke Speech-to-Text API:
touch request.json
- Buka
request.json
:
nano request.json
Catatan:
Anda dapat menggunakan editor command line pilihan Anda (nano
, vim
, emacs
) atau gcloud
. Lab ini akan memberikan petunjuk penggunaan nano
.
- Tambahkan baris berikut ini ke file
request.json
Anda, menggunakan nilai uri
dari sampel file audio raw:
{
"config": {
"encoding":"FLAC",
"languageCode": "en-US"
},
"audio": {
"uri":"gs://cloud-samples-tests/speech/brooklyn.flac"
}
}
- Tekan
control
+ x
lalu y
untuk menyimpan dan tekan Enter
untuk menutup file request.json
.
Bagian isi permintaan memiliki objek config
dan audio
.
Dalam config
, Anda memberi tahu Speech-to-Text API cara memproses permintaan tersebut. Parameter encoding
memberi tahu API jenis encoding audio yang Anda gunakan ketika file sedang dikirim ke API. FLAC
adalah jenis encoding untuk file .raw. Pelajari lebih lanjut jenis encoding di Panduan RecognitionConfig.
Ada parameter lain yang dapat Anda tambahkan ke objek config
Anda, tetapi cukup encoding
saja yang diperlukan.
Pada objek audio
, Anda meneruskan uri file audio ke API di Cloud Storage.
Klik Check my progress untuk memverifikasi tujuan.
Membuat permintaan Speech-to-Text API
Sekarang Anda siap untuk memanggil Speech-to-Text API.
Tugas 3. Memanggil Speech-to-Text API
- Teruskan isi permintaan Anda beserta variabel lingkungan kunci API ke Speech-to-Text API dengan perintah
curl
berikut (semua dalam satu command line tunggal):
curl -s -X POST -H "Content-Type: application/json" --data-binary @request.json \
"https://speech.googleapis.com/v1/speech:recognize?key=${API_KEY}"
Respons Anda akan terlihat seperti ini:
{
"results": [
{
"alternatives": [
{
"transcript": "how old is the Brooklyn Bridge",
"confidence": 0.98267895
}
]
}
]
}
Nilai transcript
akan menampilkan transkripsi teks Speech-to-Text API dari file audio Anda, dan nilai confidence
menunjukkan tingkat keyakinan API dalam mentranskripsikan audio Anda secara akurat.
Akan terlihat bahwa Anda memanggil metode syncrecognize
pada permintaan di atas. Speech-to-Text API mendukung transkripsi speech to text sinkron dan asinkron. Dalam contoh ini Anda mengirimkan file audio lengkap, tetapi Anda juga dapat menggunakan metode syncrecognize
untuk menjalankan streaming transkripsi speech to text selagi pengguna masih berbicara.
Anda telah membuat permintaan Speech-to-Text API, lalu memanggil Speech-to-Text API.
- Jalankan perintah berikut untuk menyimpan respons di file
result.json
:
curl -s -X POST -H "Content-Type: application/json" --data-binary @request.json \
"https://speech.googleapis.com/v1/speech:recognize?key=${API_KEY}" > result.json
Klik Check my progress untuk memverifikasi tujuan.
Memanggil Speech-to-Text API
Selamat!
Anda telah menggunakan Speech-to-Text API untuk mengambil transkrip dari file audio input.
Langkah berikutnya/Pelajari lebih lanjut
Lab ini juga merupakan bagian dari rangkaian lab yang disebut Qwik Start. Lab ini dirancang agar Anda dapat mencoba berbagai fitur yang tersedia dengan Google Cloud. Telusuri "Qwik Start" di katalog lab untuk menemukan lab berikutnya yang ingin Anda ikuti.
Sertifikasi dan pelatihan Google Cloud
...membantu Anda mengoptimalkan teknologi Google Cloud. Kelas kami mencakup keterampilan teknis dan praktik terbaik untuk membantu Anda memahami dengan cepat dan melanjutkan proses pembelajaran. Kami menawarkan pelatihan tingkat dasar hingga lanjutan dengan opsi on demand, live, dan virtual untuk menyesuaikan dengan jadwal Anda yang sibuk. Sertifikasi membantu Anda memvalidasi dan membuktikan keterampilan serta keahlian Anda dalam teknologi Google Cloud.
Manual Terakhir Diperbarui pada 13 Februari 2024
Lab Terakhir Diuji pada 13 Oktober 2023
Hak cipta 2025 Google LLC. Semua hak dilindungi undang-undang. Google dan logo Google adalah merek dagang dari Google LLC. Semua nama perusahaan dan produk lain mungkin adalah merek dagang masing-masing perusahaan yang bersangkutan.