arrow_back

Membuat Penelusuran Campuran dengan Vertex AI Vector Search

Login Gabung
Dapatkan akses ke 700+ lab dan kursus

Membuat Penelusuran Campuran dengan Vertex AI Vector Search

Lab 1 jam 30 menit universal_currency_alt 1 Kredit show_chart Pengantar
info Lab ini mungkin menggabungkan alat AI untuk mendukung pembelajaran Anda.
Dapatkan akses ke 700+ lab dan kursus

GSP1297

Logo lab mandiri Google Cloud

Ringkasan

Vertex AI Vector Search mendukung penelusuran campuran, yakni pola arsitektur populer dalam pengambilan informasi (IR) yang menggabungkan penelusuran semantik dan penelusuran kata kunci (juga disebut penelusuran berbasis token). Dengan penelusuran campuran, developer dapat memanfaatkan keunggulan dari kedua pendekatan, sehingga secara efektif memberikan kualitas penelusuran yang lebih tinggi.

Di lab ini, Anda akan mempelajari cara menggunakan penelusuran campuran dengan set data produk merchandise Google. Di akhir lab, Anda akan membandingkan hasil penelusuran campuran dengan penelusuran berbasis token.

Saat Anda memulai lab, lingkungan akan berisi resource yang ditampilkan dalam diagram berikut.

Arsitektur yang disediakan untuk Anda saat peluncuran lab.

Di akhir lab, Anda akan telah menggunakan arsitektur untuk melakukan beberapa tugas.

Arsitektur yang Anda bangun setelah menyelesaikan lab.

Tabel berikut memberikan penjelasan mendetail tentang tiap tugas yang berkaitan dengan arsitektur lab.

Tugas Bernomor Detail
1. Membuka notebook di Vertex AI Workbench dan memilih kernel.
2. Menginstal paket, dan mengonfigurasi notebook untuk project Anda:
Anda akan menggunakan Google Gen AI SDK untuk bekerja dengan model embedding teks melalui Developer API dan Vertex AI. Anda harus menginstal library Python dan menggunakannya di sepanjang lab. Anda juga perlu mengonfigurasi notebook agar memiliki akses ke resource di project Anda, seperti bucket Cloud Storage yang disediakan untuk Anda saat peluncuran lab.
3. Menyiapkan set data:
Dalam tugas ini, Anda akan mendownload file .csv set data yang mencakup item Google Merch Shop, dan menambahkannya ke DataFrame Pandas.
4. Menggunakan Penelusuran Berbasis Token:
Anda akan melatih vectorizer, yaitu model yang menghasilkan embedding renggang dari teks, lalu menerapkannya ke set data.
5. Membuat endpoint indeks:
Sebelum dapat menggunakan penelusuran campuran di Vertex AI Vector Search, Anda harus membuat endpoint indeks.
6. Membuat indeks kueri campuran dan men-deploy-nya ke endpoint:
Anda akan mendapatkan model 'text-embedding-005' untuk menghasilkan embedding padat untuk item set data Anda, yang akan digabungkan dengan embedding renggang untuk membuat indeks campuran. Setelah selesai, Anda akan men-deploy indeks campuran ke endpoint Anda.
7. Menjalankan kueri campuran:
Setelah indeks di-deploy, Anda harus membuat objek HybridQuery terlebih dahulu untuk mengenkapsulasi embedding renggang dari teks kueri, lalu Anda dapat menjalankan kueri.

Prasyarat

Sebelum memulai lab ini, Anda sebaiknya sudah mengetahui:

  • Pemrograman Python dasar.
  • Konsep API secara umum.
  • Cara menjalankan kode Python di notebook Jupyter di Vertex AI Workbench.

Tujuan

Dalam lab ini, Anda akan:

  • Menggunakan penelusuran campuran di Vertex AI Vector Search.
  • Membuat indeks penelusuran campuran dan men-deploy-nya.
  • Membuat kueri indeks penelusuran campuran.

Penyiapan dan persyaratan

Sebelum mengklik tombol Start Lab

Baca petunjuk ini. Lab memiliki timer dan Anda tidak dapat menjedanya. Timer yang dimulai saat Anda mengklik Start Lab akan menampilkan durasi ketersediaan resource Google Cloud untuk Anda.

Lab interaktif ini dapat Anda gunakan untuk melakukan aktivitas lab di lingkungan cloud sungguhan, bukan di lingkungan demo atau simulasi. Untuk mengakses lab ini, Anda akan diberi kredensial baru yang bersifat sementara dan dapat digunakan untuk login serta mengakses Google Cloud selama durasi lab.

Untuk menyelesaikan lab ini, Anda memerlukan:

  • Akses ke browser internet standar (disarankan browser Chrome).
Catatan: Gunakan jendela Samaran (direkomendasikan) atau browser pribadi untuk menjalankan lab ini. Hal ini akan mencegah konflik antara akun pribadi Anda dan akun siswa yang dapat menyebabkan tagihan ekstra pada akun pribadi Anda.
  • Waktu untuk menyelesaikan lab. Ingat, setelah dimulai, lab tidak dapat dijeda.
Catatan: Hanya gunakan akun siswa untuk lab ini. Jika Anda menggunakan akun Google Cloud yang berbeda, Anda mungkin akan dikenai tagihan ke akun tersebut.

Cara memulai lab dan login ke Google Cloud Console

  1. Klik tombol Start Lab. Jika Anda perlu membayar lab, dialog akan terbuka untuk memilih metode pembayaran. Di sebelah kiri ada panel Lab Details yang berisi hal-hal berikut:

    • Tombol Open Google Cloud console
    • Waktu tersisa
    • Kredensial sementara yang harus Anda gunakan untuk lab ini
    • Informasi lain, jika diperlukan, untuk menyelesaikan lab ini
  2. Klik Open Google Cloud console (atau klik kanan dan pilih Open Link in Incognito Window jika Anda menjalankan browser Chrome).

    Lab akan menjalankan resource, lalu membuka tab lain yang menampilkan halaman Sign in.

    Tips: Atur tab di jendela terpisah secara berdampingan.

    Catatan: Jika Anda melihat dialog Choose an account, klik Use Another Account.
  3. Jika perlu, salin Username di bawah dan tempel ke dialog Sign in.

    {{{user_0.username | "Username"}}}

    Anda juga dapat menemukan Username di panel Lab Details.

  4. Klik Next.

  5. Salin Password di bawah dan tempel ke dialog Welcome.

    {{{user_0.password | "Password"}}}

    Anda juga dapat menemukan Password di panel Lab Details.

  6. Klik Next.

    Penting: Anda harus menggunakan kredensial yang diberikan lab. Jangan menggunakan kredensial akun Google Cloud Anda. Catatan: Menggunakan akun Google Cloud sendiri untuk lab ini dapat dikenai biaya tambahan.
  7. Klik halaman berikutnya:

    • Setujui persyaratan dan ketentuan.
    • Jangan tambahkan opsi pemulihan atau autentikasi 2 langkah (karena ini akun sementara).
    • Jangan mendaftar uji coba gratis.

Setelah beberapa saat, Konsol Google Cloud akan terbuka di tab ini.

Catatan: Untuk mengakses produk dan layanan Google Cloud, klik Navigation menu atau ketik nama layanan atau produk di kolom Search. Ikon Navigation menu dan kolom Search

Tugas 1. Membuka notebook di Vertex AI Workbench dan memilih kernel

  1. Di Konsol Google Cloud, pada Navigation menu (Ikon Navigation menu), klik Vertex AI > Workbench.

  2. Cari instance lalu klik tombol Open JupyterLab.

Antarmuka JupyterLab untuk instance Workbench Anda akan terbuka di tab browser baru.

Catatan: Jika Anda tidak melihat notebook di JupyterLab, ikuti langkah tambahan berikut untuk mereset instance:

1. Tutup tab browser untuk JupyterLab, lalu kembali ke halaman beranda Workbench.

2. Pilih kotak centang di samping nama instance, lalu klik Reset.

3. Setelah tombol Open JupyterLab diaktifkan kembali, tunggu satu menit, lalu klik Open JupyterLab.

  1. Buka file .

  2. Pada dialog Select Kernel, pilih Python 3 dari daftar kernel yang tersedia.

Tugas 2. Menginstal paket dan mengonfigurasi notebook.

Untuk mulai menggunakan notebook, Anda akan memulai dengan bagian 1, Membuat embedding renggang.

Dalam tugas ini, Anda akan menginstal paket Python yang diperlukan, memulai ulang runtime kernel, mengonfigurasi notebook untuk menggunakan project dan region Anda, serta mengimpor library.

  1. Selesaikan sel di Tugas 2, Menginstal paket dan mengonfigurasi notebook.

    Untuk Project ID, gunakan , dan untuk Location, gunakan , jika kolom ini belum terisi.

Klik Periksa progres saya untuk memverifikasi tujuan. Menginstal paket dan mengonfigurasi notebook.

Tugas 3. Menyiapkan set data

Dalam tugas ini, Anda akan mendownload file .csv set data dan menyiapkannya untuk digunakan dengan notebook Anda.

  1. Selesaikan semua sel di Tugas 3 Menyiapkan set data dalam notebook.

Klik Periksa progres saya untuk memverifikasi tujuan. Menyiapkan set data.

Tugas 4. Membuat embedding renggang

Dalam tugas ini, Anda akan membuat embedding renggang dan menelusuri item "Chrome Dino Pin" dalam set data untuk mendapatkan nilai dan dimensi berbasis vektor. Anda juga akan mengambil nilai ini untuk produk lain dalam set data. Kemudian Anda akan menyimpannya ke file items.json di dalam Workbench dan menyalin file ini ke bucket Cloud Storage Anda.

  1. Jalankan tugas Create sparse embedding di notebook.

Klik Periksa progres saya untuk memverifikasi tujuan. Membuat embedding renggang.

Tugas 5. Membuat endpoint indeks

Sekarang Anda akan melanjutkan proses ke bagian 2 dari notebook tempat Anda akan menggunakan penelusuran campuran.

Pertama, dalam tugas kelima ini, Anda akan membuat endpoint indeks.

  1. Jalankan tugas Create an index endpoint di notebook.

Klik Periksa progres saya untuk memverifikasi tujuan. Membuat endpoint indeks.

Tugas 6. Membuat indeks campuran dan men-deploy-nya ke Endpoint

Dalam tugas ini, Anda akan mengambil model embedding teks, menjalankan kueri sampel untuk embedding renggang untuk satu item, lalu untuk semua item. Anda kemudian akan menyimpannya dalam file items.json. Kemudian, Anda akan membuat indeks campuran dari file ini dan men-deploy indeks tersebut ke endpoint.

  1. Jalankan tugas Create the hybrid index and deploy it to the endpoint di notebook.
Catatan: Pembuatan indeks campuran memerlukan waktu sekitar 4 hingga 5 menit. Catatan: Deployment indeks campuran memerlukan waktu 30 menit untuk diselesaikan.

Sambil menunggu indeks campuran di-deploy, Anda dapat mengamati deployment-nya dengan membuka Vertex AI > Vector Search > Index Endpoints.

Anda juga dapat meluangkan waktu untuk meninjau demo ini. Demo ini memberikan contoh realistis yang akan membantu Anda mempelajari cara kerja Vector Search, menjelajahi penelusuran semantik dan campuran, serta melihat cara kerja pemeringkatan ulang. Kirimkan deskripsi singkat tentang hewan, tumbuhan, merchandise e-commerce, atau item lainnya, dan biarkan Vector Search menyelesaikan langkah berikutnya.

Penting: Anda perlu mengakses Vertex AI Vector Search dengan membuka Vertex AI > Vector Search dan mengakses Indeks serta Endpoint Indeks yang tercantum. Anda akan melihat perubahan status saat pembuatan resource diselesaikan.

Klik Periksa progres saya untuk memverifikasi tujuan. Membuat indeks campuran dan men-deploy-nya ke endpoint.

Tugas 7. Menjalankan kueri campuran

Dalam tugas ini, Anda akan menjalankan kueri campuran dengan indeks campuran yang baru saja di-deploy dan Anda akan membandingkan hasil kueri ini dengan embedding renggang.

  1. Jalankan tugas Run a hybrid query di notebook.

Klik Periksa progres saya untuk memverifikasi tujuan. Menjalankan kueri campuran.

Selamat!

Di lab ini, Anda telah mempelajari cara menggunakan penelusuran campuran di Vertex AI Vector Search, termasuk membuat dan men-deploy indeks penelusuran campuran, serta membuat kueri untuk dibandingkan dengan embedding renggang.

Langkah berikutnya/pelajari lebih lanjut

Baca referensi berikut untuk mempelajari Gemini lebih lanjut:

Sertifikasi dan pelatihan Google Cloud

...membantu Anda mengoptimalkan teknologi Google Cloud. Kelas kami mencakup keterampilan teknis dan praktik terbaik untuk membantu Anda memahami dengan cepat dan melanjutkan proses pembelajaran. Kami menawarkan pelatihan tingkat dasar hingga lanjutan dengan opsi on demand, live, dan virtual untuk menyesuaikan dengan jadwal Anda yang sibuk. Sertifikasi membantu Anda memvalidasi dan membuktikan keterampilan serta keahlian Anda dalam teknologi Google Cloud.

Manual Terakhir Diperbarui pada 10 Juli 2025

Lab Terakhir Diuji pada 13 Juni 2025

Hak cipta 2025 Google LLC. Semua hak dilindungi undang-undang. Google dan logo Google adalah merek dagang dari Google LLC. Semua nama perusahaan dan produk lain mungkin adalah merek dagang masing-masing perusahaan yang bersangkutan.

Sebelum memulai

  1. Lab membuat project dan resource Google Cloud untuk jangka waktu tertentu
  2. Lab memiliki batas waktu dan tidak memiliki fitur jeda. Jika lab diakhiri, Anda harus memulainya lagi dari awal.
  3. Di kiri atas layar, klik Start lab untuk memulai

Gunakan penjelajahan rahasia

  1. Salin Nama Pengguna dan Sandi yang diberikan untuk lab tersebut
  2. Klik Open console dalam mode pribadi

Login ke Konsol

  1. Login menggunakan kredensial lab Anda. Menggunakan kredensial lain mungkin menyebabkan error atau dikenai biaya.
  2. Setujui persyaratan, dan lewati halaman resource pemulihan
  3. Jangan klik End lab kecuali jika Anda sudah menyelesaikan lab atau ingin mengulanginya, karena tindakan ini akan menghapus pekerjaan Anda dan menghapus project

Konten ini tidak tersedia untuk saat ini

Kami akan memberi tahu Anda melalui email saat konten tersedia

Bagus!

Kami akan menghubungi Anda melalui email saat konten tersedia

Satu lab dalam satu waktu

Konfirmasi untuk mengakhiri semua lab yang ada dan memulai lab ini

Gunakan penjelajahan rahasia untuk menjalankan lab

Gunakan jendela Samaran atau browser pribadi untuk menjalankan lab ini. Langkah ini akan mencegah konflik antara akun pribadi Anda dan akun Siswa yang dapat menyebabkan tagihan ekstra pada akun pribadi Anda.