GSP1143

Ringkasan
Dataplex Universal Catalog adalah data fabric cerdas yang memungkinkan organisasi menemukan, mengelola, memantau, dan mengatur data mereka secara terpusat di seluruh data lake, data warehouse, dan data mart untuk mendukung analisis dalam skala besar. Secara khusus, Anda dapat menggunakan Dataplex Universal Catalog untuk membangun arsitektur mesh data, yang merupakan pendekatan organisasi dan teknis yang mendesentralisasi kepemilikan data di antara pemilik data domain.
Dataplex Universal Catalog mengelola data dengan cara yang tidak memerlukan perpindahan atau duplikasi data. Saat Anda menambahkan aset data baru, Dataplex Universal Catalog akan mengumpulkan metadata untuk data terstruktur dan tidak terstruktur, serta mencatat secara otomatis semua metadata di metastore yang aman dan terpadu. Data dan metadata kemudian dapat dinilai melalui layanan Google Cloud seperti Data Catalog dan BigQuery.
Di lab ini, Anda akan mempelajari cara mulai membangun mesh data Anda sendiri dengan membuat dan menghapus data lake, zona, dan aset di Dataplex Universal Catalog menggunakan Konsol Google Cloud.
Yang akan Anda lakukan
- Mengaktifkan Dataplex API
- Membuat data lake
- Menambahkan zona ke data lake
- Menghubungkan dan melepaskan aset
- Menghapus zona dan data lake
Penyiapan dan persyaratan
Sebelum mengklik tombol Start Lab
Baca petunjuk ini. Lab memiliki timer dan Anda tidak dapat menjedanya. Timer yang dimulai saat Anda mengklik Start Lab akan menampilkan durasi ketersediaan resource Google Cloud untuk Anda.
Lab interaktif ini dapat Anda gunakan untuk melakukan aktivitas lab di lingkungan cloud sungguhan, bukan di lingkungan demo atau simulasi. Untuk mengakses lab ini, Anda akan diberi kredensial baru yang bersifat sementara dan dapat digunakan untuk login serta mengakses Google Cloud selama durasi lab.
Untuk menyelesaikan lab ini, Anda memerlukan:
- Akses ke browser internet standar (disarankan browser Chrome).
Catatan: Gunakan jendela Samaran (direkomendasikan) atau browser pribadi untuk menjalankan lab ini. Hal ini akan mencegah konflik antara akun pribadi Anda dan akun siswa yang dapat menyebabkan tagihan ekstra pada akun pribadi Anda.
- Waktu untuk menyelesaikan lab. Ingat, setelah dimulai, lab tidak dapat dijeda.
Catatan: Hanya gunakan akun siswa untuk lab ini. Jika Anda menggunakan akun Google Cloud yang berbeda, Anda mungkin akan dikenai tagihan ke akun tersebut.
Cara memulai lab dan login ke Google Cloud Console
-
Klik tombol Start Lab. Jika Anda perlu membayar lab, dialog akan terbuka untuk memilih metode pembayaran.
Di sebelah kiri ada panel Lab Details yang berisi hal-hal berikut:
- Tombol Open Google Cloud console
- Waktu tersisa
- Kredensial sementara yang harus Anda gunakan untuk lab ini
- Informasi lain, jika diperlukan, untuk menyelesaikan lab ini
-
Klik Open Google Cloud console (atau klik kanan dan pilih Open Link in Incognito Window jika Anda menjalankan browser Chrome).
Lab akan menjalankan resource, lalu membuka tab lain yang menampilkan halaman Sign in.
Tips: Atur tab di jendela terpisah secara berdampingan.
Catatan: Jika Anda melihat dialog Choose an account, klik Use Another Account.
-
Jika perlu, salin Username di bawah dan tempel ke dialog Sign in.
{{{user_0.username | "Username"}}}
Anda juga dapat menemukan Username di panel Lab Details.
-
Klik Next.
-
Salin Password di bawah dan tempel ke dialog Welcome.
{{{user_0.password | "Password"}}}
Anda juga dapat menemukan Password di panel Lab Details.
-
Klik Next.
Penting: Anda harus menggunakan kredensial yang diberikan lab. Jangan menggunakan kredensial akun Google Cloud Anda.
Catatan: Menggunakan akun Google Cloud sendiri untuk lab ini dapat dikenai biaya tambahan.
-
Klik halaman berikutnya:
- Setujui persyaratan dan ketentuan.
- Jangan tambahkan opsi pemulihan atau autentikasi 2 langkah (karena ini akun sementara).
- Jangan mendaftar uji coba gratis.
Setelah beberapa saat, Konsol Google Cloud akan terbuka di tab ini.
Catatan: Untuk mengakses produk dan layanan Google Cloud, klik Navigation menu atau ketik nama layanan atau produk di kolom Search.
Mengaktifkan Cloud Dataplex API
-
Di Konsol Google Cloud, ketikkan Cloud Dataplex API di kotak penelusuran teratas.
-
Klik hasil untuk Cloud Dataplex API di bagian Marketplace.
-
Klik ENABLE.
Tugas 1. Membuat data lake
Di Dataplex Universal Catalog, data lake adalah domain organisasi tertinggi yang mewakili area data atau unit bisnis tertentu. Misalnya, Anda dapat membuat data lake untuk tiap departemen atau data domain di organisasi, agar Anda dapat mengelola dan menyediakan data untuk grup pengguna tertentu.
Dalam tugas ini, Anda akan membuat data lake untuk mulai membangun mesh data.
- Di Konsol Google Cloud, pilih Navigation menu (
) > View all products. Di bagian Analytics, pilih Dataplex Universal Catalog.
Jika muncul dialog Welcome to the new Dataplex Universal Catalog experience
, klik Close.
-
Di bagian Manage lakes, klik Manage.
-
Klik +Create lake.
-
Masukkan informasi yang diperlukan untuk membuat data lake baru:
Properti |
Nilai |
Display Name |
sensors |
ID |
Jangan mengubah nilai default-nya. |
Region |
|
Jangan mengubah nilai default lainnya.
- Klik Create.
Diperlukan waktu hingga 3 menit untuk membuat data lake.
Klik Periksa progres saya untuk memverifikasi tujuan.
Membuat data lake sensors
Tugas 2. Menambahkan zona ke data lake
Setelah membuat data lake, Anda dapat menambahkan zona ke data lake. Zona adalah subdomain di dalam data lake yang dapat Anda gunakan untuk mengategorikan data lebih lanjut. Misalnya, Anda dapat mengategorikan data berdasarkan stage, penggunaan, atau pembatasan.
Terdapat dua jenis zona:
- Zona mentah berisi data dalam format mentah (seperti file di bucket Cloud Storage) dan tidak perlu menjalani pemeriksaan jenis yang ketat.
- Zona kurasi berisi data yang sudah dibersihkan, diformat, dan siap untuk dianalisis, misalnya Tabel BigQuery.
Dalam tugas ini, Anda akan membuat zona mentah untuk mengerjakan file di bucket Cloud Storage.
-
Di tab Manage, klik nama data lake Anda.
-
Klik +Add zone.
-
Masukkan informasi yang diperlukan untuk membuat zona baru:
Properti |
Nilai |
Display Name |
temperature raw data |
ID |
Jangan mengubah nilai default-nya. |
Type |
Raw zone |
Data locations |
Regional |
Jangan mengubah nilai default lainnya.
Misalnya, opsi Enable metadata discovery di bagian Discovery settings diaktifkan secara default dan mengizinkan pengguna yang memiliki otorisasi untuk menemukan data di zona tersebut.
- Klik Create.
Diperlukan waktu hingga 2 menit untuk membuat zona.
Anda dapat melakukan tugas berikutnya setelah status zona ini Active.
Klik Periksa progres saya untuk memverifikasi tujuan.
Menambahkan zona temperature raw data ke data lake sensors
Tugas 3. Menghubungkan aset ke zona
Data yang disimpan di bucket Cloud Storage atau set data BigQuery dapat dihubungkan sebagai aset ke zona di dalam data lake Dataplex Universal Catalog.
Dalam tugas ini, Anda akan menghubungkan bucket Cloud Storage yang Anda buat di Konsol Google Cloud.
-
Di tab Zones, klik nama zona Anda.
-
Di tab Assets, klik +ADD ASSET.
-
Klik +ADD AN ASSET.
-
Masukkan informasi yang diperlukan untuk menghubungkan aset baru:
Properti |
Nilai |
Type |
Storage bucket |
Display Name |
measurements |
ID |
Jangan mengubah nilai default-nya. |
Jangan mengubah nilai default lainnya.
- Untuk Bucket, klik Browse.
Anda dapat menghubungkan bucket Cloud Storage yang sudah ada atau membuat yang baru tanpa keluar dari Dataplex Universal Catalog. Dalam langkah berikutnya, Anda akan membuat bucket Cloud Storage baru dan menghubungkannya ke zona.
-
Klik +Create new bucket (
).
-
Tuliskan project ID Anda sebagai nama bucket (), lalu klik Continue.
-
Untuk Location type, pilih Region, lalu pilih .
Jangan mengubah nilai default lainnya.
- Klik Create.
Jika muncul prompt Public access will be prevented
, klik Confirm.
-
Klik Select untuk memilih bucket yang baru saja Anda buat, lalu klik Continue.
-
Untuk Discovery settings, pilih Inherit untuk mewarisi setelan Discovery dari tingkat zona, lalu klik Continue.
-
Klik Submit.
Klik Periksa progres saya untuk memverifikasi tujuan.
Membuat bucket Cloud Storage dan menghubungkan aset measurements ke zona temperature raw data
Tugas 4. Menghapus aset, zona, dan data lake
Untuk menghapus data lake, Anda harus melepaskan aset terlebih dahulu sebelum menghapus zona.
Dalam tugas ini, Anda akan melepaskan aset dari zona, lalu menghapus zona, dan terakhir, menghapus data lake.
Melepaskan aset
-
Di menu kiri, klik tab Manage, lalu klik nama data lake Anda.
-
Di tab Zones, klik nama zona Anda.
-
Di tab Assets, aktifkan kotak centang di sebelah kiri nama aset.
-
Klik Delete assets.
-
Klik Delete untuk mengonfirmasi.
Tindakan ini TIDAK akan menghapus data yang mendasarinya di bucket Cloud Storage. Tindakan ini hanya akan membuat bucket Cloud Storage tidak dapat diakses atau ditemukan menggunakan data lake di Dataplex Universal Catalog.
Menghapus zona
-
Di menu kiri, klik tab Manage, lalu klik nama data lake Anda.
-
Di tab Zones, aktifkan kotak centang di bagian kiri nama zona.
-
Klik Delete zone.
-
Klik Delete untuk mengonfirmasi.
Menghapus data lake
-
Di menu kiri, klik tab Manage, lalu klik nama data lake Anda.
-
Di bagian atas halaman, klik Delete.
-
Konfirmasi penghapusan dengan mengetikkan delete di dalam kotak teks.
-
Klik Delete lake untuk mengonfirmasi.
Klik Periksa progres saya untuk memverifikasi tujuan.
Menghapus data lake sensors dan resource bertingkat
Selamat!
Anda telah menggunakan Konsol Google Cloud untuk membuat dan menghapus data lake, zona, dan aset di Dataplex Universal Catalog.
Sertifikasi dan pelatihan Google Cloud
...membantu Anda mengoptimalkan teknologi Google Cloud. Kelas kami mencakup keterampilan teknis dan praktik terbaik untuk membantu Anda memahami dengan cepat dan melanjutkan proses pembelajaran. Kami menawarkan pelatihan tingkat dasar hingga lanjutan dengan opsi on demand, live, dan virtual untuk menyesuaikan dengan jadwal Anda yang sibuk. Sertifikasi membantu Anda memvalidasi dan membuktikan keterampilan serta keahlian Anda dalam teknologi Google Cloud.
Manual Terakhir Diperbarui pada 04 Juni 2025
Lab Terakhir Diuji pada 04 Juni 2025
Hak cipta 2025 Google LLC. Semua hak dilindungi undang-undang. Google dan logo Google adalah merek dagang dari Google LLC. Semua nama perusahaan dan produk lain mungkin adalah merek dagang masing-masing perusahaan yang bersangkutan.