arrow_back

Pengantar SQL untuk BigQuery dan Cloud SQL

Gabung Login

Pengantar SQL untuk BigQuery dan Cloud SQL

1 jam 15 menit Gratis

GSP281

Lab Mandiri Google Cloud

Ringkasan

SQL (Structured Query Language) adalah bahasa standar untuk operasi data yang memungkinkan Anda mengajukan pertanyaan dan mendapatkan insight dari set data terstruktur. Bahasa ini biasanya digunakan dalam pengelolaan database dan memungkinkan Anda melakukan berbagai tugas, seperti penulisan catatan transaksi ke dalam database relasional dan analisis data berskala petabyte.

Lab ini berfungsi sebagai pengantar SQL dan persiapan bagi Anda untuk menyelesaikan berbagai lab dan quest di Google Cloud Skills Boost dengan topik data science. Lab ini dibagi menjadi dua bagian: di bagian pertama, Anda akan mempelajari kata kunci kueri SQL dasar. Anda akan menjalankan kata kunci ini di konsol BigQuery pada set data publik yang berisi informasi tentang bikeshare (fasilitas berbagi sepeda) di London.

Di bagian kedua, Anda akan mempelajari cara mengekspor subset dari set data bikeshare London ke file CSV. Kemudian, Anda akan menguploadnya ke Cloud SQL. Setelah itu, Anda akan mempelajari cara menggunakan Cloud SQL untuk membuat serta mengelola database dan tabel. Di bagian akhir, Anda akan berlatih langsung menggunakan kata kunci SQL tambahan yang memanipulasi dan mengedit data.

Yang akan Anda pelajari

Di lab ini, Anda akan mempelajari cara:

  • Membedakan database dengan tabel dan project.
  • Menggunakan kata kunci SELECT, FROM, dan WHERE untuk membuat kueri sederhana.
  • Mengidentifikasi berbagai komponen dan hierarki dalam konsol BigQuery.
  • Memuat database dan tabel ke dalam BigQuery.
  • Menjalankan kueri sederhana pada tabel.
  • Mempelajari kata kunci COUNT, GROUP BY, AS, dan ORDER BY.
  • Menjalankan dan merangkai perintah di atas untuk mengambil data penting dari set data.
  • Mengekspor subset data ke file CSV dan menyimpan file tersebut ke dalam bucket Cloud Storage baru.
  • Membuat instance Cloud SQL baru dan memuat file CSV yang diekspor sebagai tabel baru.
  • Menjalankan kueri CREATE DATABASE, CREATE TABLE, DELETE, INSERT INTO, dan UNION di Cloud SQL.

Prasyarat

Sangat penting: Sebelum memulai lab ini, logout dari akun Gmail pribadi atau perusahaan Anda.

Ini adalah lab tingkat pendahuluan. Anda dianggap tidak memiliki atau hanya memiliki sedikit pengalaman dengan SQL. Pemahaman terkait Cloud Storage dan Cloud Shell direkomendasikan, tetapi tidak diwajibkan. Lab ini akan mengajarkan dasar-dasar membaca dan menulis kueri di SQL, lalu Anda akan menerapkannya menggunakan BigQuery dan Cloud SQL.

Sebelum mengikuti lab ini, pertimbangkan kemahiran Anda dalam SQL. Berikut ini adalah lab dengan level lebih tinggi yang memungkinkan Anda menerapkan pengetahuan pada kasus penggunaan yang lebih kompleks:

Setelah Anda siap, scroll ke bawah dan ikuti langkah di bawah untuk menyiapkan lingkungan lab Anda.

Penyiapan dan persyaratan

Sebelum mengklik tombol Start Lab (Mulai Lab)

Baca petunjuk ini. Lab memiliki timer dan Anda tidak dapat menjedanya. Timer, yang dimulai saat Anda mengklik Start Lab (Mulai Lab), menampilkan lamanya resource Cloud akan tersedia untuk Anda.

Lab praktis Qwiklabs ini memungkinkan Anda melakukan aktivitas lab sendiri di lingkungan cloud nyata, bukan di lingkungan demo atau simulasi. Yaitu dengan cara memberi Anda kredensial sementara yang baru yang digunakan untuk login dan mengakses Google Cloud Platform selama durasi lab.

Yang diperlukan

Untuk menyelesaikan lab ini, Anda memerlukan:

  • Akses ke browser internet standar (disarankan browser Chrome).
  • Waktu untuk menyelesaikan lab.

Catatan: Jika Anda sudah memiliki project atau akun GCP pribadi, jangan gunakan project atau akun tersebut untuk lab ini.

Cara memulai lab dan login ke Google Cloud Console

  1. Klik tombol Start Lab. Jika Anda perlu membayar lab, jendela pop-up akan terbuka untuk memilih metode pembayaran. Di sebelah kiri adalah panel Lab Details dengan berikut ini:

    • Tombol Open Google Console
    • Waktu tersisa
    • Kredensial sementara yang harus Anda gunakan untuk lab ini
    • Informasi lain, jika diperlukan, untuk menyelesaikan lab ini
  2. Klik Open Google Console. Lab akan menjalankan resource, lalu membuka tab lain yang menampilkan halaman Login.

    Tips: Atur tab di jendela terpisah secara berdampingan.

    Catatan: Jika Anda melihat dialog Choose an account, klik Use Another Account.
  3. Jika perlu, salin Username dari panel Lab Details dan tempel ke dialog Sign in. Klik Next.

  4. Salin Password dari panel Lab Details dan tempel ke dialog Welcome. Klik Next.

    Penting: Anda harus menggunakan kredensial dari panel sebelah kiri. Jangan menggunakan kredensial Google Cloud Skills Boost. Catatan: Menggunakan akun Google Cloud sendiri untuk lab ini dapat dikenai biaya tambahan.
  5. Klik halaman berikutnya:

    • Setujui persyaratan dan ketentuan.
    • Jangan tambahkan opsi pemulihan atau autentikasi 2 langkah (karena ini akun sementara).
    • Jangan daftar uji coba gratis.

Setelah beberapa saat, Cloud Console akan terbuka di tab ini.

Catatan: Anda dapat melihat menu dengan daftar Produk dan Layanan Google Cloud dengan mengklik Menu navigasi di kiri atas. Ikon menu navigasi

Tugas 1. Membuat instance Cloud SQL

Di konsol, pilih Menu navigasi > SQL.

  1. Klik CREATE INSTANCE > Choose MySQL .

  2. Masukkan ID instance sebagai qwiklabs-demo

  3. Masukkan sandi yang aman di kolom Password (ingat sandi ini!)

  4. Pilih versi database sebagai MySQL 5.7.

  5. Tetapkan kolom Multi zones (Highly available) sebagai

  6. Klik CREATE INSTANCE.

Catatan: Mungkin diperlukan waktu beberapa menit hingga instance selesai dibuat. Setelah itu, Anda akan melihat tanda centang hijau di sebelah nama instance.

Sementara itu, Anda dapat melanjutkan ke bagian berikutnya dan mempelajari dasar-dasar SQL.

Tugas 2. Dasar-dasar SQL

Database dan tabel

Seperti yang telah disebutkan sebelumnya, SQL memungkinkan Anda mendapatkan informasi dari "set data terstruktur". Set data terstruktur memiliki aturan dan pemformatan yang jelas, serta sering kali disusun dalam tabel, atau data yang diformat dalam baris dan kolom.

Contoh data tidak terstruktur adalah file gambar. Data tidak terstruktur tidak dapat dioperasikan dengan SQL dan tidak dapat disimpan dalam set data atau tabel BigQuery (setidaknya secara native). Misalnya, agar dapat memanfaatkan data gambar, Anda akan menggunakan layanan seperti Cloud Vision, mungkin melalui API-nya secara langsung.

Berikut ini adalah contoh set data terstruktur, yaitu tabel sederhana:

Pengguna

Harga

Terkirim

Samsul

Rp35.000

Ya

Roni

Rp50.000

Tidak

Jika Anda pernah menggunakan Google Spreadsheet sebelumnya, contoh di atas seharusnya tidak terlihat asing. Seperti yang dapat dilihat, tabel tersebut memiliki kolom Pengguna, Harga, dan Terkirim, serta dua baris yang terdiri dari atau diisi dengan nilai kolom.

Pada dasarnya, database adalah kumpulan dari satu atau beberapa tabel. SQL adalah fitur pengelolaan database terstruktur, tetapi sering kali (dan di lab ini) Anda akan menjalankan kueri pada satu atau beberapa tabel yang digabungkan, bukan pada keseluruhan database.

SELECT dan FROM

SQL pada dasarnya bersifat fonetik dan sebelum menjalankan kueri, sebaiknya ketahui pertanyaan apa yang ingin Anda tanyakan ke data (kecuali jika Anda hanya menjelajah untuk bersenang-senang.)

SQL memiliki kata kunci standar yang Anda gunakan untuk menerjemahkan pertanyaan Anda ke dalam sintaksis SQL dalam bahasa pseudo-Inggris sehingga Anda bisa menginstruksikan mesin database untuk memberi jawaban yang Anda inginkan.

Kata kunci terpenting adalah SELECT dan FROM:

  • Gunakan SELECT untuk menentukan kolom yang ingin diambil dari set data Anda.
  • Gunakan FROM untuk menentukan tabel yang ingin diambil datanya.

Anda mungkin akan lebih paham jika menggunakan contoh. Anggaplah kita memiliki tabel example_table berikut, yang memiliki kolom USER, PRICE, dan SHIPPED:

Tabel contoh

Dan misalnya, kita hanya ingin menarik data yang ditemukan di kolom USER. Kita dapat melakukannya dengan menjalankan kueri berikut yang menggunakan SELECT dan FROM:

SELECT USER FROM example_table

Jika perintah di atas dijalankan, semua nama dari kolom USER yang ditemukan dalam example_table akan dipilih.

Anda juga dapat memilih beberapa kolom dengan kata kunci SELECT di SQL. Misalnya, Anda ingin menarik data yang ditemukan di kolom USER dan SHIPPED. Untuk melakukannya, ubah kueri sebelumnya dengan menambahkan nilai kolom lain ke kueri SELECT (pastikan nilai kolom dipisahkan oleh koma):

SELECT USER, SHIPPED FROM example_table

Menjalankan kueri di atas akan mengambil data USER dan SHIPPED dari memori:

Tabel contoh

Seperti itulah pembahasan dua kata kunci SQL dasar. Pembahasan selanjutnya akan lebih menarik.

WHERE

Kata kunci WHERE adalah perintah SQL lain yang memfilter tabel untuk nilai kolom spesifik. Misalnya, Anda ingin menarik nama dari example_table yang paketnya telah dikirim. Anda dapat melengkapi kueri dengan WHERE, seperti berikut ini:

SELECT USER FROM example_table WHERE SHIPPED='YES'

Menjalankan kueri di atas akan menampilkan semua USER yang paketnya berstatus SHIPPED dari memori:

Tabel contoh

Setelah Anda mendapatkan pemahaman dasar tentang kata kunci inti SQL, terapkan hal yang telah Anda pelajari dengan menjalankan jenis kueri ini di konsol BigQuery.

Uji pemahaman Anda

Berikut ini beberapa pertanyaan pilihan ganda untuk memperkuat pemahaman Anda tentang konsep yang telah dibahas sejauh ini. Jawab pertanyaan tersebut sebaik mungkin.

Tugas 3. Menjelajahi konsol BigQuery

Paradigma BigQuery

BigQuery adalah data warehouse berskala petabyte terkelola sepenuhnya yang berjalan di Google Cloud. Analis data dan data scientist dapat dengan cepat membuat kueri dan memfilter set data besar, menggabungkan hasil, dan melakukan operasi kompleks tanpa harus khawatir tentang penyiapan dan pengelolaan server. BigQuery hadir dalam bentuk alat command line (sudah terinstal dalam Cloud Shell) atau konsol web. Keduanya siap digunakan untuk mengelola dan membuat kueri data yang disimpan dalam project Google Cloud.

Dalam lab ini, Anda akan menggunakan konsol web untuk menjalankan kueri SQL.

Membuka konsol BigQuery

  1. Di Google Cloud Console, pilih Navigation menu > BigQuery.

Kotak pesan Welcome to BigQuery in the Cloud Console akan terbuka. Kotak pesan ini menyediakan link ke panduan memulai dan catatan rilis.

  1. Klik Done.

Konsol BigQuery terbuka.

Luangkan waktu sejenak untuk mencatat beberapa fitur UI yang penting. "Editor" kueri berada di sisi kanan konsol. Di sinilah Anda akan menulis dan menjalankan perintah SQL seperti contoh yang kita bahas sebelumnya. Di bawahnya adalah "Query history", yang merupakan daftar kueri yang Anda jalankan sebelumnya.

Panel kiri konsol adalah "Panel navigasi". Selain histori kueri, kueri tersimpan, dan histori pekerjaan yang mudah dipahami, ada tab Explorer.

Tingkat resource paling umum di tab Explorer berisi project Google Cloud, yang sama seperti project Google Cloud sementara tempat Anda login dan gunakan dengan setiap lab Google Cloud Skills Boost. Seperti yang Anda lihat di konsol dan screenshot terakhir, kita hanya memiliki project di tab Explorer. Jika Anda mencoba mengklik panah di sebelah nama project, tidak akan ada yang ditampilkan.

Ini karena project Anda tidak berisi set data atau tabel, sehingga Anda tidak memiliki apa pun yang dapat dikueri. Sebelumnya Anda telah mempelajari bahwa set data berisi tabel. Saat Anda menambahkan data ke project, perhatikan bahwa di BigQuery, project berisi set data, dan set data berisi tabel. Sekarang, setelah lebih memahami paradigma project → set data → tabel dan seluk-beluk konsol, Anda dapat memuat beberapa data yang dapat dikueri.

Mengupload data yang dapat dikueri

Di bagian ini, Anda menarik beberapa data publik ke project sehingga Anda bisa berlatih menjalankan perintah SQL di BigQuery.

  1. Klik + ADD DATA

  2. Pilih Pin a project > Enter project name.

  3. Masukkan nama project sebagai bigquery-public-data

  4. Klik tombol PIN.

Penting untuk diperhatikan bahwa Anda masih bekerja di luar project lab Anda di tab baru ini. Yang Anda lakukan hanyalah menarik project yang dapat diakses secara umum yang berisi set data dan tabel ke BigQuery untuk dianalisis. Anda tidak beralih ke project tersebut. Semua pekerjaan dan layanan Anda masih terikat ke akun Google Cloud Skills Boost Anda. Anda dapat melihatnya sendiri dengan memeriksa kolom project di dekat bagian atas konsol:

Kolom project yang menampilkan nama project Google Cloud Skills Boost

  1. Di kotak penelusuran, masukkan London Bicycles Hires, lalu klik VIEW DATASET.

  2. Anda kini memiliki akses ke data berikut:

  • Project Google Cloud → bigquery-public-data

  • Set data → london_bicycles

  1. Klik set data london bicycles untuk mengungkap tabel terkait

  • Tabel → cycle_hire
  • Tabel → cycle_stations

Di lab ini, kita akan menggunakan data dari cycle_hire. Buka tabel cycle_hire, lalu klik tab Preview. Halaman Anda akan terlihat seperti berikut:

tabel cycle_hire, tab preview

Periksa kolom dan nilai yang terisi dalam baris. Anda telah siap menjalankan beberapa kueri SQL pada tabel cycle_hire.

Menjalankan SELECT, FROM, dan WHERE di BigQuery

Anda kini memiliki pemahaman dasar terkait kata kunci kueri SQL dan paradigma data BigQuery serta beberapa data untuk dikerjakan. Jalankan beberapa perintah SQL menggunakan layanan ini.

Di sudut kanan bawah konsol, Anda akan melihat 24.369.201 baris data, atau perjalanan bikeshare perorangan yang dilakukan di London antara tahun 2015 hingga tahun 2017 (cukup jelas bahwa angka ini tidaklah kecil!)

Sekarang perhatikan kunci kolom ketujuh: end_station_name, yang menentukan tujuan akhir dari perjalanan bikeshare. Sebelum membahas lebih dalam, pertama-tama mari jalankan kueri sederhana untuk memisahkan kolom end_station_name.

  1. Salin dan tempel perintah berikut ke EDITOR kueri:

SELECT end_station_name FROM `bigquery-public-data.london_bicycles.cycle_hire`;
  1. Kemudian klik Run.

Setelah ~20 detik, Anda akan memperoleh 24369201 baris berisi kolom tunggal yang Anda kuerikan dari: end_station_name.

Sekarang, cari tahu jumlah perjalanan sepeda yang berdurasi 20 menit atau lebih.

  1. Hapus kueri dari editor, lalu jalankan kueri berikut ini yang menggunakan kata kunci WHERE:

SELECT * FROM `bigquery-public-data.london_bicycles.cycle_hire` WHERE duration>=1200;

Proses kueri ini mungkin memerlukan waktu beberapa menit.

SELECT * menampilkan semua nilai kolom dari tabel. Durasi diukur dalam detik, itulah sebabnya Anda menggunakan nilai 1200 (60 * 20).

Jika Anda melihat ke sudut kanan bawah, Anda akan mengetahui bahwa 7.334.890 baris telah ditampilkan. Sebagai hasil bagi dari total (7334890/24369201), ini berarti bahwa ~30% perjalanan bikeshare London berlangsung selama 20 menit atau lebih (banyak juga yang bersepeda lumayan lama)

Uji pemahaman Anda

Berikut ini beberapa pertanyaan pilihan ganda untuk memperkuat pemahaman Anda tentang konsep yang telah kita bahas sejauh ini. Jawab pertanyaan tersebut sebaik mungkin.

Tugas 4. Kata Kunci SQL Lainnya: GROUP BY, COUNT, AS, dan ORDER BY

GROUP BY

Kata kunci GROUP BY akan mengagregasi baris set hasil yang memiliki kriteria umum yang sama (misalnya nilai kolom) dan akan menampilkan semua entri unik yang ditemukan untuk kriteria tersebut.

Ini adalah kata kunci yang berguna untuk mencari tahu informasi kategori pada tabel.

  1. Untuk mendapatkan gambaran yang lebih baik tentang fungsi kata kunci ini, hapus kueri dari editor, lalu salin dan tempel perintah berikut:

SELECT start_station_name FROM `bigquery-public-data.london_bicycles.cycle_hire` GROUP BY start_station_name;
  1. Klik Run.

Hasilnya adalah daftar nilai kolom yang unik (tidak memiliki duplikat).

Tanpa GROUP BY, kueri akan menampilkan semua baris, berjumlah 24.369.201. GROUP BY akan menampilkan nilai kolom unik yang ditemukan dalam tabel. Anda dapat memeriksanya sendiri dengan melihat di sudut kanan bawah. Anda akan melihat 880 baris, yang berarti ada 880 titik awal bikeshare London yang unik.

COUNT

Fungsi COUNT() akan menampilkan jumlah baris yang memiliki kriteria sama (misalnya nilai kolom). Fungsi ini bisa sangat berguna jika dipakai bersama dengan GROUP BY.

Tambahkan fungsi COUNT ke kueri sebelumnya untuk mengetahui jumlah perjalanan yang dimulai di setiap titik awal.

  • Hapus kueri dari editor, salin dan tempel perintah berikut, lalu klik Run:

SELECT start_station_name, COUNT(*) FROM `bigquery-public-data.london_bicycles.cycle_hire` GROUP BY start_station_name;

Output Anda menunjukkan jumlah perjalanan bikeshare yang dimulai di setiap lokasi awal.

AS

SQL juga memiliki kata kunci AS yang membuat alias dari tabel atau kolom. Alias adalah nama baru yang diberikan pada kolom atau tabel yang ditampilkan, sesuai yang ditentukan pada perintah AS.

  1. Tambahkan kata kunci AS ke kueri terakhir yang kita jalankan untuk melihat cara kerjanya. Hapus kueri dari editor, lalu salin dan tempel perintah berikut:

SELECT start_station_name, COUNT(*) AS num_starts FROM `bigquery-public-data.london_bicycles.cycle_hire` GROUP BY start_station_name;
  1. Klik Run.

Untuk Results, nama kolom sebelah kanan berubah dari COUNT(*) menjadi num_starts.

Seperti yang Anda lihat, kolom COUNT(*) pada tabel yang ditampilkan kini disetel ke nama alias num_starts. Kata kunci ini berguna terutama jika Anda menangani set data yang besar. Perlu diingat bahwa nama tabel atau kolom yang ambigu lebih sering terjadi daripada yang Anda kira.

ORDER BY

Kata kunci ORDER BY mengurutkan data yang dihasilkan dari kueri dalam urutan naik atau turun berdasarkan kriteria atau nilai kolom yang ditentukan. Kita akan menambahkan kata kunci ini ke kueri sebelumnya untuk melakukan hal berikut:

  • Menampilkan tabel berisi jumlah perjalanan bikeshare yang dimulai di setiap stasiun awal, yang disusun secara alfabetis berdasarkan stasiun awal.
  • Menampilkan tabel berisi jumlah perjalanan bikeshare yang dimulai di setiap stasiun awal, yang disusun secara numerik dari terendah ke tertinggi.
  • Menampilkan tabel berisi jumlah perjalanan bikeshare yang dimulai di setiap stasiun awal, yang disusun secara numerik dari tertinggi ke terendah.

Setiap perintah di bawah ini adalah kueri terpisah. Untuk setiap perintah:

  1. Kosongkan EDITOR kueri.

  2. Salin dan tempel perintah ke EDITOR kueri.

  3. Klik Run. Periksa hasilnya.

SELECT start_station_name, COUNT(*) AS num FROM `bigquery-public-data.london_bicycles.cycle_hire` GROUP BY start_station_name ORDER BY start_station_name; SELECT start_station_name, COUNT(*) AS num FROM `bigquery-public-data.london_bicycles.cycle_hire` GROUP BY start_station_name ORDER BY num; SELECT start_station_name, COUNT(*) AS num FROM `bigquery-public-data.london_bicycles.cycle_hire` GROUP BY start_station_name ORDER BY num DESC;

Hasil kueri terakhir menampilkan lokasi awal berdasarkan jumlah start dari lokasi tersebut.

Dapat dilihat bahwa "Belgrove Street, King's Cross" merupakan lokasi awal dengan jumlah start tertinggi. Namun, dengan hasil bagi dari total (234458/24369201), kita mendapat hasil bahwa <1% perjalanan dimulai dari stasiun ini.

Uji pemahaman Anda

Berikut ini beberapa pertanyaan pilihan ganda untuk memperkuat pemahaman Anda tentang konsep yang telah kita bahas sejauh ini. Jawab pertanyaan tersebut sebaik mungkin.

Tugas 5. Bekerja dengan Cloud SQL

Mengekspor kueri sebagai file CSV

Cloud SQL adalah layanan database terkelola sepenuhnya yang memudahkan penyiapan, pemeliharaan, pengelolaan, dan pengaturan database PostgreSQL dan MySQL relasional di cloud. Ada dua format data yang diterima oleh Cloud SQL: file dump (.sql) atau file CSV (.csv). Anda akan mempelajari cara mengekspor subset tabel cycle_hire ke file CSV, lalu menguploadnya ke Cloud Storage sebagai lokasi perantara.

Kembali ke BigQuery Console, seharusnya ini adalah perintah terakhir yang Anda jalankan:

SELECT start_station_name, COUNT(*) AS num FROM `bigquery-public-data.london_bicycles.cycle_hire` GROUP BY start_station_name ORDER BY num DESC;
  1. Di bagian Query Results, klik SAVE RESULTS > CSV(local file). Tindakan ini akan memulai download, yang akan menyimpan kueri sebagai file CSV. Catat lokasi dan nama file yang didownload, karena Anda akan membutuhkannya nanti.

  2. Kosongkan EDITOR kueri, lalu salin dan jalankan perintah berikut di editor kueri:

SELECT end_station_name, COUNT(*) AS num FROM `bigquery-public-data.london_bicycles.cycle_hire` GROUP BY end_station_name ORDER BY num DESC;

Kueri tersebut akan menampilkan tabel berisi jumlah perjalanan bikeshare yang berakhir di setiap stasiun akhir, yang disusun secara numerik dari jumlah perjalanan tertinggi ke terendah.

  1. Di bagian Query Results, klik SAVE RESULTS > CSV(local file). Tindakan ini akan memulai download, yang akan menyimpan kueri sebagai file CSV. Catat lokasi dan nama file yang didownload, karena Anda akan membutuhkannya di bagian selanjutnya.

Mengupload file CSV ke Cloud Storage

  1. Buka Cloud Console. Di sini, Anda akan membuat bucket penyimpanan yang akan menjadi lokasi upload file yang baru dibuat.

  2. Pilih Menu navigasi > Cloud Storage > Browser, lalu klik CREATE BUCKET.

Catatan: Jika diminta, Klik LEAVE untuk Pekerjaan yang belum disimpan.
  1. Masukkan nama unik untuk bucket Anda, biarkan setelan lainnya dalam mode default, lalu klik Create:

Menguji tugas yang sudah selesai

Klik Check my progress di bawah untuk memeriksa progres lab Anda. Jika berhasil membuat bucket, Anda akan melihat skor penilaian.

Membuat bucket Cloud Storage.

Sekarang, buka Cloud Console, dan Bucket Cloud Storage yang baru dibuat akan ditampilkan.

  1. Klik UPLOAD FILE, lalu pilih CSV yang berisi data start_station_name.

  2. Lalu klik Open. Ulangi untuk data end_station_name.

  3. Ganti nama file start_station_name dengan mengklik tiga titik di sisi file paling kanan, lalu klik rename. Ganti nama file menjadi start_station_data.csv.

  4. Ganti nama file end_station_name dengan mengklik tiga titik di sisi file paling kanan, lalu klik rename. Ganti nama file menjadi end_station_data.csv.

Setelah itu, Anda seharusnya Anda dapat melihat start_station_name.csv dan end_station_data.csv dalam daftar Objects di halaman Bucket details.

Menguji tugas yang sudah selesai

Klik Check my progress untuk memverifikasi tugas yang telah dijalankan. Jika berhasil mengupload objek CSV ke bucket, Anda akan melihat skor penilaian.

Mengupload file CSV ke Cloud Storage.

Membuat instance Cloud SQL

  1. Di konsol, pilih Menu navigasi > SQL.

  2. Klik CREATE INSTANCE.

  3. Dari sini, Anda akan diminta untuk memilih mesin database. Pilih MySQL.

  4. Masukkan nama instance Anda (seperti "qwiklabs-demo"), lalu masukkan sandi yang aman di kolom Password (ingat sandi ini!), lalu klik CREATE INSTANCE:

Mungkin diperlukan waktu beberapa menit untuk membuat instance. Setelah itu, Anda akan melihat tanda centang hijau di sebelah nama instance.

  1. Klik instance Cloud SQL. Halaman SQL Overview akan terbuka.

Menguji tugas yang sudah selesai

Untuk memeriksa progres lab Anda, klik Check my progress di bawah. Jika berhasil menyiapkan instance Cloud SQL, Anda akan melihat skor penilaian.

Membuat Instance CloudSQL

Tugas 6. Kueri baru di Cloud SQL

Kata kunci CREATE (database dan tabel)

Setelah instance Cloud SQL dapat berjalan, buat database di dalamnya menggunakan Command Line Cloud Shell. Salin link Cloud Shell di bawah dan tempel di tab samaran browser baru.

https://shell.cloud.google.com/?show=terminal

Membuat database di Cloud Shell

  1. Jalankan perintah berikut di Cloud Shell agar terhubung ke instance SQL, ganti qwiklabs-demo jika Anda menggunakan nama instance yang berbeda:

gcloud sql connect qwiklabs-demo --user=root Catatan: Mungkin diperlukan waktu beberapa saat untuk terhubung ke instance Anda.
  1. Saat diminta, masukkan sandi root yang Anda setel untuk instance.

Anda akan melihat output seperti ini:

Welcome to the MySQL monitor. Commands end with ; or \g. Your MySQL connection id is 494 Server version: 5.7.14-google-log (Google) Copyright (c) 2000, 2017, Oracle, MariaDB Corporation Ab and others. Type 'help;' or '\h' for help. Type '\c' to clear the current input statement. mysql>

Instance Cloud SQL dilengkapi dengan database yang sudah dikonfigurasi, tetapi Anda akan membuat database sendiri untuk menyimpan data bikeshare London.

  1. Jalankan perintah berikut di prompt server MySQL untuk membuat database bernama bike:

CREATE DATABASE bike;

Anda akan menerima output berikut:

Query OK, 1 row affected (0.05 sec) mysql>

Menguji tugas yang sudah selesai

Periksa progres Anda dengan mengklik Check my progress untuk memverifikasi tugas yang dilakukan. Skor penilaian akan ditampilkan setelah database berhasil dibuat di instance Cloud SQL.

Membuat database.

Membuat tabel di Cloud Shell

  1. Buat tabel di dalam database bike dengan menjalankan perintah berikut:

USE bike; CREATE TABLE london1 (start_station_name VARCHAR(255), num INT);

Pernyataan ini menggunakan kata kunci CREATE, tetapi kali ini klausa TABLE digunakan untuk menentukan bahwa kueri tersebut ingin membuat tabel, bukan database. Kata kunci USE menentukan database yang ingin Anda hubungkan. Anda sekarang memiliki tabel bernama "london1" yang berisi dua kolom, "start_station_name" dan "num". VARCHAR(255) menentukan kolom string dengan panjang bervariasi yang dapat menampung hingga 255 karakter, sedangkan INT adalah kolom jenis bilangan bulat.

  1. Buat tabel lain bernama "london2" dengan menjalankan perintah berikut:

USE bike; CREATE TABLE london2 (end_station_name VARCHAR(255), num INT);
  1. Sekarang konfirmasikan bahwa tabel kosong Anda telah dibuat. Jalankan perintah berikut di prompt server MySQL:

SELECT * FROM london1; SELECT * FROM london2;

Anda akan menerima output berikut untuk kedua perintah di atas:

Empty set (0.04 sec)

Anda akan melihat "empty set" karena Anda belum memuat data.

Mengupload file CSV ke tabel

Kembali ke konsol Cloud SQL. Anda sekarang akan mengupload file CSV start_station_name dan end_station_name ke tabel london1 dan london2 yang baru dibuat.

  1. Di halaman instance Cloud SQL, klik IMPORT.
  2. Di kolom file Cloud Storage, klik Browse, klik panah di sebelah nama bucket, lalu klik start_station_data.csv. Klik Select.
  3. Untuk File format, pilih CSV.
  4. Pilih database bike, lalu ketik "london1" sebagai tabel Anda.
  5. Klik Import:

Lakukan hal yang sama untuk file CSV lainnya.

  1. Di halaman instance Cloud SQL, klik IMPORT.
  2. Di kolom file Cloud Storage, klik Browse, klik panah di sebelah nama bucket, lalu klik end_station_data.csv. Klik Select.
  3. Untuk File format, pilih CSV.
  4. Pilih database bike, lalu ketik "london2" sebagai tabel Anda.
  5. Klik Import:

Kedua file CSV sudah diupload ke tabel di database bike.

  1. Kembalilah ke sesi Cloud Shell Anda dan jalankan perintah berikut di prompt server MySQL untuk memeriksa konten london1:

SELECT * FROM london1;

Anda akan menerima 881 baris output, satu untuk setiap nama stasiun yang unik.

  1. Jalankan perintah berikut untuk memastikan london2 telah diisi:

SELECT * FROM london2;

Anda akan menerima 883 baris output, satu lagi untuk setiap nama stasiun yang unik.

Kata kunci DELETE

Berikut adalah beberapa kata kunci SQL lainnya yang membantu kita dalam mengelola data. Pertama adalah kata kunci DELETE.

  • Jalankan perintah berikut di sesi MySQL Anda untuk menghapus baris pertama london1 dan london2:

DELETE FROM london1 WHERE num=0; DELETE FROM london2 WHERE num=0;

Anda akan menerima output berikut setelah menjalankan kedua perintah di atas:

Query OK, 1 row affected (0.04 sec)

Baris yang dihapus adalah header kolom file CSV. Kata kunci DELETE tidak akan menghapus baris pertama file tersebut, tetapi semua baris dalam tabel tempat nama kolom (dalam hal ini "num") berisi nilai yang ditentukan (dalam hal ini "0"). Jika Anda menjalankan kueri SELECT * FROM london1; dan SELECT * FROM london2; dan men-scroll ke bagian atas tabel, Anda akan melihat bahwa baris tersebut sudah tidak ada lagi.

Kata kunci INSERT INTO

Anda juga dapat memasukkan nilai ke dalam tabel dengan kata kunci INSERT INTO.

  • Jalankan perintah berikut untuk memasukkan baris baru ke london1, yang menetapkan start_station_name ke "test destination", dan num ke "1":

INSERT INTO london1 (start_station_name, num) VALUES ("test destination", 1);

Kata kunci INSERT INTO memerlukan tabel (london1) dan akan membuat baris baru dengan kolom yang ditentukan oleh istilah dalam tanda kurung pertama (dalam hal ini "start_station_name" dan "num"). Apa pun istilah setelah klausa "VALUES" akan dimasukkan sebagai nilai di baris baru.

Anda akan menerima output berikut:

Query OK, 1 row affected (0.05 sec)

Jika kueri SELECT * FROM london1; dijalankan, Anda akan melihat baris tambahan yang ditambahkan di bagian bawah tabel "london1".

Kata kunci UNION

Kata kunci SQL terakhir yang akan Anda pelajari adalah UNION. Kata kunci ini menggabungkan output dari dua atau beberapa kueri SELECT ke dalam set hasil. Anda menggunakan UNION untuk menggabungkan subset tabel "london1" dan "london2".

Rangkaian kueri berikut menarik data spesifik dari kedua tabel dan menggabungkannya dengan operator UNION.

  • Jalankan perintah berikut di prompt server MySQL:

SELECT start_station_name AS top_stations, num FROM london1 WHERE num>100000 UNION SELECT end_station_name, num FROM london2 WHERE num>100000 ORDER BY top_stations DESC;

Kueri SELECT pertama memilih kedua kolom tersebut dari tabel "london1" dan membuat alias untuk "start_station_name", yang ditetapkan ke "top_stations". Kueri tersebut menggunakan kata kunci WHERE untuk hanya menarik nama stasiun bikeshare yang menjadi titik awal perjalanan lebih dari 100.000 sepeda.

Kueri SELECT kedua memilih dua kolom dari tabel "london2" dan menggunakan kata kunci WHERE untuk hanya menarik nama stasiun bikeshare yang menjadi titik akhir perjalanan lebih dari 100.000 sepeda.

Kata kunci UNION yang berada di antaranya menggabungkan output kedua kueri ini dengan mengasimilasi data "london2" dengan "london1". Karena "london1" digabungkan dengan "london2", nilai kolom yang diutamakan adalah "top_stations" dan "num".

ORDER BY akan mengurutkan tabel final gabungan berdasarkan nilai kolom "top_stations" secara alfabetis dalam urutan menurun.

Anda akan menerima output berikut:

Tabel output dengan kolom untuk top_stations dan num

Seperti yang Anda lihat, 13/14 stasiun berbagi tempat teratas untuk titik awal dan akhir transportasi online. Dengan beberapa kata kunci SQL dasar, Anda dapat membuat kueri untuk set data yang cukup besar, yang menampilkan titik data dan jawaban atas pertanyaan spesifik.

Selamat!

Dalam lab ini, Anda telah mempelajari dasar-dasar SQL dan cara menerapkan kata kunci serta menjalankan kueri di BigQuery dan CloudSQL. Anda telah mempelajari konsep inti di balik project, database, dan tabel. Anda berlatih dengan kata kunci yang memanipulasi dan mengedit data. Anda belajar cara memuat set data ke BigQuery dan berlatih menjalankan kueri pada tabel. Anda belajar cara membuat instance di Cloud SQL dan berlatih mentransfer subset data ke dalam tabel yang ada di dalam database. Anda merangkai dan menjalankan kueri di Cloud SQL untuk mendapatkan beberapa kesimpulan menarik tentang stasiun awal dan akhir bikesharing di London.

Selesaikan quest Anda

Lab mandiri ini adalah bagian dari quest Data Science on Google Cloud, Scientific Data Processing, Cloud SQL, BigQuery Basics for Data Analysts, NCAA® March Madness®: Bracketology with Google Cloud, Cloud Engineering, Data Catalog Fundamentals, dan Applying BQML's Classification, Regression, and Demand Forecasting for Retail Applications. Quest adalah serangkaian lab terkait yang membentuk jalur pembelajaran. Dengan menyelesaikan quest, Anda mendapatkan badge sebagai pengakuan pencapaian Anda. Anda dapat memperlihatkan badge atau beberapa badge kepada publik dan menautkannya di resume online atau akun media sosial Anda. Daftarkan diri Anda dalam quest apa pun yang berisi lab ini dan segera dapatkan kredit penyelesaian. Lihat Katalog Google Cloud Skills Boost untuk melihat semua quest yang tersedia.

Langkah berikutnya/Pelajari lebih lanjut

Teruslah mempelajari dan berlatih dengan Cloud SQL dan BigQuery melalui lab Google Cloud Skill Boost ini:

Pelajari lebih lanjut tentang Data Science dengan Data Science on the Google Cloud Platform, 2nd Edition: O'Reilly Media, Inc..

Pelatihan & Sertifikasi Google Cloud

...membantu Anda mengoptimalkan teknologi Google Cloud. Kelas kami mencakup keterampilan teknis dan praktik terbaik untuk membantu Anda memahami dengan cepat dan melanjutkan proses pembelajaran. Kami menawarkan pelatihan tingkat dasar hingga lanjutan dengan opsi on demand, live, dan virtual untuk menyesuaikan dengan jadwal Anda yang sibuk. Sertifikasi membantu Anda memvalidasi dan membuktikan keterampilan serta keahlian Anda dalam teknologi Google Cloud.

Manual Terakhir Diperbarui pada 25 Juli 2022

Lab Terakhir Diuji pada 25 Juli 2022

Hak cipta 2020 Google LLC Semua hak dilindungi undang-undang. Google dan logo Google adalah merek dagang dari Google LLC. Semua nama perusahaan dan produk lain mungkin adalah merek dagang masing-masing perusahaan yang bersangkutan.