
准备工作
- 实验会创建一个 Google Cloud 项目和一些资源,供您使用限定的一段时间
- 实验有时间限制,并且没有暂停功能。如果您中途结束实验,则必须重新开始。
- 在屏幕左上角,点击开始实验即可开始
Create a Cloud SQL instance
/ 30
Whitelist the Cloud Shell instance to access your SQL instance
/ 30
Create a bts database and flights table using the create_table.sql file
/ 40
在本研究室中,您會將 CSV 文字檔的資料匯入 Cloud SQL,然後使用簡單的查詢執行基本資料分析。
本實驗室使用的資料集來自 US Bureau of Transport Statistics,包含美國國內航班的歷史資訊。這個資料集可用來示範各種資料學概念和技術。
請詳閱以下操作說明。實驗室活動會計時,且中途無法暫停。點選「Start Lab」後就會開始計時,顯示可使用 Google Cloud 資源的時間。
您將在真正的雲端環境完成實作實驗室活動,而不是模擬或示範環境。為此,我們會提供新的暫時憑證,供您在實驗室活動期間登入及存取 Google Cloud。
為了順利完成這個實驗室,請先確認:
點選「Start Lab」按鈕。如果實驗室會產生費用,畫面上會出現選擇付款方式的對話方塊。左側的「Lab Details」窗格會顯示下列項目:
點選「Open Google Cloud console」;如果使用 Chrome 瀏覽器,也能按一下滑鼠右鍵,選取「在無痕視窗中開啟連結」。
接著,實驗室會啟動相關資源,並開啟另一個分頁,顯示「登入」頁面。
提示:您可以在不同的視窗中並排開啟分頁。
如有必要,請將下方的 Username 貼到「登入」對話方塊。
您也可以在「Lab Details」窗格找到 Username。
點選「下一步」。
複製下方的 Password,並貼到「歡迎使用」對話方塊。
您也可以在「Lab Details」窗格找到 Password。
點選「下一步」。
按過後續的所有頁面:
Google Cloud 控制台稍後會在這個分頁開啟。
Cloud Shell 是搭載多項開發工具的虛擬機器,提供永久的 5 GB 主目錄,而且在 Google Cloud 中運作。Cloud Shell 提供指令列存取權,方便您使用 Google Cloud 資源。
點按 Google Cloud 控制台頂端的「啟用 Cloud Shell」圖示 。
系統顯示視窗時,請按照下列步驟操作:
連線建立完成即代表已通過驗證,而且專案已設為您的 Project_ID:
gcloud
是 Google Cloud 的指令列工具,已預先安裝於 Cloud Shell,並支援 Tab 鍵自動完成功能。
輸出內容:
輸出內容:
gcloud
的完整說明,請前往 Google Cloud 參閱 gcloud CLI 總覽指南。
本研究室使用 O'Reilly Media, Inc. 出版的《Data Science on the Google Cloud Platform, 2nd Edition》(Google Cloud Platform 的數據資料學,第 2 版) 一書中開發的一系列程式碼範例和指令碼。本研究室涵蓋第 3 章「Creating Compelling Dashboards」(建立引人入勝的資訊主頁) 第一部分介紹的 Cloud SQL 設定和資料匯入工作。您會將第 2 章使用的範例存放區從 GitHub 複製到 Cloud Shell,並從該處完成所有實驗室工作。
此程序需要幾分鐘才能完成。
點選「Check my progress」,確認工作已完成。如果已成功建立 Cloud SQL 執行個體,就會看到評估分數。
點選「Check my progress」,確認工作已完成。如果已成功將 Cloud Shell 加入允許清單,進而存取 SQL 執行個體,您就會看見評估分數。
如要將資料匯入 Postgres 資料表,請先建立空白資料庫和具有正確結構定義的資料表。
在 Cloud 控制台的「導覽選單」 中,按一下「SQL」。
點選執行個體名稱 flights
,開啟執行個體的「總覽」頁面。
在左側的 SQL 導覽選單中,選取「資料庫」。
按一下「建立資料庫」。
在「新增資料庫」對話方塊中,將資料庫命名為 bts
。
點選「建立」。
如要開啟執行個體的「總覽」頁面,請從 SQL 導覽選單中選取「總覽」。
按一下頂端的「匯入」。
在 Cloud Storage 檔案列中,按一下「Browse」(瀏覽)。
在「Buckets」部分,點按 bucket 名稱旁的箭頭。
選取 create_table.sql
檔案。
按一下「選取」。
在「檔案格式」部分,選取「SQL」。
在 Cloud SQL 執行個體中指定資料庫 bts
。
按一下「匯入」即可開始匯入。
幾秒後,系統就會建立空白資料表。
點選「Check my progress」,確認工作已完成。如果已使用 create_table.sql 檔案成功建立 bts 資料庫和 flights 資料表,就會看到評估分數。
您已建立空的資料庫和資料表,現在請將 CSV 檔案載入這個資料表。瀏覽至 bucket 中的 201501.csv,指定格式為 CSV、資料庫為 bts,以及資料表為 flights,即可載入 1 月資料。
在 Cloud SQL 執行個體頁面中,按一下「匯入」。
在 Cloud Storage 檔案欄位按一下「瀏覽」,然後依序點選值區名稱附近的箭頭和 201501.csv
。
按一下「選取」。
檔案格式請選取「CSV」。
選取 bts
資料庫,然後輸入 flights
做為資料表名稱。
按一下「匯入」。
系統提示輸入密碼時,請輸入:Passw0rd
輸入時可能不會顯示字母。
在隨即顯示的提示中,連線至 bts 資料庫:
系統提示輸入密碼時,請輸入:Passw0rd
接著執行查詢,取得 5 個最繁忙的機場:
由於資料集相對較小 (只有 1 月的資料),這個查詢的效能不錯,但隨著月份增加,資料庫速度會變慢。
關聯式資料庫適合用於小型資料集,並執行傳回少量資料子集的臨時查詢。對於較大的資料集,您可以為感興趣的資料欄建立索引,藉此調整關聯式資料庫的效能。此外,關聯式資料庫通常支援交易並保證強一致性,因此非常適合經常更新的資料。
不過,在下列情況下,關聯式資料庫並非理想選擇:
這部分說明航班延誤的應用情境。在這種情況下,您會從關聯式資料庫改用數據分析資料倉儲 BigQuery。分析資料倉儲可讓我們使用 SQL,且更擅長處理大型資料集和臨時查詢 (即不需要建立資料欄索引)。
現在您已瞭解如何建立資料表,並將儲存在 Cloud Storage 的文字資料匯入 Cloud SQL。
以下是幾個後續步驟:
協助您瞭解如何充分運用 Google Cloud 的技術。我們的課程會介紹專業技能和最佳做法,讓您可以快速掌握要領並持續進修。我們提供從基本到進階等級的訓練課程,並有隨選、線上和虛擬課程等選項,方便您抽空參加。認證可協助您驗證及證明自己在 Google Cloud 技術方面的技能和專業知識。
使用手冊上次更新日期:2024 年 7 月 9 日
實驗室上次測試日期:2025 年 7 月 21 日
Copyright 2025 Google LLC 保留所有權利。Google 和 Google 標誌是 Google LLC 的商標,其他公司和產品名稱則有可能是其關聯公司的商標。
此内容目前不可用
一旦可用,我们会通过电子邮件告知您
太好了!
一旦可用,我们会通过电子邮件告知您
一次一个实验
确认结束所有现有实验并开始此实验