
始める前に
- ラボでは、Google Cloud プロジェクトとリソースを一定の時間利用します
- ラボには時間制限があり、一時停止機能はありません。ラボを終了した場合は、最初からやり直す必要があります。
- 画面左上の [ラボを開始] をクリックして開始します
Clean your training data
/ 30
Create a BQML model
/ 40
Perform a batch prediction on new data
/ 30
チャレンジラボでは、シナリオと一連のタスクが提供されます。手順ガイドに沿って進める形式ではなく、コース内のラボで習得したスキルを駆使して、ご自身でタスクを完了していただきます。タスクが適切に完了したかどうかは、このページに表示される自動スコアリング システムで確認できます。
チャレンジラボは、Google Cloud の新しいコンセプトについて学習するためのものではありません。デフォルト値を変更する、エラー メッセージを読み調査を行ってミスを修正するなど、習得したスキルを応用する能力が求められます。
100% のスコアを達成するには、制限時間内に全タスクを完了する必要があります。
このラボは、「BigQuery ML を使用した予測モデリング向けのデータ エンジニアリング」スキルバッジ コースに登録している受講者を対象としています。準備が整ったらチャレンジを開始しましょう。
こちらの説明をお読みください。ラボには時間制限があり、一時停止することはできません。タイマーは、Google Cloud のリソースを利用できる時間を示しており、[ラボを開始] をクリックするとスタートします。
このハンズオンラボでは、シミュレーションやデモ環境ではなく実際のクラウド環境を使って、ラボのアクティビティを行います。そのため、ラボの受講中に Google Cloud にログインおよびアクセスするための、新しい一時的な認証情報が提供されます。
このラボを完了するためには、下記が必要です。
あなたは、TaxiCab Inc. で新たにデータ エンジニアの任務に就くことになりました。過去のデータを BigQuery の作業用データセットにインポートして、入手可能な情報に基づいて乗車時に運賃を予測する基本モデルを構築することを求められています。経営陣は、乗客向けに運賃を予測するアプリの構築に関心を持っています。プロジェクトにはソースデータが用意されます。
これらのタスクのスキルや知識があるという前提のため、手順ガイドは提供されません。
席に着いてノートパソコンを開くと、経営陣のために BigQuery ML(BQML)の基本的な運賃予測モデルを構築するという初仕事の依頼が届いていました。次のタスクを実行して、データをインポート、クリーニングしてからモデルを構築し、新しいデータでバッチ予測を実行してください。これをもとに、経営陣はモデルのパフォーマンスを確認し、アプリ機能のデプロイを許可できるかどうかを判断します。
最初のステップはすでに完了しています。データセット taxirides
を作成して、過去のデータをテーブル historical_taxi_rides_raw
にインポートしました。これは 2015 年より前の乗車データです。
このタスクでは、次の作業が必要です。
historical_taxi_rides_raw
のデータをクリーニングして、同じデータセット内の 役に立つヒント:
taxirides.report_prediction_data
をよく確認しておいてください。予測時にどのような形式のデータが得られるかがわかります。データ クリーニングのタスク:
trip_distance
が fare_amount
が非常に小さい行(たとえば、$
未満)を削除します。passenger_count
が tolls_amount
と fare_amount
をターゲット変数として report_prediction_data
を参考にしてください)。[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
モデルの名前を
役に立つヒント:
TRANSFORM()
句に含まれる特徴量のみがモデルに渡されることに注意してください。* EXCEPT(feature_to_leave_out)
を使用して、明示的に呼び出すことなくすべての特徴量またはその一部を渡すことができます。ST_distance()
と ST_GeogPoint()
を使用して、ユークリッド距離を簡単に計算できます(乗車から降車までのタクシーの走行距離など)。[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
経営陣は、作成されたモデルが新しいデータ(この場合は、2015 年に収集されたすべてのデータ)に対してうまく機能するかどうか確認することを希望しています。このデータは taxirides.report_prediction_data
に含まれます。予測時に既知の値のみがテーブルに含まれます。
ML.PREDICT
と作成したモデルを使用して、2015_fare_amount_predictions
というテーブルに格納します。[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。2015_fare_amount_predictions
に格納する
このセルフペース ラボは、「BigQuery ML を使用した予測モデリング向けのデータ エンジニアリング」スキルバッジ コースの一部です。このスキルバッジ コースを完了すると成果が認められて、上のようなバッジが贈られます。獲得したバッジを履歴書やソーシャル プラットフォームで共有し、#GoogleCloudBadge を使用して成果を公表しましょう。
このスキルバッジ コースは、Google Cloud のデータ エンジニア向け学習プログラムの一部です。この学習プログラムの他のスキルバッジを獲得済みの場合は、他の登録可能なスキルバッジ コースをカタログで検索してみてください。
Google Cloud トレーニングと認定資格を通して、Google Cloud 技術を最大限に活用できるようになります。必要な技術スキルとベスト プラクティスについて取り扱うクラスでは、学習を継続的に進めることができます。トレーニングは基礎レベルから上級レベルまであり、オンデマンド、ライブ、バーチャル参加など、多忙なスケジュールにも対応できるオプションが用意されています。認定資格を取得することで、Google Cloud テクノロジーに関するスキルと知識を証明できます。
マニュアルの最終更新日: 2024 年 3 月 25 日
ラボの最終テスト日: 2023 年 9 月 11 日
Copyright 2025 Google LLC. All rights reserved. Google および Google のロゴは Google LLC の商標です。その他すべての企業名および商品名はそれぞれ各社の商標または登録商標です。
このコンテンツは現在ご利用いただけません
利用可能になりましたら、メールでお知らせいたします
ありがとうございます。
利用可能になりましたら、メールでご連絡いたします
1 回に 1 つのラボ
既存のラボをすべて終了して、このラボを開始することを確認してください