Davis William
メンバー加入日: 2022
メンバー加入日: 2022
このコースでは、Professional Data Engineer(PDE)認定資格試験に向けた学習計画を作成できます。学習者は、試験の範囲を把握できます。また、試験への準備状況を把握して、個々の学習計画を作成します。
このコースは、Dataflow を使用したサーバーレスのデータ処理に関する 3 コースシリーズのパート 1 です。この最初のコースでは、始めに Apache Beam とは何か、そして Dataflow とどのように関係しているかを復習します。次に、Apache Beam のビジョンと Beam Portability フレームワークの利点について説明します。Beam Portability フレームワークによって、デベロッパーが好みのプログラミング言語と実行バックエンドを使用できるビジョンが実現します。続いて、Dataflow によってどのように費用を節約しながらコンピューティングとストレージを分離できるか、そして識別ツール、アクセスツール、管理ツールがどのように Dataflow パイプラインと相互に機能するかを紹介します。最後に、Dataflow でそれぞれのユースケースに合った適切なセキュリティ モデルを実装する方法について学習します。
ML をデータ パイプラインに組み込むと、データから分析情報を抽出する能力を向上できます。このコースでは、Google Cloud でデータ パイプラインに ML を含める複数の方法について説明します。カスタマイズがほとんど、またはまったく必要ない場合のために、このコースでは AutoML について説明します。よりカスタマイズされた ML 機能については、Notebooks と BigQuery の機械学習(BigQuery ML)を紹介します。また、Vertex AI を使用して ML ソリューションを本番環境に導入する方法も説明します。
ストリーミングによって企業が事業運営に関するリアルタイムの指標を取得できるようになり、ストリーミング データの処理を行う機会が増えてきました。このコースでは、Google Cloud でストリーミング データ パイプラインを構築する方法について学習します。受信ストリーミング データの処理のために Pub/Sub について説明します。また、このコースでは、Dataflow を使用してストリーミング データの集計や変換を行う方法、処理済みのレコードを分析用に BigQuery や Bigtable に保存する方法についても説明します。さらに、Qwiklabs を使用して Google Cloud でストリーミング データ パイプラインのコンポーネントを構築する実践演習を行います。
通常、データ パイプラインは、「抽出、読み込み(EL)」、「抽出、読み込み、変換(ELT)」、「抽出、変換、読み込み(ETL)」のいずれかの考え方に分類できます。このコースでは、バッチデータではどの枠組みを、どのような場合に使用するのかについて説明します。本コースではさらに、BigQuery、Dataproc 上での Spark の実行、Cloud Data Fusion のパイプラインのグラフ、Dataflow でのサーバーレスのデータ処理など、データ変換用の複数の Google Cloud テクノロジーについて説明します。また、Qwiklabs を使用して Google Cloud でデータ パイプラインのコンポーネントを構築する実践演習を行います。
すべてのデータ パイプラインには、データレイクとデータ ウェアハウスという 2 つの主要コンポーネントがあります。このコースでは、各ストレージ タイプのユースケースを紹介し、Google Cloud で利用可能なデータレイクとデータ ウェアハウスのソリューションを技術的に詳しく説明します。また、データ エンジニアの役割や、効果的なデータ パイプラインが事業運営にもたらすメリットについて確認し、クラウド環境でデータ エンジニアリングを行うべき理由を説明します。 これは「Data Engineering on Google Cloud」シリーズの最初のコースです。このコースを修了したら、「Google Cloud でのバッチデータ パイプラインの構築」コースに登録してください。
Data Catalog is deprecated and will be discontinued on January 30, 2026. You can still complete this course if you want to. For steps to transition your Data Catalog users, workloads, and content to Dataplex Catalog, see Transition from Data Catalog to Dataplex Catalog (https://cloud.google.com/dataplex/docs/transition-to-dataplex-catalog). Data Catalog is a fully managed and scalable metadata management service that empowers organizations to quickly discover, understand, and manage all of their data. In this quest you will start small by learning how to search and tag data assets and metadata with Data Catalog. After learning how to build your own tag templates that map to BigQuery table data, you will learn how to build MySQL, PostgreSQL, and SQLServer to Data Catalog Connectors.
In this course, you will get hands-on experience applying advanced LookML concepts in Looker. You will learn how to use Liquid to customize and create dynamic dimensions and measures, create dynamic SQL derived tables and customized native derived tables, and use extends to modularize your LookML code.
このコースを受講すると、スケーラブルでパフォーマンスの高い LookML(Looker モデリング言語)モデルを開発し、ビジネス ユーザーの疑問解決に役立つ標準化されたすぐに使えるデータを提供できるようになります。このコースの修了時には、組織の Looker インスタンスでデータをキュレートして管理するための LookML モデルの構築と維持が可能になります。
このコースでは、これまで主に SQL のデベロッパーやアナリストが行っていたようなデータの探索や分析を Looker で実施する方法について学びます。このコースを修了すると、Looker の最新の分析プラットフォームを活用して、組織の Looker インスタンスにおける関連性の高いコンテンツの検索と探索、データに関する問い合わせ、必要に応じた新しい指標の作成、データドリブンな意思決定を促進するためのビジュアリゼーションとダッシュボードの作成や共有を行えるようになります。
このコースでは、ML について定義し、ビジネスで ML をどのように活用できるのかを学習します。機械学習を使用したデモをいくつか確認し、機械学習の主な用語(インスタンス、特徴、ラベルなど)について学習します。インタラクティブなラボでは、事前トレーニング済みの ML API の呼び出しを実行するほか、BigQuery ML で SQL のみを使用して独自の ML モデルを構築します。
このコースシリーズの 3 番目のコースは、「Achieving Advanced Insights with BigQuery」です。ここでは、高度な関数と、複雑なクエリを管理可能なステップに分割する方法を学びながら、SQL に関する知識を深めます。 BigQuery の内部アーキテクチャ(列ベースのシャーディング ストレージ)についてや、ARRAY と STRUCT を使用した、ネストされたフィールドと繰り返しフィールドなどの高度な SQL トピックについて説明します。最後に、クエリのパフォーマンスを最適化する方法と、承認済みビューを使用してデータを保護する方法について説明します。 このコースを修了したら、「Applying Machine Learning to Your Data with Google」コースに登録してください。
これは「Data to Insights」コースシリーズの 2 つ目のコースです。ここでは、新しい外部データセットを BigQuery に取り込み、Looker Studio で可視化する方法について説明します。また、複数テーブルの JOIN と UNION など、中級者向けの SQL のコンセプトについても説明します。JOIN や UNION を使用すると、複数のデータソースのデータを分析できます。 注: すでに SQL に関する知識をお持ちの方も、BigQuery に固有の要素(クエリ キャッシュやテーブル ワイルドカードの処理など)について学ぶことができます。 このコースを修了したら、「Achieving Advanced Insights with BigQuery」コースに登録してください。
このコースでは、データ アナリストが共通して直面する課題と、その課題を Google Cloud のビッグデータ ツールを使用して解決する方法を取り上げます。その過程で SQL を学習しながら、BigQuery と Dataprep を使用してデータセットを分析し、変換する方法について理解を深めます。 これは「From Data to Insights with Google Cloud」シリーズの最初のコースです。このコースを修了したら、「Creating New BigQuery Datasets and Visualizing Insights」コースを受講してください。
このコースでは、データから AI へのライフサイクルをサポートする Google Cloud のビッグデータと ML のプロダクトやサービスを紹介します。また、Google Cloud で Vertex AI を使用してビッグデータ パイプラインと ML モデルを作成する際のプロセス、課題、メリットについて説明します。
あらゆる規模の組織が、事業運営の変革にクラウドの能力と柔軟性を活用しているなかで、クラウド リソースを効果的に管理、スケーリングすることが複雑なタスクになる可能性もあります。 ここでは、Google Cloud Operations を使用したスケーリングを通して、クラウドにおける最新の運用、信頼性、レジリエンスに関する基本的概念と、Google Cloud がこういった取り組みをどのように支援できるのかについて理解を深めます。 このコースは クラウド デジタル リーダー 学習プログラムの一部で、個人が自分の役割において成長し、ビジネスの未来を構築することを目的としています。
多くの従来型企業では、既存のシステムやアプリケーションで昨今の顧客の期待に応え続けることが難しくなっています。この場合、経営者は、老朽化した IT システムの保守を続けるのか、新たな製品やサービスに投資をするのか、選択を迫られることになります。「Google Cloud によるインフラストラクチャとアプリケーションのモダナイゼーション」ではそうした課題を明らかにするとともに、そうした課題をクラウド テクノロジーによって乗り越えるためのソリューションについて学びます。 このコースは クラウド デジタル リーダー 学習プログラムの一部で、個人が自分の役割において成長し、ビジネスの未来を構築することを目的としています。
クラウド テクノロジーは組織に大きな価値をもたらします。クラウド テクノロジーの力をデータと組み合わせることで、その価値はさらに大きなものとなり、新しいカスタマー エクスペリエンスを提供できる可能性があります。「Google Cloud によるデータ トランスフォーメーションの探求」では、データが組織にもたらす価値と、Google Cloud でデータを有用かつアクセス可能なものにする方法を学習します。このコースは「クラウド デジタル リーダー」学習プログラムの一部で、個人が自分の役割において成長し、ビジネスの未来を構築することを目的としています。
クラウド テクノロジーとデジタル トランスフォーメーションに大きな期待が寄せられていますが、疑問点も多く残っています。 例: クラウド テクノロジーとは何か?デジタル トランスフォーメーションとは何を意味しているか?クラウド テクノロジーが組織にどう役立つのか?どこから着手するのか? このような疑問をお持ちなら、このコースはぴったりです。このコースでは、デジタル トランスフォーメーションにおいて多くの企業が直面する機会と課題のタイプについてご説明します。このデジタル トランスフォーメーションの入門コースなら、クラウド テクノロジーに関する知識を深めて自分の業務に活用するとともに、今後のビジネスの成長にも役立てていただけます。このコースは クラウド デジタル リーダー 学習プログラムの一部です。