이 과정에서는 Google Cloud에서 프로덕션 ML 시스템 배포, 평가, 모니터링, 운영을 위한 MLOps 도구와 권장사항을 소개합니다. MLOps는 프로덕션에서 ML 시스템을 배포, 테스트, 모니터링, 자동화하는 방법론입니다. 머신러닝 엔지니어링 전문가들은 배포된 모델의 지속적인 개선과 평가를 위해 도구를 사용합니다. 이들이 협력하거나 때론 그 역할을 하는 데이터 과학자는 고성능 모델을 빠르고 정밀하게 배포할 수 있도록 모델을 개발합니다.
이 과정에서는 Google Cloud에서 최신 ML 파이프라인 개발을 담당하는 ML 엔지니어와 트레이너로부터 유익한 지식을 배웁니다. 초반에 진행되는 몇 개 모듈에서는 Google의 TensorFlow 기반 프로덕션 머신러닝 플랫폼으로서 ML 파이프라인과 메타데이터를 관리할 수 있는 TensorFlow Extended(TFX)에 대해 다룹니다. 파이프라인 구성요소와 TFX를 사용한 파이프라인 조정을 알아봅니다. 지속적 통합과 지속적 배포를 통해 파이프라인을 자동화하는 방법과 ML 메타데이터를 관리하는 방법도 배웁니다. 그런 다음 주제를 전환하여 TensorFlow, PyTorch, scikit-learn, xgboost 등 여러 ML 프레임워크에서 ML 파이프라인을 자동화하고 재사용하는 방법을 설명합니다. 또한 Google Cloud의 또 다른 도구인 Cloud Composer를 사용하여 지속적 학습 파이프라인을 조정하는 방법도 알아봅니다. 마지막으로 MLflow를 사용하여 머신러닝의 전체 수명 주기를 관리하는 방법을 살펴봅니다.