arrow_back

BigQuery 및 Workbench 인스턴스를 사용한 탐색적 데이터 분석

로그인 가입
700개 이상의 실습 및 과정 이용하기

BigQuery 및 Workbench 인스턴스를 사용한 탐색적 데이터 분석

실습 2시간 universal_currency_alt 크레딧 1개 show_chart 중급
info 이 실습에는 학습을 지원하는 AI 도구가 통합되어 있을 수 있습니다.
700개 이상의 실습 및 과정 이용하기

개요

이 실습에서는 Workbench 인스턴스 노트북을 사용해 BigQuery에 저장된 데이터 세트를 분석하여 쿼리를 수행하고 다양한 통계 차트 기법을 사용하여 데이터를 표시하는 과정을 알아봅니다. 이러한 분석은 데이터에서 패턴을 발견하는 데 도움이 됩니다.

학습 목표

  • Workbench 인스턴스 노트북 만들기
  • BigQuery 데이터 세트에 연결
  • Pandas DataFrame에 대한 통계 분석 수행
  • Python에서 탐색적 데이터 분석을 위한 Seaborn 플롯 생성
  • BigQuery 데이터 세트에서 특정 필드를 선택하는 SQL 쿼리 작성

Vertex AI는 머신러닝(ML) 애플리케이션을 빌드, 배포, 관리하는 통합 플랫폼입니다.

Vertex AI Workbench 노트북은 Google Cloud에서 ML 모델을 개발하고 배포하기 위한 유연하고 확장 가능한 솔루션을 제공합니다. 더 많은 맞춤설정 옵션이 필요하고 머신러닝 환경을 완전히 제어해야 하는 경우 Workbench를 선택하세요. Workbench는 기업 조직에 필요한 보안 및 규정 준수 기능을 제공하며 Vertex AI 및 BigQuery와 같은 다른 Google Cloud 서비스와 통합되어 데이터 과학 및 머신러닝 워크플로를 향상합니다.

BigQuery는 강력한 완전 관리형 서버리스 데이터 웨어하우스로, 대규모 데이터 세트를 손쉽게 분석하고 관리할 수 있습니다. BigQuery는 익숙한 표준 SQL 언어를 사용하기 때문에 분석가와 데이터 과학자가 새로운 언어를 학습할 필요 없이 쉽게 사용할 수 있습니다.

Vertex AI는 두 가지 노트북 솔루션인 Workbench와 Colab Enterprise를 제공합니다.

Colab

Workbench

Vertex AI Workbench는 제어 및 맞춤설정을 우선시하는 프로젝트에 적합한 옵션입니다. 복잡한 종속 항목이 여러 파일에 걸쳐 있는 프로젝트에 적합합니다. 워크스테이션이나 노트북에서 클라우드로 전환하는 데이터 과학자에게도 적합한 옵션입니다.

Vertex AI Workbench 인스턴스에는 TensorFlow 및 PyTorch 프레임워크 지원을 포함하여 딥 러닝 패키지 모음이 사전 설치되어 있습니다.

workbench1

Qwiklabs 환경 설정

Qwiklabs 설정

각 실습에서는 정해진 기간 동안 새 Google Cloud 프로젝트와 리소스 집합이 무료로 제공됩니다.

  1. 시크릿 창을 사용하여 Qwiklabs에 로그인합니다.

  2. 실습 사용 가능 시간(예: 1:15:00)을 참고하여 해당 시간 내에 완료합니다.
    일시중지 기능은 없습니다. 필요한 경우 다시 시작할 수 있지만 처음부터 시작해야 합니다.

  3. 준비가 되면 실습 시작을 클릭합니다.

  4. 실습 사용자 인증 정보(사용자 이름비밀번호)를 기록해 두세요. Google Cloud Console에 로그인합니다.

  5. Google Console 열기를 클릭합니다.

  6. 다른 계정 사용을 클릭한 다음, 안내 메시지에 실습에 대한 사용자 인증 정보를 복사하여 붙여넣습니다.
    다른 사용자 인증 정보를 사용하는 경우 오류가 발생하거나 요금이 부과됩니다.

  7. 약관에 동의하고 리소스 복구 페이지를 건너뜁니다.

작업 1. Workbench 노트북 만들기

  1. Google Cloud 콘솔의 탐색 메뉴(탐색 메뉴)에서 Vertex AI를 선택합니다.

  2. 모든 권장 API 사용 설정을 클릭합니다.

  3. 탐색 메뉴에서 Workbench를 클릭합니다.

    Workbench 페이지 상단에서 인스턴스 뷰에 있는지 확인합니다.

  4. 상자 추가새로 만들기를 클릭합니다.

  5. 인스턴스를 구성합니다.

    • 이름: lab-workbench
    • 리전: 리전을 (으)로 설정합니다.
    • 영역: 영역을 (으)로 설정합니다.
    • 고급 옵션(선택사항): 필요한 경우 '고급 옵션'을 클릭하여 추가로 맞춤설정(예: 머신 유형, 디스크 크기)할 수 있습니다.

Vertex AI Workbench 인스턴스 생성

  1. 만들기를 클릭합니다.

인스턴스를 만드는 데 몇 분 정도 걸립니다. 준비되면 이름 옆에 녹색 체크표시가 나타납니다.

  1. 인스턴스 이름 옆에 있는 JupyterLab 열기를 클릭하여 JupyterLab 인터페이스를 실행합니다. 그러면 브라우저에서 새 탭이 열립니다.

Workbench 인스턴스 배포됨

  1. Python 3 아이콘을 클릭하여 새로운 Python 노트북을 실행합니다.

Jupyter 노트북 열기

  1. 메뉴 바에서 Untitled.ipynb 파일을 마우스 오른쪽 버튼으로 클릭한 후 Rename Notebook(노트북 이름 변경)을 선택하여 적합한 이름을 지정합니다.

노트북 이름 변경

환경이 설정되었습니다. 이제 Vertex AI Workbench 노트북 작업을 시작할 준비가 되었습니다.

Vertex 노트북 준비 완료

작업 2. Vertex AI 노트북 인스턴스 내에서 저장소 클론

GitHub 저장소에는 과정의 실습 파일과 솔루션 파일이 모두 들어 있습니다.

  1. 노트북의 첫 번째 셀에서 다음 코드를 복사하고 실행하여 training-data-analyst 저장소를 클론합니다.
!git clone https://github.com/GoogleCloudPlatform/training-data-analyst

training-data-analyst 저장소 클론

  1. 저장소가 클론되었는지 확인합니다. training-data-analyst 디렉터리를 더블클릭하고 디렉터리의 콘텐츠를 볼 수 있는지 확인합니다.

training-data-analyst 저장소 확인

  1. 노트북 인터페이스에서 training-data-analyst > courses > machine_learning > deepdive2 > launching_into_ml > solutions로 이동한 다음 workbench_explore_data.ipynb를 엽니다.

  2. 노트북 인터페이스에서 Edit(수정) > Clear All Outputs(모든 출력 지우기)를 클릭합니다(Edit을 클릭한 다음 드롭다운 메뉴에서 Clear All Outputs 선택).

  3. 커널 선택 대화상자에서 사용 가능한 커널 목록 중 Python 3을 선택합니다.

  4. 노트북 안내를 꼼꼼히 읽어봅니다.

노트북 안내

수고하셨습니다

이 실습에서는 다음을 수행하는 방법을 배웠습니다.

  • Workbench 인스턴스 노트북 만들기
  • GitHub 저장소 클론
  • BigQuery 데이터 세트에 연결
  • Pandas DataFrame에 대한 통계 분석 수행
  • Python에서 탐색적 데이터 분석을 위한 Seaborn 플롯 생성
  • BigQuery 데이터 세트에서 특정 필드를 선택하는 SQL 쿼리 작성

실습 종료

실습을 완료하면 실습 종료를 클릭합니다. Qwiklabs에서 사용된 리소스를 자동으로 삭제하고 계정을 지웁니다.

실습 경험을 평가할 수 있습니다. 해당하는 별표 수를 선택하고 의견을 입력한 후 제출을 클릭합니다.

별점의 의미는 다음과 같습니다.

  • 별표 1개 = 매우 불만족
  • 별표 2개 = 불만족
  • 별표 3개 = 중간
  • 별표 4개 = 만족
  • 별표 5개 = 매우 만족

의견을 제공하고 싶지 않다면 대화상자를 닫으면 됩니다.

의견이나 제안 또는 수정할 사항이 있다면 지원 탭을 사용하세요.

설명서 최종 업데이트: 2024년 11월 25일

실습 최종 테스트: 2024년 11월 25일

Copyright 2020 Google LLC All rights reserved. Google 및 Google 로고는 Google LLC의 상표입니다. 기타 모든 회사명 및 제품명은 해당 업체의 상표일 수 있습니다.

시작하기 전에

  1. 실습에서는 정해진 기간 동안 Google Cloud 프로젝트와 리소스를 만듭니다.
  2. 실습에는 시간 제한이 있으며 일시중지 기능이 없습니다. 실습을 종료하면 처음부터 다시 시작해야 합니다.
  3. 화면 왼쪽 상단에서 실습 시작을 클릭하여 시작합니다.

시크릿 브라우징 사용

  1. 실습에 입력한 사용자 이름비밀번호를 복사합니다.
  2. 비공개 모드에서 콘솔 열기를 클릭합니다.

콘솔에 로그인

    실습 사용자 인증 정보를 사용하여
  1. 로그인합니다. 다른 사용자 인증 정보를 사용하면 오류가 발생하거나 요금이 부과될 수 있습니다.
  2. 약관에 동의하고 리소스 복구 페이지를 건너뜁니다.
  3. 실습을 완료했거나 다시 시작하려고 하는 경우가 아니면 실습 종료를 클릭하지 마세요. 이 버튼을 클릭하면 작업 내용이 지워지고 프로젝트가 삭제됩니다.

현재 이 콘텐츠를 이용할 수 없습니다

이용할 수 있게 되면 이메일로 알려드리겠습니다.

감사합니다

이용할 수 있게 되면 이메일로 알려드리겠습니다.

한 번에 실습 1개만 가능

모든 기존 실습을 종료하고 이 실습을 시작할지 확인하세요.

시크릿 브라우징을 사용하여 실습 실행하기

이 실습을 실행하려면 시크릿 모드 또는 시크릿 브라우저 창을 사용하세요. 개인 계정과 학생 계정 간의 충돌로 개인 계정에 추가 요금이 발생하는 일을 방지해 줍니다.