arrow_back

Vertex AI を使用した分散 TensorFlow の実行

ログイン 参加
知識をテストして、コミュニティで共有しましょう
done
700 を超えるハンズオンラボ、スキルバッジ、コースへのアクセス

Vertex AI を使用した分散 TensorFlow の実行

ラボ 1時間 30分 universal_currency_alt クレジット: 5 show_chart 中級
info このラボでは、学習をサポートする AI ツールが組み込まれている場合があります。
知識をテストして、コミュニティで共有しましょう
done
700 を超えるハンズオンラボ、スキルバッジ、コースへのアクセス

GSP971

Google Cloud セルフペース ラボ

概要

このラボでは、TensorFlow の分散戦略と Vertex AI プラットフォームを使用して、画像分類データセットを分類するためのカスタム TensorFlow 画像分類モデルのトレーニングとデプロイを行います。

学習内容

  1. TensorFlow 分散戦略の一つである MirrorStrategy を使用して Vertex AI にトレーニング パイプラインをデプロイする。
  2. Vertex AI を使用してモデルのエンドポイントをクラウドにデプロイし、オンライン予測を可能にする。

設定と要件

[ラボを開始] ボタンをクリックする前に

こちらの手順をお読みください。ラボの時間は記録されており、一時停止することはできません。[ラボを開始] をクリックするとスタートするタイマーは、Google Cloud のリソースを利用できる時間を示しています。

このハンズオンラボでは、シミュレーションやデモ環境ではなく、実際のクラウド環境を使ってご自身でラボのアクティビティを行うことができます。そのため、ラボの受講中に Google Cloud にログインおよびアクセスするための、新しい一時的な認証情報が提供されます。

このラボを完了するためには、下記が必要です。

  • 標準的なインターネット ブラウザ(Chrome を推奨)
注: このラボの実行には、シークレット モードまたはシークレット ブラウジング ウィンドウを使用してください。これにより、個人アカウントと受講者アカウント間の競合を防ぎ、個人アカウントに追加料金が発生することを防ぎます。
  • ラボを完了するために十分な時間を確保してください。ラボをいったん開始すると一時停止することはできません。
注: すでに個人の Google Cloud アカウントやプロジェクトをお持ちの場合でも、このラボでは使用しないでください。アカウントへの追加料金が発生する可能性があります。

ラボを開始して Google Cloud コンソールにログインする方法

  1. [ラボを開始] ボタンをクリックします。ラボの料金をお支払いいただく必要がある場合は、表示されるポップアップでお支払い方法を選択してください。 左側の [ラボの詳細] パネルには、以下が表示されます。

    • [Google Cloud コンソールを開く] ボタン
    • 残り時間
    • このラボで使用する必要がある一時的な認証情報
    • このラボを行うために必要なその他の情報(ある場合)
  2. [Google Cloud コンソールを開く] をクリックします(Chrome ブラウザを使用している場合は、右クリックして [シークレット ウィンドウでリンクを開く] を選択します)。

    ラボでリソースが起動し、別のタブで [ログイン] ページが表示されます。

    ヒント: タブをそれぞれ別のウィンドウで開き、並べて表示しておきましょう。

    注: [アカウントの選択] ダイアログが表示されたら、[別のアカウントを使用] をクリックします。
  3. 必要に応じて、下のユーザー名をコピーして、[ログイン] ダイアログに貼り付けます。

    {{{user_0.username | "Username"}}}

    [ラボの詳細] パネルでも [ユーザー名] を確認できます。

  4. [次へ] をクリックします。

  5. 以下のパスワードをコピーして、[ようこそ] ダイアログに貼り付けます。

    {{{user_0.password | "Password"}}}

    [ラボの詳細] パネルでも [パスワード] を確認できます。

  6. [次へ] をクリックします。

    重要: ラボで提供された認証情報を使用する必要があります。Google Cloud アカウントの認証情報は使用しないでください。 注: このラボでご自身の Google Cloud アカウントを使用すると、追加料金が発生する場合があります。
  7. その後次のように進みます。

    • 利用規約に同意してください。
    • 一時的なアカウントなので、復元オプションや 2 要素認証プロセスは設定しないでください。
    • 無料トライアルには登録しないでください。

その後、このタブで Google Cloud コンソールが開きます。

注: Google Cloud のプロダクトやサービスのリストを含むメニューを表示するには、左上のナビゲーション メニューをクリックします。ナビゲーション メニュー アイコン

Cloud Shell をアクティブにする

Cloud Shell は、開発ツールと一緒に読み込まれる仮想マシンです。5 GB の永続ホーム ディレクトリが用意されており、Google Cloud で稼働します。Cloud Shell を使用すると、コマンドラインで Google Cloud リソースにアクセスできます。

  1. Google Cloud コンソールの上部にある「Cloud Shell をアクティブにする」アイコン 「Cloud Shell をアクティブにする」アイコン をクリックします。

接続した時点で認証が完了しており、プロジェクトに各自の PROJECT_ID が設定されます。出力には、このセッションの PROJECT_ID を宣言する次の行が含まれています。

Your Cloud Platform project in this session is set to YOUR_PROJECT_ID

gcloud は Google Cloud のコマンドライン ツールです。このツールは、Cloud Shell にプリインストールされており、タブ補完がサポートされています。

  1. (省略可)次のコマンドを使用すると、有効なアカウント名を一覧表示できます。
gcloud auth list
  1. [承認] をクリックします。

  2. 出力は次のようになります。

出力:

ACTIVE: * ACCOUNT: student-01-xxxxxxxxxxxx@qwiklabs.net To set the active account, run: $ gcloud config set account `ACCOUNT`
  1. (省略可)次のコマンドを使用すると、プロジェクト ID を一覧表示できます。
gcloud config list project

出力:

[core] project = <project_ID>

出力例:

[core] project = qwiklabs-gcp-44776a13dea667a6 注: Google Cloud における gcloud ドキュメントの全文については、gcloud CLI の概要ガイドをご覧ください。

タスク 1. Google Cloud のサービスを有効にする

  1. Cloud Shell で gcloud を使用し、ラボで使用するサービスを有効にします。
gcloud services enable \ compute.googleapis.com \ iam.googleapis.com \ iamcredentials.googleapis.com \ monitoring.googleapis.com \ logging.googleapis.com \ notebooks.googleapis.com \ aiplatform.googleapis.com \ bigquery.googleapis.com \ artifactregistry.googleapis.com \ cloudbuild.googleapis.com \ container.googleapis.com
  1. カスタム サービス アカウントを作成します。
SERVICE_ACCOUNT_ID=vertex-custom-training-sa gcloud iam service-accounts create $SERVICE_ACCOUNT_ID \ --description="Tensorboard を使用した Vertex カスタム トレーニングのためのカスタム サービス アカウント" \ --display-name="Vertex AI カスタム トレーニング"
  1. プロジェクト ID の環境変数を設定します。
PROJECT_ID=$(gcloud config get-value core/project)
  1. サービス アカウントに aiplatform.user ロールを付与します。
gcloud projects add-iam-policy-binding $PROJECT_ID \ --member=serviceAccount:$SERVICE_ACCOUNT_ID@$PROJECT_ID.iam.gserviceaccount.com \ --role="roles/aiplatform.user"

これにより、Vertex AI でモデルのトレーニング、デプロイ、説明ジョブを実行できるようになります。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。 Google Cloud のサービスを有効にする

タスク 2. Vertex ノートブック インスタンスをデプロイする

Vertex AI Workbench ノートブックを作成して起動する手順は次のとおりです。

  1. ナビゲーション メニュー ナビゲーション メニュー アイコン で、[Vertex AI] > [ワークベンチ] をクリックします。

  2. [ワークベンチ] ページで、[Notebooks API を有効にする] をクリックします(まだ有効になっていない場合)。

  3. [ユーザー管理のノートブック] タブに移動し、[新規作成] をクリックします。

  4. [新しいインスタンス] メニューの [環境] で、[TensorFlow Enterprise 2.11] を選択します。

  5. ノートブックに名前を付けます。

  6. [リージョン] を に設定し、[ゾーン] を、指定したリージョン内のいずれかのゾーンに設定します。

  7. [詳細オプション] をクリックして、インスタンスのプロパティを編集します。

  8. [マシンタイプ] をクリックし、マシンタイプとして [e2-standard-2] を選択します。

  9. 残りのフィールドはデフォルトのままにし、[作成] をクリックします。

数分後、[ワークベンチ] ページにインスタンス名が表示され、それに続いて [JupyterLab を開く] が表示されます。

  1. [JupyterLab を開く] をクリックして、新しいタブで JupyterLab を開きます。ビルドに beatrix jupyterlab を含める必要があるというメッセージが表示された場合は、無視してください。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。 Vertex ノートブック インスタンスをデプロイする

タスク 3. ラボのリポジトリのクローンを作成する

training-data-analyst ノートブックのクローンを JupyterLab インスタンス内に作成する手順は次のとおりです。

  1. JupyterLab で、[Terminal] アイコンをクリックして新しいターミナルを開きます。
  2. GitHub リポジトリのクローンを作成するには、次のコマンドを入力し、Enter キーを押します。
git clone https://github.com/GoogleCloudPlatform/training-data-analyst
  1. リポジトリのクローンが作成されたことを確認するには、training-data-analyst ディレクトリをダブルクリックし、リポジトリのコンテンツが表示されることを確認します。

training-data-analyst ディレクトリ

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。 ラボのリポジトリのクローンを作成する

ラボのノートブックに移動する

  1. 左側のパネルから、training-data-analyst/self-paced-labs/vertex-ai/vertex-distributed-tensorflow フォルダに移動します。

  2. 右のウィンドウで Qwiklab_Running_Distributed_TensorFlow_using_Vertex_AI.ipynb ファイルをクリックして開きます。

  3. ノートブックでラボを続け、画面上部の実行アイコン(実行アイコン)をクリックして各セルを実行します。または、Shift+Enter キーを押してセルでコードを実行します。

  • 説明を読んで、各セルの実行内容を十分に理解してください。

  • Vertex AI でトレーニングとデプロイのステータスを確認する手順は、ノートブックに図解されています。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。 Vertex AI でカスタム画像分類モデルをトレーニングしてデプロイする

お疲れさまでした

これで完了です。このラボでは、ML のテスト ワークフローとして、TensorFlow の分散戦略と Vertex AI の ML サービスを使用して、CIFAR-10 データセットからの画像を分類する TensorFlow モデルのトレーニングとデプロイを行いました。

次のステップと詳細情報

TensorFlow による分散型トレーニングを確認する

Google Cloud トレーニングと認定資格

Google Cloud トレーニングと認定資格を通して、Google Cloud 技術を最大限に活用できるようになります。必要な技術スキルとベスト プラクティスについて取り扱うクラスでは、学習を継続的に進めることができます。トレーニングは基礎レベルから上級レベルまであり、オンデマンド、ライブ、バーチャル参加など、多忙なスケジュールにも対応できるオプションが用意されています。認定資格を取得することで、Google Cloud テクノロジーに関するスキルと知識を証明できます。

マニュアルの最終更新日: 2023 年 10 月 11 日

ラボの最終テスト日: 2022 年 10 月 11 日

Copyright 2024 Google LLC All rights reserved. Google および Google のロゴは Google LLC の商標です。その他すべての企業名および商品名はそれぞれ各社の商標または登録商標です。

このコンテンツは現在ご利用いただけません

利用可能になりましたら、メールでお知らせいたします

ありがとうございます。

利用可能になりましたら、メールでご連絡いたします