チェックポイント
Train and deploy a custom image classification model using Vertex AI
/ 100
Vertex AI を使用した分散 TensorFlow の実行
GSP971
概要
このラボでは、TensorFlow の分散戦略と Vertex AI プラットフォームを使用して、画像分類データセットを分類するためのカスタム TensorFlow 画像分類モデルのトレーニングとデプロイを行います。
学習内容
- TensorFlow 分散戦略の一つである MirrorStrategy を使用して Vertex AI にトレーニング パイプラインをデプロイする。
- Vertex AI を使用してモデルのエンドポイントをクラウドにデプロイし、オンライン予測を可能にする。
設定と要件
[ラボを開始] ボタンをクリックする前に
こちらの手順をお読みください。ラボの時間は記録されており、一時停止することはできません。[ラボを開始] をクリックするとスタートするタイマーは、Google Cloud のリソースを利用できる時間を示しています。
このハンズオンラボでは、シミュレーションやデモ環境ではなく、実際のクラウド環境を使ってご自身でラボのアクティビティを行うことができます。そのため、ラボの受講中に Google Cloud にログインおよびアクセスするための、新しい一時的な認証情報が提供されます。
このラボを完了するためには、下記が必要です。
- 標準的なインターネット ブラウザ(Chrome を推奨)
- ラボを完了するために十分な時間を確保してください。ラボをいったん開始すると一時停止することはできません。
ラボを開始して Google Cloud コンソールにログインする方法
-
[ラボを開始] ボタンをクリックします。ラボの料金をお支払いいただく必要がある場合は、表示されるポップアップでお支払い方法を選択してください。 左側の [ラボの詳細] パネルには、以下が表示されます。
- [Google Cloud コンソールを開く] ボタン
- 残り時間
- このラボで使用する必要がある一時的な認証情報
- このラボを行うために必要なその他の情報(ある場合)
-
[Google Cloud コンソールを開く] をクリックします(Chrome ブラウザを使用している場合は、右クリックして [シークレット ウィンドウでリンクを開く] を選択します)。
ラボでリソースが起動し、別のタブで [ログイン] ページが表示されます。
ヒント: タブをそれぞれ別のウィンドウで開き、並べて表示しておきましょう。
注: [アカウントの選択] ダイアログが表示されたら、[別のアカウントを使用] をクリックします。 -
必要に応じて、下のユーザー名をコピーして、[ログイン] ダイアログに貼り付けます。
{{{user_0.username | "Username"}}} [ラボの詳細] パネルでも [ユーザー名] を確認できます。
-
[次へ] をクリックします。
-
以下のパスワードをコピーして、[ようこそ] ダイアログに貼り付けます。
{{{user_0.password | "Password"}}} [ラボの詳細] パネルでも [パスワード] を確認できます。
-
[次へ] をクリックします。
重要: ラボで提供された認証情報を使用する必要があります。Google Cloud アカウントの認証情報は使用しないでください。 注: このラボでご自身の Google Cloud アカウントを使用すると、追加料金が発生する場合があります。 -
その後次のように進みます。
- 利用規約に同意してください。
- 一時的なアカウントなので、復元オプションや 2 要素認証プロセスは設定しないでください。
- 無料トライアルには登録しないでください。
その後、このタブで Google Cloud コンソールが開きます。
Cloud Shell をアクティブにする
Cloud Shell は、開発ツールと一緒に読み込まれる仮想マシンです。5 GB の永続ホーム ディレクトリが用意されており、Google Cloud で稼働します。Cloud Shell を使用すると、コマンドラインで Google Cloud リソースにアクセスできます。
- Google Cloud コンソールの上部にある「Cloud Shell をアクティブにする」アイコン をクリックします。
接続した時点で認証が完了しており、プロジェクトに各自の PROJECT_ID が設定されます。出力には、このセッションの PROJECT_ID を宣言する次の行が含まれています。
gcloud
は Google Cloud のコマンドライン ツールです。このツールは、Cloud Shell にプリインストールされており、タブ補完がサポートされています。
- (省略可)次のコマンドを使用すると、有効なアカウント名を一覧表示できます。
-
[承認] をクリックします。
-
出力は次のようになります。
出力:
- (省略可)次のコマンドを使用すると、プロジェクト ID を一覧表示できます。
出力:
出力例:
gcloud
ドキュメントの全文については、gcloud CLI の概要ガイドをご覧ください。
タスク 1. Google Cloud のサービスを有効にする
- Cloud Shell で
gcloud
を使用し、ラボで使用するサービスを有効にします。
- カスタム サービス アカウントを作成します。
- プロジェクト ID の環境変数を設定します。
- サービス アカウントに
aiplatform.user
ロールを付与します。
これにより、Vertex AI でモデルのトレーニング、デプロイ、説明ジョブを実行できるようになります。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
タスク 2. Vertex ノートブック インスタンスをデプロイする
Vertex AI Workbench ノートブックを作成して起動する手順は次のとおりです。
-
ナビゲーション メニュー で、[Vertex AI] > [ワークベンチ] をクリックします。
-
[ワークベンチ] ページで、[Notebooks API を有効にする] をクリックします(まだ有効になっていない場合)。
-
[ユーザー管理のノートブック] タブに移動し、[新規作成] をクリックします。
-
[新しいインスタンス] メニューの [環境] で、[TensorFlow Enterprise 2.11] を選択します。
-
ノートブックに名前を付けます。
-
[リージョン] を
に設定し、[ゾーン] を、指定したリージョン内のいずれかのゾーンに設定します。 -
[詳細オプション] をクリックして、インスタンスのプロパティを編集します。
-
[マシンタイプ] をクリックし、マシンタイプとして [e2-standard-2] を選択します。
-
残りのフィールドはデフォルトのままにし、[作成] をクリックします。
数分後、[ワークベンチ] ページにインスタンス名が表示され、それに続いて [JupyterLab を開く] が表示されます。
- [JupyterLab を開く] をクリックして、新しいタブで JupyterLab を開きます。ビルドに beatrix jupyterlab を含める必要があるというメッセージが表示された場合は、無視してください。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
タスク 3. ラボのリポジトリのクローンを作成する
training-data-analyst
ノートブックのクローンを JupyterLab インスタンス内に作成する手順は次のとおりです。
- JupyterLab で、[Terminal] アイコンをクリックして新しいターミナルを開きます。
- GitHub リポジトリのクローンを作成するには、次のコマンドを入力し、Enter キーを押します。
- リポジトリのクローンが作成されたことを確認するには、
training-data-analyst
ディレクトリをダブルクリックし、リポジトリのコンテンツが表示されることを確認します。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
ラボのノートブックに移動する
-
左側のパネルから、
training-data-analyst/self-paced-labs/vertex-ai/vertex-distributed-tensorflow
フォルダに移動します。 -
右のウィンドウで
Qwiklab_Running_Distributed_TensorFlow_using_Vertex_AI.ipynb
ファイルをクリックして開きます。 -
ノートブックでラボを続け、画面上部の実行アイコン()をクリックして各セルを実行します。または、Shift+Enter キーを押してセルでコードを実行します。
-
説明を読んで、各セルの実行内容を十分に理解してください。
-
Vertex AI でトレーニングとデプロイのステータスを確認する手順は、ノートブックに図解されています。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
お疲れさまでした
これで完了です。このラボでは、ML のテスト ワークフローとして、TensorFlow の分散戦略と Vertex AI の ML サービスを使用して、CIFAR-10 データセットからの画像を分類する TensorFlow モデルのトレーニングとデプロイを行いました。
次のステップと詳細情報
Google Cloud トレーニングと認定資格
Google Cloud トレーニングと認定資格を通して、Google Cloud 技術を最大限に活用できるようになります。必要な技術スキルとベスト プラクティスについて取り扱うクラスでは、学習を継続的に進めることができます。トレーニングは基礎レベルから上級レベルまであり、オンデマンド、ライブ、バーチャル参加など、多忙なスケジュールにも対応できるオプションが用意されています。認定資格を取得することで、Google Cloud テクノロジーに関するスキルと知識を証明できます。
マニュアルの最終更新日: 2023 年 10 月 11 日
ラボの最終テスト日: 2022 年 10 月 11 日
Copyright 2024 Google LLC All rights reserved. Google および Google のロゴは Google LLC の商標です。その他すべての企業名および商品名はそれぞれ各社の商標または登録商標です。