チェックポイント
Enable the Vertex AI API
/ 25
Extract the content of the image
/ 25
Create prompts with text
/ 25
Create conversations with chat prompt
/ 25
Vertex AI Studio を使ってみる
GSP1154
概要
Vertex AI は、予測 AI と生成 AI の両方の機能を備えた包括的な ML 開発プラットフォームです。予測を目的とする予測 ML モデルをトレーニング、評価、デプロイできます。また、このプラットフォームを使用して、生成 AI モデルの検出、チューニング、サービングを行ってコンテンツを生成することもできます。
Vertex AI Studio を使用すると、生成 AI モデルを迅速にテストおよびカスタマイズし、モデルの機能をアプリケーションで利用できます。UI(ユーザー インターフェース)とコーディング例の両方を含むさまざまなツールとリソースが用意されているため、ML の経験がなくても生成 AI を簡単に使い始めることができます。
このラボでは、Vertex AI Studio を使用して最先端の生成 AI モデルの可能性を引き出す方法を紹介します。Gemini について学習し、これを使って画像の分析、プロンプトの設計、会話の生成を Google Cloud コンソールで直接行います。API や Python SDK は不要です。直感的なユーザー インターフェースですべての操作を実行できます。
目標
このラボでは、次の方法について学びます。
- Gemini を使用して画像を分析する
- Vertex AI Studio の自由形式モードを探索する
- ゼロショット プロンプト、ワンショット プロンプト、少数ショット プロンプト用のテキスト プロンプトを設計する
- チャット プロンプトを使用して会話を生成する
設定と要件
[ラボを開始] ボタンをクリックする前に
こちらの手順をお読みください。ラボの時間は記録されており、一時停止することはできません。[ラボを開始] をクリックするとスタートするタイマーは、Google Cloud のリソースを利用できる時間を示しています。
このハンズオンラボでは、シミュレーションやデモ環境ではなく、実際のクラウド環境を使ってご自身でラボのアクティビティを行うことができます。そのため、ラボの受講中に Google Cloud にログインおよびアクセスするための、新しい一時的な認証情報が提供されます。
このラボを完了するためには、下記が必要です。
- 標準的なインターネット ブラウザ(Chrome を推奨)
- ラボを完了するために十分な時間を確保してください。ラボをいったん開始すると一時停止することはできません。
ラボを開始して Google Cloud コンソールにログインする方法
-
[ラボを開始] ボタンをクリックします。ラボの料金をお支払いいただく必要がある場合は、表示されるポップアップでお支払い方法を選択してください。 左側の [ラボの詳細] パネルには、以下が表示されます。
- [Google Cloud コンソールを開く] ボタン
- 残り時間
- このラボで使用する必要がある一時的な認証情報
- このラボを行うために必要なその他の情報(ある場合)
-
[Google Cloud コンソールを開く] をクリックします(Chrome ブラウザを使用している場合は、右クリックして [シークレット ウィンドウでリンクを開く] を選択します)。
ラボでリソースが起動し、別のタブで [ログイン] ページが表示されます。
ヒント: タブをそれぞれ別のウィンドウで開き、並べて表示しておきましょう。
注: [アカウントの選択] ダイアログが表示されたら、[別のアカウントを使用] をクリックします。 -
必要に応じて、下のユーザー名をコピーして、[ログイン] ダイアログに貼り付けます。
{{{user_0.username | "Username"}}} [ラボの詳細] パネルでも [ユーザー名] を確認できます。
-
[次へ] をクリックします。
-
以下のパスワードをコピーして、[ようこそ] ダイアログに貼り付けます。
{{{user_0.password | "Password"}}} [ラボの詳細] パネルでも [パスワード] を確認できます。
-
[次へ] をクリックします。
重要: ラボで提供された認証情報を使用する必要があります。Google Cloud アカウントの認証情報は使用しないでください。 注: このラボでご自身の Google Cloud アカウントを使用すると、追加料金が発生する場合があります。 -
その後次のように進みます。
- 利用規約に同意してください。
- 一時的なアカウントなので、復元オプションや 2 要素認証プロセスは設定しないでください。
- 無料トライアルには登録しないでください。
その後、このタブで Google Cloud コンソールが開きます。
タスク 1. Gemini の自由形式モードで画像を分析する
このセクションでは、Gemini を使用して画像を分析し、そこから情報を抽出します。自由形式モードでは、分類、抽出、生成などのさまざまなタスク用のプロンプトを設計できます。自由形式モードでは会話の履歴が記録されません。すべてのプロンプトがモデルに対する新しいリクエストになります。
Vertex AI API を有効にする
-
Google Cloud コンソールで、上部の検索バーに「Vertex AI API」と入力します。
-
[マーケットプレイスと API] の下で検索結果の「Vertex AI API」をクリックします。
-
[有効にする] をクリックします。
Gemini を使用して画像を分析する
- Google Cloud コンソールのナビゲーション メニュー()で、[Vertex AI] > [Vertex AI Studio] > [概要] を選択します。
- [Gemini で生成する] で [自由形式を開く] をクリックします。
UI には次の 3 つのメイン セクションがあります。
- プロンプト(中央): マルチモーダル機能を利用するプロンプトを作成できます。
- 構成(右側): このセクションでは、モデルの選択、パラメータの構成、対応するコードの取得を行うことができます。
- レスポンス(下部): このセクションには、プロンプトの結果が表示されます。
-
左上の [無題のプロンプト] をクリックして、プロンプトの名前を「
Image Analysis
」に変更します。 -
右上の [構成] セクションで、[モデル] プルダウンをクリックして、[gemini-1.5-pro] モデルを選択します。
-
サンプル画像をダウンロードします。時刻表の画像を右クリックして、パソコンに保存します。
- [プロンプト] セクションの右上で、[メディアを挿入] > [アップロード] をクリックします。ダウンロードした時刻表の画像をアップロードします。使用可能なメディアの形式は、画像、動画、テキスト、または音声ファイルです。
- [プロンプト] セクション内に画像が表示されます。次のテキストをコピーし、画像の下に貼り付けて、プロンプト セクションの右下にある [送信] ボタンをクリックします。
または、次のように具体的に指定します。
タイトルは期待どおりでしたか?プロンプトを変更して、異なる結果が出力されるかどうかを確認してください。
- 画像の説明を生成します。前のプロンプトを以下の内容に置き換えて、[送信] ボタンをクリックします。
- パラメータをチューニングします。[構成] セクションで、[Temperature] を左(0)から右(2)にスクロールして調整します。プロンプトを再送信し、前と比較して結果に変化があるかどうかを確認します。
- 画像からテキストを抽出します。前のプロンプトを以下の内容に置き換えます。
さらに、出力をリスト形式にする場合は、前のプロンプトを以下の内容に置き換えます。
さまざまなプロンプトを試してみましょう。前のプロンプトと比べて結果はどのように異なりますか?
- 画像にある情報を分析します。前のプロンプトを以下の内容に置き換えます。
結果は期待どおりですか?各種タスクにさまざまなプロンプトを試してみることを強くおすすめします。また、温度の設定を変更して結果の変化を確認してみましょう。
-
プロンプトの設計が完了したら、構成セクションの右上の [Save] をクリックしてプロンプトを保存します。リージョンについては、プルダウンから [
] を選択して、[Save] をクリックして確定します。 -
保存したプロンプトを確認するには、左側のナビゲーション メニューで、[プロンプト管理] に移動します。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
タスク 2. マルチモーダル機能を試す
画像、テキスト、音声に加えて、Gemini は入力として動画を受け入れて、出力としてテキストを生成することができます。
-
[Cloud Storage] > [バケット] に移動し、Cloud Storage バケットの名前をコピーして保存して、次のステップで使用します。
-
Google Cloud コンソールの上部にある「Cloud Shell をアクティブにする」アイコン をクリックします。
-
Cloud Shell ターミナルで、以下のコマンドを実行して、サンプル動画
gs://spls/gsp154/video/train.mp4
(プレビュー)を Cloud Storage バケットにコピーします。<Your-Cloud-Storage-Bucket>
を、先ほどコピーしたバケット名に置き換えてください。
<Your-Cloud-Storage-Bucket>
を、ご使用のバケット名に置き換えてください。-
ナビゲーション メニュー()から、[Vertex AI] > [Vertex AI Studio] > [概要] を選択します。
-
[Gemini で生成する] で [自由形式を開く] をクリックします。
-
[メディアを挿入] > [Cloud Storage からインポート] の順にクリックします。
-
バケット名をクリックし、次にサンプル動画(
train.mp4
)をクリックして、[選択] をクリックします。 -
次のプロンプトを挿入して [送信] ボタンをクリックして、動画に関する情報を生成します。
自由形式モードには、画像からストーリーを作成する機能、動画を分析する機能、マルチメディア広告を生成する機能など、さまざまな機能があります。[プロンプト ギャラリー] をクリックすると、自由形式のその他のユースケースを確認できます。詳しくは、マルチモーダル プロンプトを設計するをご覧ください。
タスク 3. テキスト プロンプトを設計する
このセクションでは、Vertex AI Studio でのテキスト プロンプトの設計を探索します。ゼロショット プロンプト、ワンショット プロンプト、少数ショット プロンプトを確認します。
プロンプト設計
質問などの任意の入力テキストをモデルにフィードできます。これにより、モデルは、プロンプトの構造に基づいてレスポンスを提供できます。モデルから最も望ましいレスポンスを得るための最良の入力テキスト(プロンプト)を解明して設計するプロセスはプロンプト設計と呼ばれます。
プロンプト設計の方法
プロンプトの設計方法は主に 3 つあります。
- ゼロショット プロンプト - この方法では、タスクを説明するプロンプトのみを LLM に与え、追加データは与えません。たとえば、LLM に質問に回答させたい場合は、単に「プロンプト設計とは何ですか」のようにプロンプトに入力します。
- ワンショット プロンプト - この方法では、行ってほしい特定のタスクの 1 つの例を LLM に与えます。たとえば、LLM に詩を書かせたい場合は、詩の例を 1 つ与えます。
- 少数ショット プロンプト - この方法では、行ってほしい特定のタスクの少数の例を LLM に与えます。たとえば、LLM にニュース記事を書かせたい場合は、数件のニュース記事を入力として与えます。
パラメータ
温度とトークンの上限は、モデルのレスポンスに影響を与えるために調整できる 2 つの重要なパラメータです。
- [Temperature] は、トークン選択のランダム性の度合いを制御します。真のレスポンスまたは正しいレスポンスを想定する場合は、低い温度が適しています。温度 0 は、最も高い確率のトークンが常に選択されることを意味します。温度を高くすると、ばらつきの大きい結果や想定外の結果、偏りのある結果になる可能性があります。
gemini-1.5-pro
モデルの温度の範囲は 0~2 で、デフォルトは 1 です。 - 出力トークンの上限により、1 つのプロンプトに対して出力されるテキストの最大量が決まります。1 トークンは約 4 文字です。
ゼロショット プロンプト
自由形式モードで、ゼロショット プロンプトを試します。
-
[Vertex AI Studio] > [概要] ページに戻り、[自由形式を開く] をクリックします。
-
右上の [モデル] で、[gemini-1.5-pro] モデルを選択します。
- 次の内容をプロンプトの入力フィールドにコピーします。
- [送信] ボタンをクリックします。
モデルは用語「prompt gallery」の一般的な定義を回答します。
いくつかの操作を試して動作を確認してください。
- [
出力トークンの上限
] パラメータを1024
にして [送信] ボタンをクリックします。 - [
Temperature
] パラメータを0.5
にして [送信] ボタンをクリックします。 - [
Temperature
] パラメータを2.0
にして [送信] ボタンをクリックします。
パラメータを変更することでレスポンスがどのように変わるかを確認してください。
ワンショット プロンプト
より組織化された方法でプロンプトを設計できます。ここでは、[コンテキスト] と [例] の入力フィールドにそれぞれ対応する内容を入力できます。ワンショット プロンプトは、依頼する特定のタスクの例を 1 つだけモデルに与える方法です。このセクションでは、モデルに文を完成させるように求めます。
-
[プロンプト] ボックスからテキストをすべて削除します。
-
[プロンプト] ボックス内で、[例を追加] をクリックします。プロンプト用に例を追加できる新しいウィンドウが開きます。
- 次の内容を [入力] フィールドに追加します。
- 次の内容を [出力] フィールドに追加します。
-
[例を追加] ボタンをクリックします。
-
[テスト] フィールドの [入力] フィールドに次の内容をコピーします。
- [送信] ボタンをクリックします。モデルから次のようなレスポンスが返されます。
モデルに出力のベースとなる例を提供したため、モデルは文を補完するのではなく、全文をレスポンスとして返しました。このレスポンスを変更して、単に文を完成させるようにするには、[出力] フィールドに提供した例を調整します。
- [プロンプト] ボックスの [例] ボタンをクリックして、[出力] フィールドを次の内容に変更します。
-
[例を追加] ボタンをクリックします。
-
[テスト] フィールドの [入力] フィールドに次の内容をコピーします。
- [送信] ボタンをクリックします。モデルから次のようなレスポンスが返されます。
今回は、提供した例に基づいてモデルが文を完成させていることがわかります。モデルがレスポンスを生成する方法に影響を与えることに成功しました。
少数ショット プロンプト
次の演習ではモデルで少数ショット プロンプトを使用して、文の感情分析を行い、映画のレビューが好意的かどうかなどを判断させてみます。
- [プロンプト] フィールドで、前のセクションの例を削除します。例を削除するには、[例] にカーソルを合わせて、[X](ファイルを削除)ボタンをクリックします。
-
例を追加するには、[例を追加] ボタンをクリックします。
-
次の例を追加します。
入力 | 出力 |
---|---|
A well-made and entertaining film | positive |
I fell asleep after 10 minutes | negative |
The movie was ok | neutral |
- 例を追加したら、[例を追加] ボタンをクリックします。
- [テスト] フィールドの [入力] フィールドに次の内容をコピーします。
- [送信] ボタンをクリックします。
モデルによって入力した文の感情が示されるようになりました。「It was a time well spent!」という文について、感情は「positive」とラベル付けされています。
- プロンプトの設計が完了したら、構成セクションの右上の [Save] をクリックしてプロンプトを保存します。プロンプトに「
Sentiment Analysis
」という名前を付けます。リージョンについては、プルダウンから [] を選択して、[Save] をクリックして確定します。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
タスク 4. 会話を生成する
チャットモードは、モデルと自由形式で会話できる対話モードです。モデルは会話の履歴を以降のレスポンスのコンテキストとして使用します。このセクションでは、チャット プロンプトを作成し、モデルと会話します。
-
左側のメニューで [チャット] に移動し、新しいチャット プロンプトを作成します。
-
右上の [モデル] で、[gemini-1.5-flash] モデルを選択します。
このセクションでは、チャットにコンテキストを追加して、提供されたコンテキストに基づいてモデルが回答できるようにします。
- [編集] ボタンをクリックして、[システム指示] フィールドに以下のコンテキストを追加します。
-
[適用] をクリックします。
-
次のプロンプトを挿入します。
- [送信] ボタンをクリックします。
モデルのレスポンスは次の内容になるはずです。
-
次に、[編集] ボタンをクリックして、既存の [システム指示] フィールドのコンテキストを編集します。
-
コンテキストを次の内容に更新します。
- 次のプロンプトを挿入します。
- [送信] ボタンをクリックします。
これで、ユーザークエリに対してモデルがより役に立つレスポンスを返すようになったはずです。
さまざまなプロンプトとコンテキストを試して、モデルがどのように応答するかを確認してみてください。チャット プロンプトにコンテキストを追加して、提供したコンテキストに基づいてモデルがどのように応答するかを確認することもできます。
- プロンプトの設計が完了したら、構成セクションの右上の [Save] をクリックしてプロンプトを保存します。プロンプトに「
Support Technician Helper
」という名前を付けます。リージョンについては、プルダウンから [] を選択して、[Save] をクリックして確定します。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
お疲れさまでした
このラボでは、自由形式を使用して画像を分析する方法、自由形式機能を試す方法、プロンプトを作成してテストする方法、会話の生成方法を学習しました。これで、Vertex AI Studio と Gemini Freeform の使用についての初歩を学びました。
Google Cloud トレーニングと認定資格
Google Cloud トレーニングと認定資格を通して、Google Cloud 技術を最大限に活用できるようになります。必要な技術スキルとベスト プラクティスについて取り扱うクラスでは、学習を継続的に進めることができます。トレーニングは基礎レベルから上級レベルまであり、オンデマンド、ライブ、バーチャル参加など、多忙なスケジュールにも対応できるオプションが用意されています。認定資格を取得することで、Google Cloud テクノロジーに関するスキルと知識を証明できます。
マニュアルの最終更新日: 2024 年 10 月 8 日
ラボの最終テスト日: 2024 年 10 月 8 日
Copyright 2024 Google LLC All rights reserved. Google および Google のロゴは Google LLC の商標です。その他すべての企業名および商品名はそれぞれ各社の商標または登録商標です。