知識をテストして、コミュニティで共有しましょう

done

700 を超えるハンズオンラボ、スキルバッジ、コースへのアクセス

Vertex AI Gemini API と cURL のスタートガイド

ラボ 45分 universal_currency_alt クレジット: 5 show_chart 中級

info このラボでは、学習をサポートする AI ツールが組み込まれている場合があります。

GSP1228
概要
目標
設定と要件
タスク 1. Vertex AI Workbench でノートブックを開く
タスク 2. generative-ai フォルダを開く
タスク 3. Gemini Pro モデルを使用する
タスク 4. Gemini Pro Vision モデルを使用する
お疲れさまでした

知識をテストして、コミュニティで共有しましょう

done

700 を超えるハンズオンラボ、スキルバッジ、コースへのアクセス

GSP1228

Google Cloud セルフペースラボ

概要

Gemini は、Google の DeepMind が開発した、生成 AI モデルのファミリーであり、マルチモーダルユースケース用に設計されています。Gemini API を使用すると、Gemini Pro Vision モデルと Gemini Pro モデルにアクセスできます。このラボでは、Vertex AI Gemini API と cURL コマンドを使用して、Gemini Pro（gemini-pro）モデルと Gemini Pro Vision（gemini-pro-vision）モデルを操作する方法を学びます。

Vertex AI Gemini API

Vertex AI Gemini API は、Gemini モデルを操作するための統合インターフェースを提供します。現在、Gemini API では次の 2 つのモデルが利用可能です。

Gemini Pro モデル（gemini-pro）: 自然言語タスク、マルチターンテキストとコードチャット、コード生成を処理するように設計されています。
Gemini Pro Vision モデル（gemini-pro-vision）: マルチモーダルプロンプトをサポートします。プロンプトリクエストにテキスト、画像、動画を含めて、テキストまたはコードのレスポンスを取得できます。

Gemini API を操作するには、次の方法を使用します。

Vertex AI Studio を使用して迅速なテストとコマンド生成を行う
cURL コマンドを使用する
Vertex AI SDK を使用する

このラボでは、cURL コマンドを使用して Vertex AI Gemini API を呼び出す方法に焦点を合わせます。

詳細については、Vertex AI での生成 AI に関するドキュメントをご覧ください。

目標

このラボでは、次のタスクの実行方法について学びます。

Python SDK をインストールする。
Vertex AI Gemini API を使用して各モデルを操作する。
Gemini Pro（gemini-pro）モデルを使用して、テキストプロンプトからテキストを生成する。
Gemini Pro Vision（gemini-pro-vision）モデルを使用して、画像や動画のプロンプトからテキストを生成する。

設定と要件

[ラボを開始] ボタンをクリックする前に

こちらの手順をお読みください。ラボの時間は記録されており、一時停止することはできません。[ラボを開始] をクリックするとスタートするタイマーは、Google Cloud のリソースを利用できる時間を示しています。

このハンズオンラボでは、シミュレーションやデモ環境ではなく、実際のクラウド環境を使ってご自身でラボのアクティビティを行うことができます。そのため、ラボの受講中に Google Cloud にログインおよびアクセスするための、新しい一時的な認証情報が提供されます。

このラボを完了するためには、下記が必要です。

標準的なインターネットブラウザ（Chrome を推奨）

注: このラボの実行には、シークレットモードまたはシークレットブラウジングウィンドウを使用してください。これにより、個人アカウントと受講者アカウント間の競合を防ぎ、個人アカウントに追加料金が発生することを防ぎます。

ラボを完了するために十分な時間を確保してください。ラボをいったん開始すると一時停止することはできません。

注: すでに個人の Google Cloud アカウントやプロジェクトをお持ちの場合でも、このラボでは使用しないでください。アカウントへの追加料金が発生する可能性があります。

ラボを開始して Google Cloud コンソールにログインする方法

[ラボを開始] ボタンをクリックします。ラボの料金をお支払いいただく必要がある場合は、表示されるポップアップでお支払い方法を選択してください。左側の [ラボの詳細] パネルには、以下が表示されます。
- [Google Cloud コンソールを開く] ボタン
- 残り時間
- このラボで使用する必要がある一時的な認証情報
- このラボを行うために必要なその他の情報（ある場合）
[Google Cloud コンソールを開く] をクリックします（Chrome ブラウザを使用している場合は、右クリックして [シークレットウィンドウでリンクを開く] を選択します）。

ラボでリソースが起動し、別のタブで [ログイン] ページが表示されます。

ヒント: タブをそれぞれ別のウィンドウで開き、並べて表示しておきましょう。
注: [アカウントの選択] ダイアログが表示されたら、[別のアカウントを使用] をクリックします。
必要に応じて、下のユーザー名をコピーして、[ログイン] ダイアログに貼り付けます。
{{{user_0.username | "Username"}}}
[ラボの詳細] パネルでも [ユーザー名] を確認できます。
[次へ] をクリックします。
以下のパスワードをコピーして、[ようこそ] ダイアログに貼り付けます。
{{{user_0.password | "Password"}}}
[ラボの詳細] パネルでも [パスワード] を確認できます。
[次へ] をクリックします。
重要: ラボで提供された認証情報を使用する必要があります。Google Cloud アカウントの認証情報は使用しないでください。注: このラボでご自身の Google Cloud アカウントを使用すると、追加料金が発生する場合があります。
その後次のように進みます。
- 利用規約に同意してください。
- 一時的なアカウントなので、復元オプションや 2 要素認証プロセスは設定しないでください。
- 無料トライアルには登録しないでください。

その後、このタブで Google Cloud コンソールが開きます。

注: Google Cloud のプロダクトやサービスのリストを含むメニューを表示するには、左上のナビゲーションメニューをクリックします。ナビゲーションメニューアイコン

タスク 1. Vertex AI Workbench でノートブックを開く

Google Cloud コンソールのナビゲーションメニューで、[Vertex AI] > [ワークベンチ] をクリックします。
[ユーザー管理のノートブック] ページで、generative-ai-jupyterlab ノートブックを見つけて、[JupyterLab を開く] ボタンをクリックします。

新しいブラウザタブで JupyterLab インターフェースが開きます。

タスク 2. generative-ai フォルダを開く

ノートブックの左側にある generative-ai フォルダに移動します。
/gemini/getting-started フォルダに移動します。
intro_gemini_curl.ipynb ファイルをクリックします。
ノートブックの「Getting Started」（スタートガイド）セクションと「Import libraries」（ライブラリのインポート）セクションをすべて実行します。
- [Project ID]（プロジェクト ID）にはを、[Location]（場所）にはを使用します。

注: 「Colab only」（Colab のみ）と記載されているノートブックセルは省略できます。

以降のセクションでは、ノートブックセルの実行を通して、Vertex AI Gemini API と cURL コマンドを使用して、Gemini Pro（gemini-pro）モデルと Gemini Pro Vision（gemini-pro-vision）モデルを操作する方法を見ていきます。

タスク 3. Gemini Pro モデルを使用する

Gemini Pro（gemini-pro）モデルは、分類、要約、抽出、作成などの自然言語タスクに合わせて調整されています。このタスクでは、Gemini Pro モデルを使用して、テキストプロンプトからテキストを生成する方法を学習します。

このタスクでは、ノートブックセルの実行を通して、Gemini Pro モデルを使用してテキストプロンプトからテキストを生成する方法を見ていきます。

テキストプロンプトからテキストを生成する

チャットプロンプトからマルチターンの会話を生成する

ノートブックの関数呼び出しセルを実行する

タスク 4. Gemini Pro Vision モデルを使用する

Gemini Pro Vision（gemini-pro-vision）は、テキストレスポンスを取得するための、テキストプロンプトまたはチャットプロンプトへの画像や動画の追加に対応したマルチモーダルモデルです。

注: テキストのみのプロンプトは、Gemini Pro Vision モデルでサポートされていません。代わりに、テキストのみのプロンプトには Gemini Pro モデルを使用します。

このタスクでは、ノートブックセルの実行を通して、Gemini Pro Vision モデルを使ってローカルファイルの画像、Google Cloud Storage の画像、動画ファイルからテキストを生成する方法を見ていきます。

画像ファイルからテキストを生成する

動画ファイルからテキストを生成する

お疲れさまでした

これで完了です。このラボでは、Vertex AI Gemini API と cURL コマンドを使用して Gemini Pro（gemini-pro）モデルと Gemini Pro Vision（gemini-pro-vision）モデルを操作し、テキストの生成、モデルパラメータの追加、チャット、ローカル画像からのテキストの生成、Google Cloud Storage の画像からのテキストの生成、動画ファイルからのテキストの生成を行う方法を学習しました。

次のステップと詳細情報

Vertex AI のドキュメントで生成 AI について確認する。
Google Cloud Tech YouTube チャンネルで、生成 AI の詳細を確認する。
Google Cloud 生成 AI の公式リポジトリ
Gemini のノートブックの例

Google Cloud トレーニングと認定資格

Google Cloud トレーニングと認定資格を通して、Google Cloud 技術を最大限に活用できるようになります。必要な技術スキルとベストプラクティスについて取り扱うクラスでは、学習を継続的に進めることができます。トレーニングは基礎レベルから上級レベルまであり、オンデマンド、ライブ、バーチャル参加など、多忙なスケジュールにも対応できるオプションが用意されています。認定資格を取得することで、Google Cloud テクノロジーに関するスキルと知識を証明できます。

マニュアルの最終更新日: 2024 年 3 月 8 日

ラボの最終テスト日: 2024 年 3 月 8 日