
Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
- On the top left of your screen, click Start lab to begin
Install Gen AI SDK for Python and import libraries
/ 25
Use Gemini model to describe a room
/ 25
Use Gemini model to recommend a piece of furniture
/ 25
Use Gemini model to recommend an item from a selection
/ 25
Gemini は、Google DeepMind が開発した生成 AI モデルのファミリーであり、マルチモーダル ユースケース用に設計されています。
小売企業でレコメンデーション システムを活用すると、カスタマー エクスペリエンスの向上、ひいては売上の増加につなげられます。このラボでは、Gemini モデルを使用して、マルチモーダルのレコメンデーション システムを迅速に作成する方法を学びます。Gemini モデルは、マルチモーダル モデルを使用して、レコメンデーションと説明の両方を提供できます。
このラボでは、リビングルームなどのシーンを起点に、Gemini モデルを使用して視覚的な理解を実行します。また、Gemini モデルを使用して、入力として提供した家具リストの中から椅子などの商品を 1 点選んでおすすめする方法についても見ていきます。
Gemini は、Google DeepMind が開発した強力な生成 AI モデルのファミリーであり、テキスト、コード、画像、音声、動画などのさまざまな形式のコンテンツを理解し、生成することができます。
Vertex AI の Gemini API は、Gemini モデルを操作するための統合インターフェースを提供します。これにより、開発者は強力な AI 機能をアプリケーションに簡単に組み込むことができます。最新バージョンの詳細情報と具体的な機能については、Gemini の公式ドキュメントをご覧ください。
このラボを開始する前に、以下について理解しておく必要があります。
このラボでは、次の方法について学びます。
gemini-2.0-flash
)を使用して、視覚的な理解を実行するこちらの説明をお読みください。ラボには時間制限があり、一時停止することはできません。タイマーは、Google Cloud のリソースを利用できる時間を示しており、[ラボを開始] をクリックするとスタートします。
このハンズオンラボでは、シミュレーションやデモ環境ではなく実際のクラウド環境を使って、ラボのアクティビティを行います。そのため、ラボの受講中に Google Cloud にログインおよびアクセスするための、新しい一時的な認証情報が提供されます。
このラボを完了するためには、下記が必要です。
[ラボを開始] ボタンをクリックします。ラボの料金をお支払いいただく必要がある場合は、表示されるダイアログでお支払い方法を選択してください。 左側の [ラボの詳細] ペインには、以下が表示されます。
[Google Cloud コンソールを開く] をクリックします(Chrome ブラウザを使用している場合は、右クリックして [シークレット ウィンドウで開く] を選択します)。
ラボでリソースがスピンアップし、別のタブで [ログイン] ページが表示されます。
ヒント: タブをそれぞれ別のウィンドウで開き、並べて表示しておきましょう。
必要に応じて、下のユーザー名をコピーして、[ログイン] ダイアログに貼り付けます。
[ラボの詳細] ペインでもユーザー名を確認できます。
[次へ] をクリックします。
以下のパスワードをコピーして、[ようこそ] ダイアログに貼り付けます。
[ラボの詳細] ペインでもパスワードを確認できます。
[次へ] をクリックします。
その後次のように進みます。
その後、このタブで Google Cloud コンソールが開きます。
Google Cloud コンソールのナビゲーション メニュー()で、[Vertex AI] > [ワークベンチ] の順にクリックします。
Workbench インスタンスの JupyterLab インターフェースが新しいブラウザタブで開きます。
[Select Kernel] ダイアログで、使用可能なカーネルのリストから [Python 3] を選択します。
ノートブックの「Getting Started」(スタートガイド)セクションと「Import libraries」(ライブラリのインポート)セクションをすべて実行します。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
以降のセクションでは、ノートブック セルの実行を通して、Gemini モデルのマルチモーダル機能を使用する方法を見ていきます。
Gemini モデル(gemini-2.0-flash
)は、テキスト レスポンスを取得するための、テキスト プロンプトまたはチャット プロンプトへの画像や動画の追加に対応したマルチモーダル モデルです。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
同じ画像を使用して、部屋の説明とともに部屋に合った家具を 1 点おすすめするようにモデルに指示します。なお、このケースでは、モデルは組み込みの知識のみを基にあらゆる家具を選択しておすすめできます。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
レコメンデーションに制約を設けないようにする代わりに、モデルに商品のリストを提供して、その中から選択させることもできます。このセクションでは、椅子の画像を数点ダウンロードして、その画像を Gemini モデルがおすすめする際の選択肢として設定します。これは、シーンとして使用する部屋の種類や、店舗で販売している商品を基にユーザーにおすすめすることを検討している小売企業にとって特に有用です。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
お疲れさまでした。このラボでは、Gemini を使用して家具向けのマルチモーダルのレコメンデーション システムを構築する方法を取り上げました。Gemini モデルを使用して視覚的な理解を実行する方法と、マルチモダリティを考慮して Gemini モデルのプロンプトを作成する方法も学習しました。今回は、Gemini を使用して家具をおすすめするマルチモーダルのレコメンデーション システムを簡単に構築できることをご説明しましたが、以下の用途でも同じアプローチを利用できます。
以下のリソースで Gemini に関する理解を深めましょう。
Google Cloud トレーニングと認定資格を通して、Google Cloud 技術を最大限に活用できるようになります。必要な技術スキルとベスト プラクティスについて取り扱うクラスでは、学習を継続的に進めることができます。トレーニングは基礎レベルから上級レベルまであり、オンデマンド、ライブ、バーチャル参加など、多忙なスケジュールにも対応できるオプションが用意されています。認定資格を取得することで、Google Cloud テクノロジーに関するスキルと知識を証明できます。
マニュアルの最終更新日: 2025 年 4 月 17 日
ラボの最終テスト日: 2025 年 4 月 17 日
Copyright 2025 Google LLC. All rights reserved. Google および Google のロゴは Google LLC の商標です。その他すべての企業名および商品名はそれぞれ各社の商標または登録商標です。
このコンテンツは現在ご利用いただけません
利用可能になりましたら、メールでお知らせいたします
ありがとうございます。
利用可能になりましたら、メールでご連絡いたします
One lab at a time
Confirm to end all existing labs and start this one