チェックポイント
Clone and run the lab notebook
/ 25
Get Started with Vector Search
/ 25
Create an Index
/ 25
Query the Index
/ 25
ベクトル検索とエンベディングを使ってみる
GSP1202
概要
ベクトル検索では、意味的に類似または関連する何十億ものアイテムから検索を行うことができます。ベクトル類似度マッチング サービスには、レコメンデーション エンジン、検索エンジン、chatbot、テキスト分類の実装など、多くのユースケースがあります。セマンティック マッチングは数ステップで行うことができます。まず、多くのアイテムに対してエンベディング表現を生成する必要があります(ベクトル検索の外部で行います)。次に、エンベディングを Google Cloud にアップロードし、データをベクトル検索にリンクします。エンベディングをベクトル検索に追加したら、インデックスを作成してクエリを実行し、レコメンデーションや結果を取得できます。
エンベディングの利用は、単語やテキストに限られません。画像、音声、動画、ユーザー設定など、さまざまな種類のデータに対して、セマンティック エンベディングを生成できます。Vertex AI を使用してマルチモーダル エンベディングを生成するには、マルチモーダル エンベディングを取得するをご覧ください。このラボでは、Vertex AI Embeddings for Text を使用してテキスト エンベディングを作成し、それを使用してベクトル検索インデックスを作成する方法を学習します。
目標
このラボでは、次のタスクを行います。
- Vertex AI ノートブック インスタンスを作成する
- ラボのノートブックのクローンを作成して実行する
- テキスト エンベディングを作成する
- ベクトル検索インデックスを作成してデプロイする
- インデックスをクエリする
設定と要件
[ラボを開始] ボタンをクリックする前に
こちらの手順をお読みください。ラボの時間は記録されており、一時停止することはできません。[ラボを開始] をクリックするとスタートするタイマーは、Google Cloud のリソースを利用できる時間を示しています。
このハンズオンラボでは、シミュレーションやデモ環境ではなく、実際のクラウド環境を使ってご自身でラボのアクティビティを行うことができます。そのため、ラボの受講中に Google Cloud にログインおよびアクセスするための、新しい一時的な認証情報が提供されます。
このラボを完了するためには、下記が必要です。
- 標準的なインターネット ブラウザ(Chrome を推奨)
- ラボを完了するために十分な時間を確保してください。ラボをいったん開始すると一時停止することはできません。
ラボを開始して Google Cloud コンソールにログインする方法
-
[ラボを開始] ボタンをクリックします。ラボの料金をお支払いいただく必要がある場合は、表示されるポップアップでお支払い方法を選択してください。 左側の [ラボの詳細] パネルには、以下が表示されます。
- [Google Cloud コンソールを開く] ボタン
- 残り時間
- このラボで使用する必要がある一時的な認証情報
- このラボを行うために必要なその他の情報(ある場合)
-
[Google Cloud コンソールを開く] をクリックします(Chrome ブラウザを使用している場合は、右クリックして [シークレット ウィンドウでリンクを開く] を選択します)。
ラボでリソースが起動し、別のタブで [ログイン] ページが表示されます。
ヒント: タブをそれぞれ別のウィンドウで開き、並べて表示しておきましょう。
注: [アカウントの選択] ダイアログが表示されたら、[別のアカウントを使用] をクリックします。 -
必要に応じて、下のユーザー名をコピーして、[ログイン] ダイアログに貼り付けます。
{{{user_0.username | "Username"}}} [ラボの詳細] パネルでも [ユーザー名] を確認できます。
-
[次へ] をクリックします。
-
以下のパスワードをコピーして、[ようこそ] ダイアログに貼り付けます。
{{{user_0.password | "Password"}}} [ラボの詳細] パネルでも [パスワード] を確認できます。
-
[次へ] をクリックします。
重要: ラボで提供された認証情報を使用する必要があります。Google Cloud アカウントの認証情報は使用しないでください。 注: このラボでご自身の Google Cloud アカウントを使用すると、追加料金が発生する場合があります。 -
その後次のように進みます。
- 利用規約に同意してください。
- 一時的なアカウントなので、復元オプションや 2 要素認証プロセスは設定しないでください。
- 無料トライアルには登録しないでください。
その後、このタブで Google Cloud コンソールが開きます。
タスク 1. Vertex AI Workbench インスタンスを作成する
-
Google Cloud コンソールのナビゲーション メニューで、[Vertex AI] > [ワークベンチ] をクリックします。
-
[+ 新規作成] をクリックします。
-
[インスタンスの作成] ダイアログで、デフォルト名を使用するか、Vertex AI Workbench インスタンス用の一意の名前を入力します。リージョンを
に、ゾーンを に設定し、残りの設定はデフォルトのままにします。 -
[作成] をクリックします。
-
[JUPYTERLAB を開く] をクリックします。
ラボのノートブックのクローンを作成して実行する
-
ノートブックで [Terminal] をクリックします。
-
次のコマンドを実行して、Google Cloud 生成 AI リポジトリのクローンを作成します。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
-
左側のナビゲーション パネルで、
generative-ai/embeddings
フォルダに移動し、intro-textemb-vectorsearch.ipynb
ノートブックを開きます。 -
[Select Kernel] プロンプトでは、デフォルトの [Python3] のままにして [Select] をクリックします。
-
[Text Embeddings in Action] セクションまで下にスクロールし、セットアップ セルを実行します。
-
環境変数を設定するときは、ロケーションに
を使用し、プロジェクト ID に を使用します。
- サービス アカウントにはすでに必要な権限があるため、[Set IAM permissions] セクションをスキップします。
タスク 2. エンベディングを生成する
-
[Getting Started with Vertex AI Embeddings for Text] セクションに移動し、セルを実行してテキスト エンベディングを作成します。
-
[Getting Started with Vector Search] セクションに移動して、セルを実行します。
-
エンべディングを JSON ファイルに保存します。
-
新しい Cloud Storage バケットを作成し、そこにファイルをコピーします。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
タスク 3. インデックスを作成してデプロイする
- [Create an Index] セクションに移動し、セルを実行してインデックスを作成し、デプロイします。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
ベクトル検索を探索し、デモを試す
このタスクでは、ベクトル検索ノートブックを探索し、一般公開デモを試します。インデックスの作成とデプロイには約 30 分かかるため、待っている間に一般公開デモを試し、ノートブックを探索することができます。
待っている間に: Stack Overflow のセマンティック検索デモを試す
- ベクトル検索の一般公開デモは、公開ライブデモとして公開されています。「STACKOVERFLOW」を選択し、コーディングに関する質問をクエリとして入力すると、Stack Overflow に投稿された 800 万件の質問に対してテキスト検索が実行されます。「SQL で行をシャッフルするにはどうすればいいですか?」などのクエリや、プログラミングに関する任意の質問でテキスト セマンティック検索を試すことができます。
待っている間に: ベクトル検索ノートブックを探索する
- ノートブックの上部にある [Bringing Gen AI and LLMs to production services] セクションに移動すると、ベクトル検索に関連するユースケースと説明をご覧いただけます。
タスク 4. クエリを実行する
- [Run Query] セクションに移動し、セルを実行してインデックスをクエリします。
test_embeddings
変数の文字列を変更すると、さまざまな結果を確認できます。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
お疲れさまでした
これで完了です。このラボでは、テキスト エンベディングを作成し、それを使用してベクトル検索インデックスを作成する方法を学習しました。これで、皆さん独自のアプリケーションでテキスト エンベディングを使用する準備が整いました。
次のステップと詳細情報
テキスト エンベディングとベクトル検索について詳しくは、次のリソースをご覧ください。
Google Cloud トレーニングと認定資格
Google Cloud トレーニングと認定資格を通して、Google Cloud 技術を最大限に活用できるようになります。必要な技術スキルとベスト プラクティスについて取り扱うクラスでは、学習を継続的に進めることができます。トレーニングは基礎レベルから上級レベルまであり、オンデマンド、ライブ、バーチャル参加など、多忙なスケジュールにも対応できるオプションが用意されています。認定資格を取得することで、Google Cloud テクノロジーに関するスキルと知識を証明できます。
マニュアルの最終更新日: 2024 年 4 月 4 日
ラボの最終テスト日: 2024 年 4 月 4 日
Copyright 2024 Google LLC All rights reserved. Google および Google のロゴは Google LLC の商標です。その他すべての企業名および商品名はそれぞれ各社の商標または登録商標です。