检查点
Clone and run the lab notebook
/ 25
Get Started with Vector Search
/ 25
Create an Index
/ 25
Query the Index
/ 25
開始使用 Vector Search 和嵌入
GSP1202
總覽
Vector Search 能在數十億個語意相似或語意相關的項目中進行搜尋。向量相似度比對服務有許多用途,例如導入推薦引擎、搜尋引擎、聊天機器人、以及文字分類。語意比對能簡化成幾個步驟:首先,您必須生成多個項目的嵌入表示,這項作業是在 Vector Search 之外進行。其次,將嵌入上傳到 Google Cloud 並將資料連到 Vector Search。將嵌入新增到 Vector Search 後,就能建立索引來執行查詢,取得推薦或結果。
嵌入的使用不限於字詞或文字。您可以為多種資料生成語意嵌入,包含圖片、音訊、影片和使用者偏好設定。如要使用 Vertex AI 生成多模態嵌入,請參考「Get multimodal embeddings」(取得多模態嵌入)。在本研究室中,您將瞭解如何透過 Vertex AI Embeddings for Text 建立文字嵌入,並用來建立 Vector Search 索引。
目標
在本研究室中,您會執行下列工作:
- 建立 Vertex AI 筆記本執行個體
- 複製並執行研究室筆記本
- 建立文字嵌入
- 建立及部署 Vector Search 索引
- 查詢索引
設定和需求
點選「Start Lab」按鈕前的須知事項
請詳閱以下操作說明。研究室活動會計時,而且中途無法暫停。點選「Start Lab」 後就會開始計時,讓您瞭解有多少時間可以使用 Google Cloud 資源。
您將在真正的雲端環境中完成實作研究室活動,而不是在模擬或示範環境。為達此目的,我們會提供新的暫時憑證,讓您用來在研究室活動期間登入及存取 Google Cloud。
如要完成這個研究室活動,請先確認:
- 您可以使用標準的網際網路瀏覽器 (Chrome 瀏覽器為佳)。
- 是時候完成研究室活動了!別忘了,活動一開始將無法暫停。
如何開始研究室及登入 Google Cloud 控制台
-
按一下「Start Lab」(開始研究室) 按鈕。如果研究室會產生費用,畫面中會出現選擇付款方式的彈出式視窗。左側的「Lab Details」窗格會顯示下列項目:
- 「Open Google Cloud console」按鈕
- 剩餘時間
- 必須在這個研究室中使用的暫時憑證
- 完成這個實驗室所需的其他資訊 (如有)
-
點選「Open Google Cloud console」;如果使用 Chrome 瀏覽器,也能按一下滑鼠右鍵,然後選取「在無痕式視窗中開啟連結」。
接著,實驗室會啟動相關資源並開啟另一個分頁,當中顯示「登入」頁面。
提示:您可以在不同的視窗中並排開啟分頁。
注意:如果頁面中顯示「選擇帳戶」對話方塊,請點選「使用其他帳戶」。 -
如有必要,請將下方的 Username 貼到「登入」對話方塊。
{{{user_0.username | "Username"}}} 您也可以在「Lab Details」窗格找到 Username。
-
點選「下一步」。
-
複製下方的 Password,並貼到「歡迎使用」對話方塊。
{{{user_0.password | "Password"}}} 您也可以在「Lab Details」窗格找到 Password。
-
點選「下一步」。
重要事項:請務必使用實驗室提供的憑證,而非自己的 Google Cloud 帳戶憑證。 注意:如果使用自己的 Google Cloud 帳戶來進行這個實驗室,可能會產生額外費用。 -
按過後續的所有頁面:
- 接受條款及細則。
- 由於這是臨時帳戶,請勿新增救援選項或雙重驗證機制。
- 請勿申請免費試用。
Google Cloud 控制台稍後會在這個分頁開啟。
工作 1:建立 Vertex AI Workbench 執行個體
-
前往 Google Cloud 控制台,依序點按「導覽選單」>「Vertex AI」>「Workbench」。
-
點按「建立新的」。
-
在建立執行個體對話方塊中,請為 Vertex AI Workbench 執行個體使用預設名稱或輸入專屬名稱。將區域設定為
,可用區設定為 ,其餘設定保留預設值。 -
點按「建立」。
-
點按「Open JupyterLab」。
複製並執行研究室筆記本
-
在筆記本中,點選「Terminal」。
-
執行下列指令,複製 Google Cloud 生成式 AI 存放區:
點選「Check my progress」,確認目標已達成。
-
在左側導覽窗格中,前往
generative-ai/embeddings
資料夾並開啟intro-textemb-vectorsearch.ipynb
筆記本。 -
在提示「Select Kernel」中保留預設內容 Python3 並點選「Select」。
-
向下捲動至「Text Embeddings in Action」(實際建立文字嵌入) 部分,執行設定儲存格。
-
設定環境變數時,位置使用
,專案 ID 使用 。
- 略過「Set IAM permissions」(設定 IAM 權限) 部分,因為服務帳戶已具備必要權限。
工作 2:生成嵌入
-
前往「Getting Started with Vertex AI Embeddings for Text」(開始使用 Vertex AI Embeddings for Text) 部分,執行各個儲存格來建立文字嵌入。
-
前往「Getting Started with Vector Search」(開始使用 Vector Search) 部分,執行各個儲存格。
-
將嵌入儲存為 JSON 檔案。
-
建立新的 Cloud Storage 值區,將檔案複製到值區。
點選「Check my progress」,確認目標已達成。
工作 3:建立及部署索引
- 前往「Create an Index」(建立索引) 部分,執行各個儲存格來建立並部署索引。
點選「Check my progress」,確認目標已達成。
探索 Vector Search,體驗試用版
在這項工作中,您將探索 Vector Search 筆記本並體驗公開試用版。建立及部署索引大約需要 30 分鐘,在等待期間,您可以體驗公開試用版並探索筆記本。
在等待期間:體驗 Stack Overflow 語意搜尋試用版
- Vector Search 公開試用版可直接在線上存取。選擇「STACKOVERFLOW (TEXT)」,輸入任何程式設計問題查詢,就能對 800萬個張貼於 Stack Overflow 的問題進行文字搜尋。試試文字語意搜尋,例如查詢「How to shuffle rows in SQL?」(如何在 SQL 中重組資料列?) 或任何程式設計問題。
在等待期間:探索 Vector Search 筆記本
- 在筆記本中,前往頂端的「Bringing Gen AI and LLMs to production services」(將生成式 AI 和 LLM 用於正式服務) 部分,閱讀 Vector Search 用途與說明。
工作 4:執行查詢
- 前往「Run Query」(執行查詢) 部分,執行各個儲存格來查詢索引。您可以嘗試改變
test_embeddings
變數中的字串,查看不同的搜尋結果。
點選「Check my progress」,確認目標已達成。
恭喜!
恭喜!您在本研究室中學會如何建立文字嵌入,並用來建立 Vector Search 索引。您現在可以在自己的應用程式中使用文字嵌入了!
後續步驟/瞭解詳情
歡迎參考下列資源,進一步瞭解文字嵌入及 Vector Search:
- Vertex AI Embeddings for Text: Grounding LLMs made easy (Vertex AI Embeddings for Text:輕鬆為 LLM 建立基準)
- Overview of Vertex AI Vector Search (Vertex AI Vector Search 總覽)
- Vector Search notebook tutorials (Vector Search 筆記本教學課程)
Google Cloud 教育訓練與認證
協助您瞭解如何充分運用 Google Cloud 的技術。我們的課程會介紹專業技能和最佳做法,讓您可以快速掌握要領並持續進修。我們提供從基本到進階等級的訓練課程,並有隨選、線上和虛擬課程等選項,方便您抽空參加。認證可協助您驗證及證明自己在 Google Cloud 技術方面的技能和專業知識。
使用手冊上次更新日期:2024 年 4 月 4 日
研究室上次測試日期:2024 年 4 月 4 日
Copyright 2024 Google LLC 保留所有權利。Google 和 Google 標誌是 Google LLC 的商標,其他公司和產品名稱則有可能是其關聯公司的商標。