检查点
Clone and run the lab notebook
/ 25
Get Started with Vector Search
/ 25
Create an Index
/ 25
Query the Index
/ 25
开始使用 Vector Search 和嵌入
GSP1202
概览
Vector Search 可以从数十亿个语义相似项或语义相关项中进行搜索。矢量相似度匹配服务可应用于很多种场景,例如实现推荐引擎、搜索引擎、聊天机器人和文本分类。语义匹配可以简化为几个步骤。第一步,您必须为许多项内容生成嵌入表示形式(在 Vector Search 之外完成)。第二步,将嵌入上传到 Google Cloud,然后将数据关联到 Vector Search。将嵌入添加到 Vector Search 后,即可创建索引来运行查询,以获取建议或结果。
嵌入的适用情形不限于字词或文本。您可以为多种类型的数据(包括图片、音频、视频和用户偏好设置)生成语义嵌入。如需使用 Vertex AI 生成多模态嵌入,请参阅获取多模态嵌入。在本实验中,您将学习如何使用 Vertex AI Embeddings for Text 创建文本嵌入,并使用它们创建 Vector Search 索引。
目标
在本实验中,您将执行以下任务:
- 创建 Vertex AI 笔记本实例
- 克隆并运行实验笔记本
- 创建文本嵌入
- 创建并部署 Vector Search 索引
- 查询索引
设置和要求
点击“开始实验”按钮前的注意事项
请阅读以下说明。实验是计时的,并且您无法暂停实验。计时器在您点击开始实验后即开始计时,显示 Google Cloud 资源可供您使用多长时间。
此实操实验可让您在真实的云环境中开展实验活动,免受模拟或演示环境的局限。我们会为您提供新的临时凭据,让您可以在实验规定的时间内用来登录和访问 Google Cloud。
为完成此实验,您需要:
- 能够使用标准的互联网浏览器(建议使用 Chrome 浏览器)。
- 完成实验的时间 - 请注意,实验开始后无法暂停。
如何开始实验并登录 Google Cloud 控制台
-
点击开始实验按钮。如果该实验需要付费,系统会打开一个弹出式窗口供您选择付款方式。左侧是实验详细信息面板,其中包含以下各项:
- 打开 Google Cloud 控制台按钮
- 剩余时间
- 进行该实验时必须使用的临时凭据
- 帮助您逐步完成本实验所需的其他信息(如果需要)
-
点击打开 Google Cloud 控制台(如果您使用的是 Chrome 浏览器,请右键点击并选择在无痕式窗口中打开链接)。
该实验会启动资源并打开另一个标签页,显示登录页面。
提示:请将这些标签页安排在不同的窗口中,并将它们并排显示。
注意:如果您看见选择账号对话框,请点击使用其他账号。 -
如有必要,请复制下方的用户名,然后将其粘贴到登录对话框中。
{{{user_0.username | "<用户名>"}}} 您也可以在实验详细信息面板中找到用户名。
-
点击下一步。
-
复制下面的密码,然后将其粘贴到欢迎对话框中。
{{{user_0.password | "<密码>"}}} 您也可以在实验详细信息面板中找到密码。
-
点击下一步。
重要提示:您必须使用实验提供的凭据。请勿使用您的 Google Cloud 账号凭据。 注意:在本次实验中使用您自己的 Google Cloud 账号可能会产生额外费用。 -
继续在后续页面中点击以完成相应操作:
- 接受条款及条件。
- 由于该账号为临时账号,请勿添加账号恢复选项或双重验证。
- 请勿注册免费试用。
片刻之后,系统会在此标签页中打开 Google Cloud 控制台。
任务 1. 创建 Vertex AI Workbench 实例
-
在 Google Cloud 控制台的导航菜单中依次点击 Vertex AI > Workbench。
-
点击 + 新建。
-
在创建实例对话框中,为 Vertex AI Workbench 实例使用默认名称或输入一个唯一名称。将区域设为
,将可用区设为 ,剩余的保留默认设置。 -
点击创建。
-
点击打开 JupyterLab。
克隆并运行实验笔记本
-
在笔记本中,点击终端。
-
运行以下命令,克隆 Google Cloud 生成式 AI 仓库:
点击检查我的进度,验证是否完成以下目标:
-
在左侧导航窗格中,前往
generative-ai/embeddings
文件夹,然后打开intro-textemb-vectorsearch.ipynb
笔记本。 -
在 Select Kernel(选择内核)提示中,保留默认的 Python3,然后点击选择。
-
向下滚动到 Text Embeddings in Action(实际运用中的文本嵌入)部分,然后运行设置单元。
-
设置环境变量时,使用
表示位置,使用 表示项目 ID。
- 跳过 Set IAM permissions(设置 IAM 权限)部分,因为您的服务账号已具有所需的权限。
任务 2. 生成嵌入
-
前往 Getting Started with Vertex AI Embeddings for Text(开始使用 Vertex AI Embeddings for Text)部分,逐一运行各个单元,以创建文本嵌入。
-
前往 Getting Started with Vector Search(开始使用 Vector Search)部分,逐一运行各个单元。
-
以 JSON 文件形式保存嵌入。
-
创建一个新的 Cloud Storage 存储桶,并将文件复制到其中。
点击检查我的进度,验证是否完成以下目标:
任务 3. 创建并部署索引
- 前往 Create an Index(创建索引)部分,逐一运行各个单元,以创建和部署索引。
点击检查我的进度,验证是否完成以下目标:
探索 Vector Search 并试用演示版
在此任务中,您将探索 Vector Search 笔记本并试用公开演示版。由于创建和部署索引大约需要 30 分钟,您可以在等待期间试用公开演示版并探索笔记本。
等待期间:试用 Stack Overflow 语义搜索演示版
- Vector Search 公开演示版已作为公开实时演示版发布。选择“STACKOVERFLOW”并输入任何编码问题作为查询,系统随后就会在 Stack Overflow 上 800 万个已发布的问题中进行文本搜索。输入类似“如何在 SQL 中随机编排各行?”的查询或任意的编程问题,试用文本语义搜索。
等待期间:探索 Vector Search 笔记本
- 在笔记本中,前往顶部的 Bringing Gen AI and LLMs to production services(将生成式 AI 和 LLM 应用于生产服务)部分,并通读 Vector Search 应用场景和相关说明。
任务 4. 运行查询
- 前往运行查询部分,逐一运行各个单元,以查询索引。您可以尝试更改
test_embeddings
变量中的字符串,以查看不同的结果。
点击检查我的进度,验证是否完成以下目标:
恭喜!
恭喜!在本实验中,您学习了如何创建文本嵌入,并使用它们来创建 Vector Search 索引。现在,您可以在自己的应用中使用文本嵌入了!
后续步骤/了解详情
如需详细了解文本嵌入和 Vector Search,请查看以下资源:
Google Cloud 培训和认证
…可帮助您充分利用 Google Cloud 技术。我们的课程会讲解各项技能与最佳实践,可帮助您迅速上手使用并继续学习更深入的知识。我们提供从基础到高级的全方位培训,并有点播、直播和虚拟三种方式选择,让您可以按照自己的日程安排学习时间。各项认证可以帮助您核实并证明您在 Google Cloud 技术方面的技能与专业知识。
上次更新手册的时间:2024 年 4 月 4 日
上次测试实验的时间:2024 年 4 月 4 日
版权所有 2024 Google LLC 保留所有权利。Google 和 Google 徽标是 Google LLC 的商标。其他所有公司名和产品名可能是其各自相关公司的商标。