arrow_back

开始使用 Vector Search 和嵌入

登录 加入
欢迎加入我们的社区,一起测试和分享您的知识!
done
学习 700 多个动手实验和课程并获得相关技能徽章

开始使用 Vector Search 和嵌入

实验 1 小时 30 分钟 universal_currency_alt 5 个积分 show_chart 中级
info 此实验可能会提供 AI 工具来支持您学习。
欢迎加入我们的社区,一起测试和分享您的知识!
done
学习 700 多个动手实验和课程并获得相关技能徽章

GSP1202

Google Cloud 自定进度实验

概览

Vector Search 可以从数十亿个语义相似项或语义相关项中进行搜索。矢量相似度匹配服务可应用于很多种场景,例如实现推荐引擎、搜索引擎、聊天机器人和文本分类。语义匹配可以简化为几个步骤。第一步,您必须为许多项内容生成嵌入表示形式(在 Vector Search 之外完成)。第二步,将嵌入上传到 Google Cloud,然后将数据关联到 Vector Search。将嵌入添加到 Vector Search 后,即可创建索引来运行查询,以获取建议或结果。

嵌入的适用情形不限于字词或文本。您可以为多种类型的数据(包括图片、音频、视频和用户偏好设置)生成语义嵌入。如需使用 Vertex AI 生成多模态嵌入,请参阅获取多模态嵌入。在本实验中,您将学习如何使用 Vertex AI Embeddings for Text 创建文本嵌入,并使用它们创建 Vector Search 索引。

目标

在本实验中,您将执行以下任务:

  • 创建 Vertex AI 笔记本实例
  • 克隆并运行实验笔记本
  • 创建文本嵌入
  • 创建并部署 Vector Search 索引
  • 查询索引

设置和要求

点击“开始实验”按钮前的注意事项

请阅读以下说明。实验是计时的,并且您无法暂停实验。计时器在您点击开始实验后即开始计时,显示 Google Cloud 资源可供您使用多长时间。

此实操实验可让您在真实的云环境中开展实验活动,免受模拟或演示环境的局限。我们会为您提供新的临时凭据,让您可以在实验规定的时间内用来登录和访问 Google Cloud。

为完成此实验,您需要:

  • 能够使用标准的互联网浏览器(建议使用 Chrome 浏览器)。
注意:请使用无痕模式或无痕浏览器窗口运行此实验。这可以避免您的个人账号与学生账号之间发生冲突,这种冲突可能导致您的个人账号产生额外费用。
  • 完成实验的时间 - 请注意,实验开始后无法暂停。
注意:如果您已有自己的个人 Google Cloud 账号或项目,请不要在此实验中使用,以避免您的账号产生额外的费用。

如何开始实验并登录 Google Cloud 控制台

  1. 点击开始实验按钮。如果该实验需要付费,系统会打开一个弹出式窗口供您选择付款方式。左侧是实验详细信息面板,其中包含以下各项:

    • 打开 Google Cloud 控制台按钮
    • 剩余时间
    • 进行该实验时必须使用的临时凭据
    • 帮助您逐步完成本实验所需的其他信息(如果需要)
  2. 点击打开 Google Cloud 控制台(如果您使用的是 Chrome 浏览器,请右键点击并选择在无痕式窗口中打开链接)。

    该实验会启动资源并打开另一个标签页,显示登录页面。

    提示:请将这些标签页安排在不同的窗口中,并将它们并排显示。

    注意:如果您看见选择账号对话框,请点击使用其他账号
  3. 如有必要,请复制下方的用户名,然后将其粘贴到登录对话框中。

    {{{user_0.username | "<用户名>"}}}

    您也可以在实验详细信息面板中找到用户名

  4. 点击下一步

  5. 复制下面的密码,然后将其粘贴到欢迎对话框中。

    {{{user_0.password | "<密码>"}}}

    您也可以在实验详细信息面板中找到密码

  6. 点击下一步

    重要提示:您必须使用实验提供的凭据。请勿使用您的 Google Cloud 账号凭据。 注意:在本次实验中使用您自己的 Google Cloud 账号可能会产生额外费用。
  7. 继续在后续页面中点击以完成相应操作:

    • 接受条款及条件。
    • 由于该账号为临时账号,请勿添加账号恢复选项或双重验证。
    • 请勿注册免费试用。

片刻之后,系统会在此标签页中打开 Google Cloud 控制台。

注意:如需查看列有 Google Cloud 产品和服务的菜单,请点击左上角的导航菜单导航菜单图标

任务 1. 创建 Vertex AI Workbench 实例

  1. 在 Google Cloud 控制台的导航菜单中依次点击 Vertex AI > Workbench

  2. 点击 + 新建

  3. 创建实例对话框中,为 Vertex AI Workbench 实例使用默认名称或输入一个唯一名称。将区域设为 ,将可用区设为 ,剩余的保留默认设置。

  4. 点击创建

  5. 点击打开 JupyterLab

克隆并运行实验笔记本

  1. 在笔记本中,点击终端

  2. 运行以下命令,克隆 Google Cloud 生成式 AI 仓库:

git clone https://github.com/GoogleCloudPlatform/generative-ai.git

点击检查我的进度,验证是否完成以下目标: 克隆并运行实验笔记本

  1. 在左侧导航窗格中,前往 generative-ai/embeddings 文件夹,然后打开 intro-textemb-vectorsearch.ipynb 笔记本。

  2. Select Kernel(选择内核)提示中,保留默认的 Python3,然后点击选择

  3. 向下滚动到 Text Embeddings in Action(实际运用中的文本嵌入)部分,然后运行设置单元。

  4. 设置环境变量时,使用 表示位置,使用 表示项目 ID。

注意:您可以跳过任何标为“仅限 Colab”的笔记本单元。
  1. 跳过 Set IAM permissions(设置 IAM 权限)部分,因为您的服务账号已具有所需的权限。

任务 2. 生成嵌入

  1. 前往 Getting Started with Vertex AI Embeddings for Text(开始使用 Vertex AI Embeddings for Text)部分,逐一运行各个单元,以创建文本嵌入。

  2. 前往 Getting Started with Vector Search(开始使用 Vector Search)部分,逐一运行各个单元。

  3. 以 JSON 文件形式保存嵌入。

  4. 创建一个新的 Cloud Storage 存储桶,并将文件复制到其中。

点击检查我的进度,验证是否完成以下目标: 开始使用 Vector Search

任务 3. 创建并部署索引

  1. 前往 Create an Index(创建索引)部分,逐一运行各个单元,以创建和部署索引。
注意:创建和部署索引大约需要 20-30 分钟。在等待期间,您可以随时查看以下资源。

点击检查我的进度,验证是否完成以下目标: 创建索引

探索 Vector Search 并试用演示版

在此任务中,您将探索 Vector Search 笔记本并试用公开演示版。由于创建和部署索引大约需要 30 分钟,您可以在等待期间试用公开演示版并探索笔记本。

等待期间:试用 Stack Overflow 语义搜索演示版

  1. Vector Search 公开演示版已作为公开实时演示版发布。选择“STACKOVERFLOW”并输入任何编码问题作为查询,系统随后就会在 Stack Overflow800 万个已发布的问题中进行文本搜索。输入类似“如何在 SQL 中随机编排各行?”的查询或任意的编程问题,试用文本语义搜索。

等待期间:探索 Vector Search 笔记本

  1. 在笔记本中,前往顶部的 Bringing Gen AI and LLMs to production services(将生成式 AI 和 LLM 应用于生产服务)部分,并通读 Vector Search 应用场景和相关说明。

任务 4. 运行查询

  1. 前往运行查询部分,逐一运行各个单元,以查询索引。您可以尝试更改 test_embeddings 变量中的字符串,以查看不同的结果。

点击检查我的进度,验证是否完成以下目标: 查询索引

恭喜!

恭喜!在本实验中,您学习了如何创建文本嵌入,并使用它们来创建 Vector Search 索引。现在,您可以在自己的应用中使用文本嵌入了!

后续步骤/了解详情

如需详细了解文本嵌入和 Vector Search,请查看以下资源:

Google Cloud 培训和认证

…可帮助您充分利用 Google Cloud 技术。我们的课程会讲解各项技能与最佳实践,可帮助您迅速上手使用并继续学习更深入的知识。我们提供从基础到高级的全方位培训,并有点播、直播和虚拟三种方式选择,让您可以按照自己的日程安排学习时间。各项认证可以帮助您核实并证明您在 Google Cloud 技术方面的技能与专业知识。

上次更新手册的时间:2024 年 4 月 4 日

上次测试实验的时间:2024 年 4 月 4 日

版权所有 2024 Google LLC 保留所有权利。Google 和 Google 徽标是 Google LLC 的商标。其他所有公司名和产品名可能是其各自相关公司的商标。

此内容目前不可用

We will notify you via email when it becomes available

太好了!

We will contact you via email if it becomes available