Puntos de control
Clone and run the lab notebook
/ 25
Get Started with Vector Search
/ 25
Create an Index
/ 25
Query the Index
/ 25
Comienza a usar la búsqueda de vectores y las embeddings
GSP1202
Descripción general
La Búsqueda de vectores examina miles de millones de elementos similares o relacionados de manera semántica. Los servicios de coincidencia de similitud de vectores tienen muchos casos de uso, como la implementación de motores de recomendaciones, motores de búsqueda, chatbots y clasificación de texto. La coincidencia semántica puede simplificarse en pocos pasos. Primero, debes generar representaciones de embedding de muchos elementos (que se realizan fuera de la Búsqueda de vectores). En segundo lugar, debes subir tus embeddings a Google Cloud y, luego, vincular los datos a la Búsqueda de vectores. Después de agregar tus embeddings a la Búsqueda de vectores, puedes crear un índice para ejecutar consultas y obtener recomendaciones o resultados.
El uso de embeddings no se limita a palabras o texto. Puedes generar embeddings semánticas para muchos tipos de datos, incluidas imágenes, audio, video y preferencias del usuario. Para generar una embedding multimodal con Vertex AI, consulta Obtén embeddings multimodales. En este lab, aprenderás a usar embeddings de Vertex AI para texto con el fin de crear embeddings de texto y usarlas para crear un Índice de búsqueda de vectores.
Objetivos
En este lab, realizarás las siguientes tareas:
- Crear una instancia de notebook de Vertex AI
- Clonar y ejecutar el notebook del lab
- Crear embeddings de texto
- Crear y, luego, implementar el Índice de búsqueda de vectores
- Consulta el índice
Configuración y requisitos
Antes de hacer clic en el botón Comenzar lab
Lee estas instrucciones. Los labs son cronometrados y no se pueden pausar. El cronómetro, que comienza a funcionar cuando haces clic en Comenzar lab, indica por cuánto tiempo tendrás a tu disposición los recursos de Google Cloud.
Este lab práctico te permitirá realizar las actividades correspondientes en un entorno de nube real, no en uno de simulación o demostración. Para ello, se te proporcionan credenciales temporales nuevas que utilizarás para acceder a Google Cloud durante todo el lab.
Para completar este lab, necesitarás lo siguiente:
- Acceso a un navegador de Internet estándar (se recomienda el navegador Chrome)
- Tiempo para completar el lab: Recuerda que, una vez que comienzas un lab, no puedes pausarlo.
Cómo iniciar tu lab y acceder a la consola de Google Cloud
-
Haga clic en el botón Comenzar lab. Si debe pagar por el lab, se abrirá una ventana emergente para que seleccione su forma de pago. A la izquierda, se encuentra el panel Detalles del lab, que tiene estos elementos:
- El botón Abrir la consola de Google Cloud
- El tiempo restante
- Las credenciales temporales que debe usar para el lab
- Otra información para completar el lab, si es necesaria
-
Haz clic en Abrir la consola de Google Cloud (o haz clic con el botón derecho y selecciona Abrir el vínculo en una ventana de incógnito si ejecutas el navegador Chrome).
El lab inicia recursos y abre otra pestaña en la que se muestra la página de acceso.
Sugerencia: Ordene las pestañas en ventanas separadas, una junto a la otra.
Nota: Si ves el diálogo Elegir una cuenta, haz clic en Usar otra cuenta. -
De ser necesario, copia el nombre de usuario a continuación y pégalo en el diálogo Acceder.
{{{user_0.username | "Username"}}} También puedes encontrar el nombre de usuario en el panel Detalles del lab.
-
Haz clic en Siguiente.
-
Copia la contraseña que aparece a continuación y pégala en el diálogo Te damos la bienvenida.
{{{user_0.password | "Password"}}} También puedes encontrar la contraseña en el panel Detalles del lab.
-
Haz clic en Siguiente.
Importante: Debes usar las credenciales que te proporciona el lab. No uses las credenciales de tu cuenta de Google Cloud. Nota: Usar tu propia Cuenta de Google podría generar cargos adicionales. -
Haga clic para avanzar por las páginas siguientes:
- Acepta los Términos y Condiciones.
- No agregues opciones de recuperación o autenticación de dos factores (esta es una cuenta temporal).
- No te registres para obtener pruebas gratuitas.
Después de un momento, se abrirá la consola de Google Cloud en esta pestaña.
Tarea 1: Crea una instancia de Vertex AI Workbench
-
En el menú de navegación de la consola de Google Cloud, haz clic en Vertex AI > Workbench.
-
Haz clic en Crear nueva.
-
En el cuadro de diálogo Crear instancia, usa el nombre predeterminado o ingresa un nombre único para la instancia de Vertex AI Workbench. Define la región en
y la zona en , y deja el resto de la configuración como predeterminada. -
Haz clic en Crear.
-
Haz clic en Abrir JupyterLab.
Clonar y ejecutar el notebook del lab
-
En tu notebook, haz clic en la terminal.
-
Ejecuta el siguiente comando para clonar el repo de IA generativa Google Cloud:
Haz clic en Revisar mi progreso para verificar el objetivo.
-
En el panel de navegación izquierdo, navega a la carpeta
generative-ai/embeddings
y abre el notebookintro-textemb-vectorsearch.ipynb
. -
Para la instrucción Select Kernel, deja la opción predeterminada Python3 y haz clic en Select.
-
Desplázate hacia abajo hasta la sección Text Embeddings in Action y ejecuta las celdas de configuración.
-
Cuando configures tus variables de entorno, usa
para la ubicación y para el ID del proyecto.
- Puedes saltar la sección Set IAM permissions porque tu cuenta de servicio ya tiene los permisos necesarios.
Tarea 2: Genera embeddings
-
Navega a la sección Getting Started with Vertex AI Embeddings for Text y ejecuta las celdas para crear las embeddings de texto.
-
Navega a la sección Getting Started with Vector Search y ejecuta las celdas.
-
Guarda las embeddings en un archivo JSON.
-
Crea un nuevo bucket de Cloud Storage y copia el archivo en él.
Haz clic en Revisar mi progreso para verificar el objetivo.
Tarea 3: Crea e implementa un índice
- Navega a la sección Create an Index y ejecuta las celdas para crear e implementar un índice.
Haz clic en Revisar mi progreso para verificar el objetivo.
Explora la búsqueda de vectores y prueba la demostración
En esta tarea, explorarás el notebook de la búsqueda de vectores y probarás la demostración pública. Ya que la creación y la implementación del índice tarda alrededor de 30 minutos, puedes probar la demostración pública y explorar el notebook mientras esperas.
Mientras esperas: Prueba la demostración de búsqueda semántica de Stack Overflow
- La demostración de búsqueda semántica está disponible como demostración en directo pública. Selecciona “STACKOVERFLOW” y, luego, ingresa cualquier pregunta sobre programación como una consulta. De este modo, se ejecutará una búsqueda de texto en 8 millones de preguntas publicadas en Stack Overflow. Prueba la búsqueda semántica de texto con algunas consultas como “¿Cómo funcionan las filas de redistribución en SQL?” o preguntas arbitrarias sobre programación.
Mientras esperas: Explora el notebook de búsqueda de vectores
- En el notebook, navega a la sección Bringing Gen AI and LLMs to production services en la parte superior y lee los casos de uso y las explicaciones de la búsqueda de vectores.
Tarea 4: Ejecuta una consulta
- Navega a la sección Run Query y ejecuta las celdas para consultar en el índice. Puedes intentar cambiar la cadena en la variable
test_embeddings
para ver resultados diferentes.
Haz clic en Revisar mi progreso para verificar el objetivo.
¡Felicitaciones!
¡Felicitaciones! En este lab, aprendiste a crear embeddings de texto y a usarlas para crear un índice de búsqueda de vectores. Ahora puedes usar las embeddings de texto en tus propias aplicaciones.
Próximos pasos y más información
Consulta los siguientes recursos para obtener más información sobre las embeddings de texto y la búsqueda de vectores.
- Vertex AI Embeddings for Text: Grounding LLMs made easy
- Descripción general de Búsqueda de Vectores de Vertex AI
- Instructivos de notebooks de búsqueda de vectores
Capacitación y certificación de Google Cloud
Recibe la formación que necesitas para aprovechar al máximo las tecnologías de Google Cloud. Nuestras clases incluyen habilidades técnicas y recomendaciones para ayudarte a avanzar rápidamente y a seguir aprendiendo. Para que puedas realizar nuestros cursos cuando más te convenga, ofrecemos distintos tipos de capacitación de nivel básico a avanzado: a pedido, presenciales y virtuales. Las certificaciones te ayudan a validar y demostrar tus habilidades y tu conocimiento técnico respecto a las tecnologías de Google Cloud.
Última actualización del manual: 4 de abril de 2024
Prueba más reciente del lab: 4 de abril de 2024
Copyright 2024 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.