
Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
- On the top left of your screen, click Start lab to begin
Enable relevant APIs and set IAM roles
/ 15
Create a cloud resource connection
/ 10
Grant IAM permissions to the connection's service account
/ 10
Create the dataset and object table in BigQuery for movie poster images
/ 10
Create the Gemini Remote models in BigQuery
/ 10
Prompt Gemini to provide movie summaries for each poster
/ 20
Generate text embeddings for a subset of the IMDB dataset
/ 25
En este lab, aprenderás a usar el aprendizaje automático de BigQuery para hacer inferencia con modelos remotos (modelos de IA de Gemini) para analizar imágenes de afiches de películas y generar resúmenes de estos afiches como parte de un proyecto de prueba de concepto.
BigQuery es una plataforma de análisis de datos completamente administrada y lista para la IA que te ayuda a maximizar el valor de tus datos y está diseñada para ser multimotor, multiformato y de múltiples nubes. Una de sus funciones clave es el aprendizaje automático de BigQuery para la inferencia, que te permite crear y ejecutar modelos de aprendizaje automático (AA) usando consultas en GoogleSQL.
Gemini es una familia de modelos de IA generativa que desarrolló Google DeepMind y que están diseñados para casos de uso multimodales. La API de Gemini te da acceso a los modelos de Gemini Pro Vision y Gemini Pro.
Por lo general, ejecutar el AA o la Inteligencia Artificial (IA) en conjuntos de datos grandes requiere una programación extensa y conocimiento de los frameworks de AA. Estos requisitos restringen el desarrollo de soluciones a un conjunto ínfimo de personas dentro de cada empresa, y excluyen a los analistas de datos que comprenden los datos, pero que tienen poco conocimiento sobre AA y poca experiencia en programación. Sin embargo, con el aprendizaje automático de BigQuery para la inferencia, los profesionales de SQL pueden usar herramientas y habilidades de SQL existentes para crear modelos y generar resultados a partir de LLM y APIs de Cloud AI.
En este lab, aprenderás a realizar las siguientes tareas:
Lee estas instrucciones. Los labs cuentan con un temporizador que no se puede pausar. El temporizador, que comienza a funcionar cuando haces clic en Comenzar lab, indica por cuánto tiempo tendrás a tu disposición los recursos de Google Cloud.
Este lab práctico te permitirá realizar las actividades correspondientes en un entorno de nube real, no en uno de simulación o demostración. Para ello, se te proporcionan credenciales temporales nuevas que utilizarás para acceder a Google Cloud durante todo el lab.
Para completar este lab, necesitarás lo siguiente:
Haz clic en el botón Comenzar lab. Si debes pagar por el lab, se abrirá un diálogo para que selecciones la forma de pago. A la izquierda, se encuentra el panel Detalles del lab, que tiene estos elementos:
Haz clic en Abrir la consola de Google Cloud (o haz clic con el botón derecho y selecciona Abrir el vínculo en una ventana de incógnito si ejecutas el navegador Chrome).
El lab inicia recursos y abre otra pestaña en la que se muestra la página de acceso.
Sugerencia: Ordena las pestañas en ventanas separadas, una junto a la otra.
De ser necesario, copia el nombre de usuario a continuación y pégalo en el diálogo Acceder.
También puedes encontrar el nombre de usuario en el panel Detalles del lab.
Haz clic en Siguiente.
Copia la contraseña que aparece a continuación y pégala en el diálogo Te damos la bienvenida.
También puedes encontrar la contraseña en el panel Detalles del lab.
Haz clic en Siguiente.
Haz clic para avanzar por las páginas siguientes:
Después de un momento, se abrirá la consola de Google Cloud en esta pestaña.
En esta tarea, configurarás el entorno del lab para que puedas usar la API complementaria de Cloud AI para Gemini y la API de Vertex AI Platform con tu proyecto.
Accede a la consola de Google Cloud con tus credenciales de lab y abre la ventana de terminal de Cloud Shell.
Para configurar tu ID del proyecto y las variables de entorno de la región, en Cloud Shell, ejecuta los siguientes comandos:
Para almacenar en una variable de entorno la cuenta de usuario de Google con la que accediste, ejecuta el siguiente comando:
Habilita la API complementaria de Cloud AI para Gemini y la API de Vertex AI:
Para usar Gemini, otorga a tu cuenta de usuario de Google Cloud Qwiklabs los siguientes roles necesarios de IAM:
Agregar estos roles te permite usar la asistencia de Gemini.
Para verificar este objetivo, haz clic en Revisar mi progreso.
En esta tarea, crearás una conexión de recursos de Cloud en BigQuery para que puedas trabajar con modelos de Gemini Pro y Gemini Pro Vision.
En el menú de navegación de la consola de Google Cloud, haz clic en BigQuery.
Haz clic en LISTO en la ventana emergente de bienvenida.
Para crear una conexión, haz clic en + AGREGAR y, a continuación, en Conexiones a fuentes de datos externas.
En la lista Tipo de conexión, selecciona Modelos remotos de Vertex AI, funciones remotas y BigLake (recursos de Cloud).
En el campo ID de conexión, escribe gemini_conn para tu conexión.
En Tipo de ubicación, selecciona Multirregión y, luego, en el menú desplegable, selecciona la multirregión EE.UU.
Usa los valores predeterminados para el resto de la configuración.
Haz clic en Crear conexión.
Haz clic en IR A LA CONEXIÓN.
En el panel Información de conexión, copia el ID de cuenta de servicio en un archivo de texto para usarlo en la siguiente tarea. También verás que la conexión se agrega en la sección Conexiones externas de tu proyecto en el panel Explorador de BigQuery.
Haz clic en Revisar mi progreso para verificar el objetivo.
En esta tarea, otorgarás los permisos de IAM a la cuenta de servicio de la conexión de recursos de Cloud, a través de un rol, para que pueda acceder a los servicios de Vertex AI.
En el menú de navegación de la consola de Google Cloud, haz clic en IAM y administración.
Haz clic en Otorgar acceso.
En el campo Principales nuevas, ingresa el ID de cuenta de servicio que copiaste antes.
En el campo Selecciona un rol, escribe Vertex AI y, a continuación, selecciona el rol Usuario de Vertex AI.
Haz clic en Guardar.
Ahora, el resultado es el ID de la cuenta de servicio que incluye el rol de usuario de Vertex AI.
Haz clic en Revisar mi progreso para verificar el objetivo.
En esta tarea, crearás un conjunto de datos para el proyecto y una tabla de objetos dentro de él para almacenar las imágenes de afiches.
En la consola de Google Cloud, selecciona el Menú de navegación () y, luego, BigQuery.
En el panel Explorador, en
Crearás un conjunto de datos para almacenar objetos de base de datos, incluidos modelos y tablas.
En el panel Crear conjunto de datos, ingresa la información que se encuentra a continuación:
Campo | Valor |
---|---|
ID de conjunto de datos | gemini_demo |
Tipo de ubicación | Selecciona Multirregión |
Multirregión | Selecciona EE.UU. |
Deja los demás campos en la configuración predeterminada.
Haz clic en Crear conjunto de datos.
El resultado es el conjunto de datos gemini_demo que se crea y aparece debajo de tu proyecto en el panel Explorador de BigQuery.
Para crear la tabla de objetos, usarás una consulta en SQL.
Haz clic en el signo + para crear una consulta en SQL nueva.
En el editor de consultas, pega la consulta que figura a continuación.
Ejecuta la consulta.
El resultado es que se agrega la tabla de objetos movie_posters al conjunto de datos gemini_demo y se carga con el URI (la ubicación de Cloud Storage) de cada imagen de afiche de película.
En el panel Explorador, haz clic en movie_posters y revisa el esquema y los detalles. Puedes consultar la tabla para revisar registros específicos.
Haz clic en Revisar mi progreso para verificar el objetivo.
Ahora que se creó la tabla de objetos, puedes comenzar a trabajar con ella. En esta tarea, crearás modelos remotos para los modelos de Gemini Pro y Gemini Pro Vision en BigQuery.
Haz clic en el signo + para crear una consulta en SQL nueva.
En el editor de consultas, pega la consulta que figura a continuación y ejecútala.
El resultado es que se crea el modelo gemini_pro y lo verás agregado al conjunto de datos gemini_demo en la sección de modelos.
En el panel Explorador, haz clic en el modelo gemini_pro y revisa los detalles y el esquema.
Haz clic en el signo + para crear una consulta en SQL nueva.
En el editor de consultas, pega la consulta que figura a continuación y ejecútala.
El resultado es que se crea el modelo gemini_pro_vision y lo verás agregado al conjunto de datos gemini_demo en la sección de modelos.
En el panel Explorador, haz clic en el modelo gemini_pro_vision y revisa los detalles y el esquema.
Haz clic en Revisar mi progreso para verificar el objetivo.
En esta tarea, usarás Gemini (los modelos de Gemini Pro y Vision que acabas de crear) para analizar las imágenes de los afiches de películas y generar resúmenes para cada película.
Haz clic en el signo + para crear una consulta en SQL nueva.
En el editor de consultas, pega la consulta que figura a continuación y ejecútala.
Como resultado, se crea la tabla movie_posters_results.
En el panel Explorador, haz clic en la tabla movie_posters_results y revisa el esquema y los detalles.
Haz clic en el signo + para crear una consulta en SQL nueva.
En el editor de consultas, pega y ejecuta la consulta que figura a continuación.
El resultado es que se muestran filas para cada afiche de película con el URI (la ubicación de Cloud Storage de la imagen del afiche de la película) y un resultado de JSON que incluye el título de la película y el año en que se estrenó a partir del modelo de Gemini Pro Vision.
Puedes recuperar estos resultados en una forma más legible por humanos con la siguiente consulta.
Haz clic en el signo + para crear una consulta en SQL nueva.
En el editor de consultas, pega y ejecuta la consulta que figura a continuación.
Como resultado, se crea la tabla movie_posters_result_formatted.
Para ver las filas que se crearon, puedes consultar la tabla con la consulta que figura a continuación.
Observa cómo los resultados de la columna URI siguen siendo los mismos, pero el formato JSON ahora se convierte en las columnas de título y año de cada fila.
Puedes usar Gemini Pro para proporcionar resúmenes de películas para cada afiche. Para ello, ejecuta la siguiente consulta.
Observa que el resultado es similar a la consulta anterior, pero ahora la instrucción usada con Gemini se muestra en la columna prompt y el resultado de usar esta instrucción se incluye en el campo ml_generate_text_llm_result. Esto incluye un resumen breve de la película.
Haz clic en Revisar mi progreso para verificar el objetivo.
En esta tarea, generarás embeddings de texto con un modelo remoto para que puedas realizar análisis adicionales.
Para generar los embeddings de texto, deberás usar el modelo remoto text-multilingual-embedding-002 alojado en el extremo y, luego, podrás generar los embeddings.
Haz clic en el signo + para crear una consulta en SQL nueva.
En el editor de consultas, pega y ejecuta la consulta que figura a continuación.
El resultado es que se crea el modelo text_embedding y aparece en el explorador debajo del conjunto de datos gemini_demo.
Deberás crear una tabla para almacenar los resultados.
Haz clic en el signo + para crear una consulta en SQL nueva.
En el editor de consultas, pega y ejecuta la consulta que figura a continuación.
El resultado es que se crea la tabla movie_poster_results_embeddings, que contiene los resultados de crear embeddings para el contenido de texto (URI, título de la película y año de lanzamiento) de la tabla gemini_demo.movie_posters_results_formatted.
Puedes ver los resultados de la consulta con la nueva consulta que se muestra a continuación:
Aquí puedes ver los embeddings (vectores representados por números) que genera el modelo para cada película.
Crearás una vista nueva que contenga solo las películas del conjunto de datos que se estrenaron antes de 1935.
Crea y ejecuta una nueva consulta con la siguiente instrucción de SQL.
El resultado es una vista nueva que contiene una lista de IDs, títulos y años de lanzamiento de distintas películas de la tabla bigquery-public-data.imdb.reviews para todas las películas del conjunto de datos lanzadas antes de 1935.
Crea y ejecuta una nueva consulta con la siguiente instrucción de SQL.
El resultado de la consulta es una tabla que contiene los embeddings para el contenido de texto de la tabla gemini_demo.imdb_movies.
Crea y ejecuta una nueva consulta con la siguiente instrucción de SQL.
La consulta usa la función VECTOR_SEARCH para encontrar el vecino más cercano en la tabla gemini_demo.imdb_movies_embeddings para cada fila de la tabla gemini_demo.movie_posters_results_embeddings. El vecino más cercano se encuentra con la métrica de distancia coseno, que determina qué tan similares son dos embeddings.
Esta consulta se puede usar para encontrar la película más similar en el conjunto de datos de IMDB para cada una de las películas que Gemini Pro Vision identificó en los afiches de películas. Por ejemplo, puedes usar esta consulta para encontrar la coincidencia más cercana de la película "Au Secours!" (identificada por Gemini Pro Vision en uno de los afiches de películas) en el conjunto de datos públicos de IMDB, que hace referencia a esta película por su título en inglés, "Help!".
Crea y ejecuta una nueva consulta para unir información adicional sobre las calificaciones de películas que se proporciona en el conjunto de datos públicos de IMDB.
Esta consulta es similar a la anterior. Sigue usando representaciones numéricas especiales llamadas embeddings de vectores para encontrar películas similares a un afiche de película determinado. Sin embargo, también une la calificación promedio y la cantidad de votos para cada película que es el vecino más cercano de una tabla separada del conjunto de datos públicos de IMDB.
Haz clic en Revisar mi progreso para verificar el objetivo.
Creaste correctamente una tabla de objetos para tus imágenes de afiches en BigQuery, creaste modelos remotos de Gemini, usaste los modelos para solicitar que Gemini analizara las imágenes y proporcionara resúmenes de películas, generaste embeddings de texto para los títulos de las películas y usaste embeddings para hacer coincidir las imágenes de los afiches de películas con el título de la película relacionada en el conjunto de datos de IMDB.
Recibe la formación que necesitas para aprovechar al máximo las tecnologías de Google Cloud. Nuestras clases incluyen habilidades técnicas y recomendaciones para ayudarte a avanzar rápidamente y a seguir aprendiendo. Para que puedas realizar nuestros cursos cuando más te convenga, ofrecemos distintos tipos de capacitación de nivel básico a avanzado: a pedido, presenciales y virtuales. Las certificaciones te ayudan a validar y demostrar tus habilidades y tu conocimiento técnico respecto a las tecnologías de Google Cloud.
Última actualización del manual: 4 de octubre de 2024
Prueba más reciente del lab: 23 de mayo de 2024
Copyright 2025 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.
Este contenido no está disponible en este momento
Te enviaremos una notificación por correo electrónico cuando esté disponible
¡Genial!
Nos comunicaremos contigo por correo electrónico si está disponible
One lab at a time
Confirm to end all existing labs and start this one