Testez vos connaissances et partagez-les avec notre communauté

Analyser des affiches de films dans BigQuery avec des modèles distants

Atelier 1 heure universal_currency_alt 5 crédits show_chart Intermédiaire

info Cet atelier peut intégrer des outils d'IA pour vous accompagner dans votre apprentissage.

GSP1247
Présentation
Objectifs
Préparation
Tâche 1 : Configurer votre environnement et votre projet pour utiliser les API
Tâche 2 : Créer une connexion à une ressource Cloud
Tâche 3 : Accorder des autorisations IAM au compte de service de la connexion
Tâche 4 : Créer l'ensemble de données et une table d'objets dans BigQuery pour les images d'affiches de films
Tâche 5 : Créer les modèles distants Gemini dans BigQuery
Tâche 6 : Demander à Gemini de fournir un résumé du film pour chaque affiche
Tâche 7 : Générer des embeddings textuels avec un modèle distant
Félicitations !

Testez vos connaissances et partagez-les avec notre communauté

GSP1247

Présentation

Dans cet atelier, vous allez apprendre à utiliser BigQuery Machine Learning pour l'inférence avec des modèles distants (modèles d'IA Gemini) afin d'analyser des images d'affiches de films et de générer des résumés de ces affiches dans un projet de démonstration de faisabilité.

BigQuery est une plate-forme d'analyse de données entièrement gérée et compatible avec l'IA, conçue pour être multimoteur, multiformat et multicloud. Elle vous aide à maximiser la valeur de vos données. BigQuery Machine Learning pour l'inférence, l'une de ses fonctionnalités essentielles, vous permet de créer et d'exécuter des modèles de machine learning (ML) à l'aide de requêtes GoogleSQL.

Gemini est une famille de modèles d'IA générative développés par Google DeepMind, et conçus pour les cas d'utilisation multimodaux. L'API Gemini vous donne accès aux modèles Gemini Pro Vision et Gemini Pro.

Exécuter des modèles de ML à l'aide de requêtes GoogleSQL

En règle générale, l'exploitation du ML ou de l'intelligence artificielle (IA) sur des ensembles de données volumineux nécessite une programmation importante et une connaissance approfondie des frameworks de ML. Ces exigences restreignent le développement de solutions à un très petit nombre de personnes dans chaque entreprise, excluant de fait les analystes de données, qui comprennent les données mais ont des connaissances limitées en ML et ne sont pas des experts en programmation. Toutefois, grâce à BigQuery Machine Learning pour l'inférence, les utilisateurs de SQL peuvent mettre à profit leurs compétences et outils SQL existants pour créer des modèles et générer des résultats à partir de LLM et des API d'IA dans le cloud.

Objectifs

Dans cet atelier, vous allez apprendre à :

configurer votre environnement et votre compte pour utiliser les API ;
créer une connexion à une ressource cloud dans BigQuery ;
créer un ensemble de données et une table d'objets dans BigQuery pour les images d'affiches de films ;
créer les modèles distants Gemini dans BigQuery ;
demander à Gemini de fournir un résumé du film pour chaque affiche ;
générer des embeddings textuels pour le film représenté sur chaque affiche ;
utiliser la fonction VECTOR_SEARCH de BigQuery pour mettre en correspondance les images des affiches avec des films étroitement liés dans l'ensemble de données.

Préparation

Avant de cliquer sur le bouton "Démarrer l'atelier"

Lisez ces instructions. Les ateliers sont minutés, et vous ne pouvez pas les mettre en pause. Le minuteur, qui démarre lorsque vous cliquez sur Démarrer l'atelier, indique combien de temps les ressources Google Cloud resteront accessibles.

Cet atelier pratique vous permet de suivre les activités dans un véritable environnement cloud, et non dans un environnement de simulation ou de démonstration. Des identifiants temporaires vous sont fournis pour vous permettre de vous connecter à Google Cloud le temps de l'atelier.

Pour réaliser cet atelier :

Vous devez avoir accès à un navigateur Internet standard (nous vous recommandons d'utiliser Chrome).

Remarque : Ouvrez une fenêtre de navigateur en mode incognito (recommandé) ou de navigation privée pour effectuer cet atelier. Vous éviterez ainsi les conflits entre votre compte personnel et le compte temporaire de participant, qui pourraient entraîner des frais supplémentaires facturés sur votre compte personnel.

Vous disposez d'un temps limité. N'oubliez pas qu'une fois l'atelier commencé, vous ne pouvez pas le mettre en pause.

Remarque : Utilisez uniquement le compte de participant pour cet atelier. Si vous utilisez un autre compte Google Cloud, des frais peuvent être facturés à ce compte.

Démarrer l'atelier et se connecter à la console Google Cloud

Cliquez sur le bouton Démarrer l'atelier. Si l'atelier est payant, une boîte de dialogue s'affiche pour vous permettre de sélectionner un mode de paiement. Sur la gauche, vous trouverez le panneau "Détails concernant l'atelier", qui contient les éléments suivants :
- Le bouton "Ouvrir la console Google Cloud"
- Le temps restant
- Les identifiants temporaires que vous devez utiliser pour cet atelier
- Des informations complémentaires vous permettant d'effectuer l'atelier
Cliquez sur Ouvrir la console Google Cloud (ou effectuez un clic droit et sélectionnez Ouvrir le lien dans la fenêtre de navigation privée si vous utilisez le navigateur Chrome).

L'atelier lance les ressources, puis ouvre la page "Se connecter" dans un nouvel onglet.

Conseil : Réorganisez les onglets dans des fenêtres distinctes, placées côte à côte.
Remarque : Si la boîte de dialogue Sélectionner un compte s'affiche, cliquez sur Utiliser un autre compte.
Si nécessaire, copiez le nom d'utilisateur ci-dessous et collez-le dans la boîte de dialogue Se connecter.
{{{user_0.username | "Username"}}}
Vous trouverez également le nom d'utilisateur dans le panneau "Détails concernant l'atelier".
Cliquez sur Suivant.
Copiez le mot de passe ci-dessous et collez-le dans la boîte de dialogue Bienvenue.
{{{user_0.password | "Password"}}}
Vous trouverez également le mot de passe dans le panneau "Détails concernant l'atelier".
Cliquez sur Suivant.
Important : Vous devez utiliser les identifiants fournis pour l'atelier. Ne saisissez pas ceux de votre compte Google Cloud. Remarque : Si vous utilisez votre propre compte Google Cloud pour cet atelier, des frais supplémentaires peuvent vous être facturés.
Accédez aux pages suivantes :
- Acceptez les conditions d'utilisation.
- N'ajoutez pas d'options de récupération ni d'authentification à deux facteurs (ce compte est temporaire).
- Ne vous inscrivez pas à des essais sans frais.

Après quelques instants, la console Cloud s'ouvre dans cet onglet.

Remarque : Pour accéder aux produits et services Google Cloud, cliquez sur le menu de navigation ou saisissez le nom du service ou du produit dans le champ Recherche.

Tâche 1 : Configurer votre environnement et votre projet pour utiliser les API

Dans cette tâche, vous allez configurer l'environnement de l'atelier afin de pouvoir utiliser l'API Cloud AI Companion pour Gemini et l'API Vertex AI Platform avec votre projet.

Remarque : Si vous ne connaissez pas Cloud Shell, consultez la section Utiliser Cloud Shell.

Connectez-vous à la console Google Cloud avec vos identifiants d'atelier et ouvrez la fenêtre du terminal Cloud Shell.
Pour définir les variables d'environnement pour l'ID de votre projet et la région, exécutez les commandes suivantes dans Cloud Shell :
PROJECT_ID=$(gcloud config get-value project) REGION={{{project_0.default_region|set at lab start}}} echo "PROJECT_ID=${PROJECT_ID}" echo "REGION=${REGION}"
Pour enregistrer le compte utilisateur Google connecté dans une variable d'environnement, exécutez la commande suivante :
USER=$(gcloud config get-value account 2> /dev/null) echo "USER=${USER}"
Activez l'API Cloud AI Companion pour Gemini et l'API Vertex AI :
gcloud services enable cloudaicompanion.googleapis.com --project ${PROJECT_ID} gcloud services enable aiplatform.googleapis.com --project ${PROJECT_ID}
Pour utiliser Gemini, attribuez les rôles IAM nécessaires à votre compte utilisateur Google Cloud Qwiklabs :
gcloud projects add-iam-policy-binding ${PROJECT_ID} --member user:${USER} --role=roles/cloudaicompanion.user gcloud projects add-iam-policy-binding ${PROJECT_ID} --member user:${USER} --role=roles/serviceusage.serviceUsageViewer
Une fois ajoutés, ces rôles permettent à l'utilisateur de bénéficier de l'aide de Gemini.

Cliquez sur Vérifier ma progression pour valider l'objectif. Activer les API nécessaires et définir les rôles IAM

Tâche 2 : Créer une connexion à une ressource Cloud

Dans cette tâche, vous allez créer une connexion à une ressource cloud dans BigQuery pour pouvoir travailler avec les modèles Gemini Pro et Gemini Pro Vision.

Dans la console Google Cloud, accédez au menu de navigation, puis cliquez sur BigQuery.
Dans le pop-up de bienvenue, cliquez sur OK.
Pour créer une connexion, cliquez sur + AJOUTER, puis sur Connexions à des sources de données externes.
Dans la liste "Type de connexion", sélectionnez Modèles distants Vertex AI, fonctions à distance et BigLake (Ressource Cloud).
Dans le champ "ID de connexion", saisissez gemini_conn pour votre connexion.
Pour Type d'emplacement sélectionnez Multirégional, puis États-Unis (multirégional) dans le menu déroulant.
Utilisez les valeurs par défaut des autres paramètres.
Cliquez sur Créer une connexion.
Cliquez sur ACCÉDER À LA CONNEXION.
Dans le volet "Informations de connexion", copiez l'ID du compte de service à utiliser à l'étape suivante dans un fichier texte. Vous verrez également que la connexion est ajoutée sous la section "Connexions externes" de votre projet dans l'explorateur BigQuery.

Cliquez sur Vérifier ma progression pour valider l'objectif. Créer une connexion à une ressource Cloud

Tâche 3 : Accorder des autorisations IAM au compte de service de la connexion

Dans cette tâche, vous allez attribuer un rôle au compte de service de la connexion afin de lui accorder des autorisations IAM sur la ressource cloud et lui permettre d'accéder aux services Vertex AI.

Dans la console Google Cloud, accédez au menu de navigation, puis cliquez sur IAM et administration.
Cliquez sur Accorder l'accès.
Dans le champ Nouveaux comptes principaux, saisissez l'ID de compte de service que vous avez copié précédemment.
Dans le champ "Sélectionnez un rôle", choisissez Vertex AI, puis le rôle Utilisateur Vertex AI.
Cliquez sur Enregistrer.

L'ID du compte de service inclut désormais le rôle Utilisateur Vertex AI.

Cliquez sur Vérifier ma progression pour valider l'objectif. Accorder des autorisations IAM au compte de service de la connexion

Tâche 4 : Créer l'ensemble de données et une table d'objets dans BigQuery pour les images d'affiches de films

Dans cette tâche, vous allez créer un ensemble de données pour le projet et une table d'objets dans laquelle stocker les images des affiches.

Créer un ensemble de données

Dans la console Google Cloud, ouvrez le menu de navigation () et sélectionnez BigQuery.
Dans le panneau Explorateur, pour , sélectionnez Afficher les actions (), puis Créer un ensemble de données.

Vous créez un ensemble de données pour stocker des objets de bases de données, dont des tables et des modèles.
Dans le volet Créer un ensemble de données, saisissez les informations suivantes :

Champ Valeur

ID de l'ensemble de données gemini_demo

Type d'emplacement Sélectionnez Multirégional

Emplacement multirégional Sélectionnez États-Unis

Conservez les valeurs par défaut dans les autres champs.
Cliquez sur Créer un ensemble de données.

L'ensemble de données "gemini_demo" est désormais créé et figure en dessous de votre projet dans l'explorateur BigQuery.

Champ	Valeur
ID de l'ensemble de données	gemini_demo
Type d'emplacement	Sélectionnez Multirégional
Emplacement multirégional	Sélectionnez États-Unis

Créer la table d'objets

Pour créer la table d'objets, vous allez utiliser une requête SQL.

Cliquez sur le signe + pour créer une requête SQL.
Dans l'éditeur de requête, collez la requête ci-dessous.
CREATE OR REPLACE EXTERNAL TABLE `gemini_demo.movie_posters` WITH CONNECTION `us.gemini_conn` OPTIONS ( object_metadata = 'SIMPLE', uris = ['gs://cloud-samples-data/vertex-ai/dataset-management/datasets/classic-movie-posters/*'] );
Exécutez la requête.

Cette requête ajoute la table d'objets "movie_posters" à l'ensemble de données "gemini_demo" et charge l'URI (l'emplacement Cloud Storage) de chaque image d'affiche de film dans cette table.
Dans l'explorateur, cliquez sur la table movie_posters, et examinez le schéma et les détails. Vous pouvez interroger la table pour examiner des enregistrements spécifiques.

Cliquez sur Vérifier ma progression pour valider l'objectif. Créer l'ensemble de données et une table d'objets dans BigQuery pour les images d'affiches de films

Tâche 5 : Créer les modèles distants Gemini dans BigQuery

Maintenant que la table d'objets est créée, vous pouvez commencer à l'utiliser. Dans cette tâche, vous allez créer des modèles distants pour Gemini Pro et Gemini Pro Vision dans BigQuery.

Créer le modèle Gemini Pro

Cliquez sur le signe + pour créer une requête SQL.
Dans l'éditeur de requête, collez la requête ci-dessous et exécutez-la.
CREATE OR REPLACE MODEL `gemini_demo.gemini_pro` REMOTE WITH CONNECTION `us.gemini_conn` OPTIONS (endpoint = 'gemini-pro')
Ce code crée le modèle "gemini_pro", qui est ajouté à l'ensemble de données "gemini_demo" dans la section "Modèles".
Dans l'explorateur, cliquez sur le modèle gemini_pro, et examinez le schéma et les détails.

Créer le modèle Gemini Pro Vision

Cliquez sur le signe + pour créer une requête SQL.
Dans l'éditeur de requête, collez la requête ci-dessous et exécutez-la.
CREATE OR REPLACE MODEL `gemini_demo.gemini_pro_vision` REMOTE WITH CONNECTION `us.gemini_conn` OPTIONS (endpoint = 'gemini-pro-vision')
Ce code crée le modèle "gemini_pro_vision", qui est ajouté à l'ensemble de données "gemini_demo" dans la section "Modèles".
Dans l'explorateur, cliquez sur le modèle gemini_pro_vision, et examinez le schéma et les détails.

Cliquez sur Vérifier ma progression pour valider l'objectif. Créer les modèles distants Gemini dans BigQuery

Tâche 6 : Demander à Gemini de fournir un résumé du film pour chaque affiche

Dans cette tâche, vous allez utiliser Gemini (c'est-à-dire les modèles Gemini Pro et Gemini Pro Vision que vous venez de créer) pour analyser les images des affiches et générer un résumé pour chaque film.

Analyser les images avec le modèle Gemini Pro Vision

Cliquez sur le signe + pour créer une requête SQL.
Dans l'éditeur de requête, collez la requête ci-dessous et exécutez-la.
CREATE OR REPLACE TABLE `gemini_demo.movie_posters_results` AS ( SELECT uri, ml_generate_text_llm_result FROM ML.GENERATE_TEXT( MODEL `gemini_demo.gemini_pro_vision`, TABLE `gemini_demo.movie_posters`, STRUCT( 0.2 AS temperature, 'For the movie represented by this poster, what is the movie title and year of release? Answer in JSON format with two keys: title, year. title should be string, year should be integer.' AS PROMPT, TRUE AS FLATTEN_JSON_OUTPUT)));
Cette requête crée la table "movie_posters_results".
Dans l'explorateur, cliquez sur la table movie_posters_results, et examinez le schéma et les détails.
Cliquez sur le signe + pour créer une requête SQL.
Dans l'éditeur de requête, collez la requête suivante et exécutez-la :
SELECT * FROM `gemini_demo.movie_posters_results`
Cette requête affiche les lignes de chaque affiche de film avec l'URI (l'emplacement Cloud Storage de l'image de l'affiche de film) et un résultat JSON incluant le titre du film et l'année de sa sortie, fournis par le modèle Gemini Pro Vision.

Vous pouvez récupérer ces résultats dans un format plus lisible en utilisant la requête suivante.
Cliquez sur le signe + pour créer une requête SQL.
Dans l'éditeur de requête, collez la requête suivante et exécutez-la :
CREATE OR REPLACE TABLE `gemini_demo.movie_posters_results_formatted` AS ( SELECT uri, JSON_QUERY(RTRIM(LTRIM(results.ml_generate_text_llm_result, " ```json"), "```"), "$.title") AS title, JSON_QUERY(RTRIM(LTRIM(results.ml_generate_text_llm_result, " ```json"), "```"), "$.year") AS year FROM `gemini_demo.movie_posters_results` results )
Cette requête crée la table "movie_posters_result_formatted".
Vous pouvez interroger la table avec la requête ci-dessous pour voir les lignes créées.
SELECT * FROM `gemini_demo.movie_posters_results_formatted`
Remarquez que les résultats de la colonne d'URI restent identiques, mais que le JSON est désormais converti en colonnes de titre et d'année pour chaque ligne.

Demander à Gemini Pro de fournir des résumés de films

Vous pouvez utiliser Gemini Pro pour fournir un résumé du film correspondant à chaque affiche en exécutant la requête ci-dessous.
SELECT uri, title, year, prompt, ml_generate_text_llm_result FROM ML.GENERATE_TEXT( MODEL `gemini_demo.gemini_pro`, ( SELECT CONCAT('Provide a short summary of movie titled ',title, ' from the year ',year,'.') AS prompt, uri, title, year FROM `gemini_demo.movie_posters_results_formatted` LIMIT 20 ), STRUCT(0.2 AS temperature, TRUE AS FLATTEN_JSON_OUTPUT));
Remarquez que le résultat ressemble à celui de la requête précédente, à deux différences près : la requête utilisée avec Gemini apparaît désormais dans la colonne "prompt" et le résultat de l'utilisation de cette requête apparaît dans le champ "ml_generate_text_llm_result", qui inclut un bref résumé du film.

Cliquez sur Vérifier ma progression pour valider l'objectif. Demander à Gemini de fournir un résumé du film pour chaque affiche

Tâche 7 : Générer des embeddings textuels avec un modèle distant

Dans cette tâche, vous allez générer des embeddings textuels à l'aide d'un modèle distant afin de pouvoir approfondir les analyses.

Créer le modèle distant

Pour générer les embeddings textuels, vous devez utiliser le modèle distant text-multilingual-embedding-002 hébergé sur le point de terminaison.

Cliquez sur le signe + pour créer une requête SQL.
Dans l'éditeur de requête, collez la requête suivante et exécutez-la :
CREATE OR REPLACE MODEL `gemini_demo.text_embedding` REMOTE WITH CONNECTION `us.gemini_conn` OPTIONS (endpoint = 'text-multilingual-embedding-002')
Le modèle "text_embedding" est créé et apparaît en dessous de l'ensemble de données "gemini_demo" dans l'explorateur.

Générer des embeddings textuels pour le titre et l'année associés aux affiches

Vous devrez créer une table pour stocker les résultats.

Cliquez sur le signe + pour créer une requête SQL.
Dans l'éditeur de requête, collez la requête suivante et exécutez-la :
CREATE OR REPLACE TABLE `gemini_demo.movie_posters_results_embeddings` AS ( SELECT * FROM ML.GENERATE_EMBEDDING( MODEL `gemini_demo.text_embedding`, ( SELECT CONCAT('The movie titled ', title, ' from the year ', year,'.') AS content, title, year, uri FROM `gemini_demo.movie_posters_results_formatted` ), STRUCT(TRUE AS flatten_json_output)));
La table "movie_poster_results_embeddings" est créée. Elle contient les résultats de la création d'embeddings pour le contenu textuel (URI, titre du film et année de sortie) de la table "gemini_demo.movie_posters_results_formatted".
Remarque : La fonction ML.GENERATE_EMBEDDING est utilisée pour générer les embeddings. Elle exploite trois arguments :
- Le premier argument est le nom du modèle à utiliser pour générer les embeddings. Dans le cas présent, le modèle s'appelle "gemini_demo.text_embedding".
- Le deuxième argument est une sous-requête qui sélectionne le contenu textuel à intégrer. Dans le cas présent, la sous-requête sélectionne le titre et l'année de chaque film, puis les concatène en une seule chaîne.
- Le troisième argument est un struct qui spécifie le format de sortie des embeddings. Dans le cas présent, le champ "flatten_json_output" est défini sur "TRUE", ce qui signifie que les embeddings seront regroupés en un seul objet JSON.
Vous pouvez afficher les résultats de la requête à l'aide de la nouvelle requête ci-dessous :
SELECT * FROM `gemini_demo.movie_posters_results_embeddings`
Vous pouvez voir ici les embeddings (vecteurs représentés par des nombres) que le modèle a générés pour chaque film.

Générer des embeddings textuels pour un sous-ensemble de l'ensemble de données IMDB

Vous allez créer une vue qui contient uniquement les films de l'ensemble de données sortis avant 1935.

Créez une requête et exécutez-la avec l'instruction SQL suivante.
CREATE OR REPLACE VIEW `gemini_demo.imdb_movies` AS ( WITH reviews AS ( SELECT reviews.movie_id AS movie_id, title.primary_title AS title, title.start_year AS year, reviews.review AS review FROM `bigquery-public-data.imdb.reviews` reviews LEFT JOIN `bigquery-public-data.imdb.title_basics` title ON reviews.movie_id = title.tconst) SELECT DISTINCT(movie_id), title, year FROM reviews WHERE year < 1935)
Cette requête crée une vue contenant une liste des ID, titres et années de sortie des différents films provenant de la table "bigquery-public-data.imdb.reviews" pour tous les films de l'ensemble de données sortis avant 1935.
Créez une requête et exécutez-la avec l'instruction SQL suivante.
CREATE OR REPLACE TABLE `gemini_demo.imdb_movies_embeddings` AS ( SELECT * FROM ML.GENERATE_EMBEDDING( MODEL `gemini_demo.text_embedding`, ( SELECT CONCAT('The movie titled ', title, ' from the year ', year,'.') AS content, title, year, movie_id FROM `gemini_demo.imdb_movies` ), STRUCT(TRUE AS flatten_json_output) ) WHERE ml_generate_embedding_status = '' );
Le résultat de la requête est une table contenant les embeddings pour le contenu textuel de la table "gemini_demo.imdb_movies".

Associer les images d'affiches de films aux ID de film (movie_id) IMDB à l'aide de la fonction VECTOR_SEARCH de BigQuery

Créez une requête et exécutez-la avec l'instruction SQL suivante.
SELECT query.uri AS poster_uri, query.title AS poster_title, query.year AS poster_year, base.title AS imdb_title, base.year AS imdb_year, base.movie_id AS imdb_movie_id, distance FROM VECTOR_SEARCH( TABLE `gemini_demo.imdb_movies_embeddings`, 'ml_generate_embedding_result', TABLE `gemini_demo.movie_posters_results_embeddings`, 'ml_generate_embedding_result', top_k => 1, distance_type => 'COSINE');
La requête utilise la fonction VECTOR_SEARCH afin de trouver pour chaque ligne de la table "gemini_demo.movie_posters_results_embeddings" le voisin le plus proche dans la table "gemini_demo.imdb_movies_embeddings". Le voisin le plus proche est identifié à l'aide de la métrique de distance de cosinus, qui détermine le degré de similarité entre deux embeddings.

Cette requête permet de trouver le film le plus similaire dans l'ensemble de données IMDB pour chacun des films identifiés par Gemini Pro Vision à partir des affiches. Par exemple, vous pourriez utiliser cette requête pour trouver le résultat le plus proche du film "Au Secours !" (identifié par Gemini Pro Vision sur l'une des affiches de films) dans l'ensemble de données public IMDB, qui fait référence à ce film par son titre en anglais : "Help!".
Créez une requête et exécutez-la pour joindre des informations supplémentaires sur les notes attribuées aux films dans l'ensemble de données public IMDB.
SELECT query.uri AS poster_uri, query.title AS poster_title, query.year AS poster_year, base.title AS imdb_title, base.year AS imdb_year, base.movie_id AS imdb_movie_id, distance, imdb.average_rating, imdb.num_votes FROM VECTOR_SEARCH( TABLE `gemini_demo.imdb_movies_embeddings`, 'ml_generate_embedding_result', TABLE `gemini_demo.movie_posters_results_embeddings`, 'ml_generate_embedding_result', top_k => 1, distance_type => 'COSINE') DATA LEFT JOIN `bigquery-public-data.imdb.title_ratings` imdb ON base.movie_id = imdb.tconst ORDER BY imdb.average_rating DESC
Cette requête ressemble à la précédente. Elle utilise encore des représentations numériques particulières appelées embeddings vectoriels pour trouver des films similaires à une affiche de film donnée. Toutefois, elle ajoute aussi la note moyenne et le nombre de votes pour chaque film voisin le plus proche à partir d'une table distincte de l'ensemble de données public IMDB.

Cliquez sur Vérifier ma progression pour valider l'objectif. Générer des embeddings textuels pour un sous-ensemble de l'ensemble de données IMDB

Félicitations !

Dans cet atelier, vous avez créé une table d'objets pour vos images d'affiches dans BigQuery, créé des modèles distants Gemini, utilisé les modèles pour demander à Gemini d'analyser les images et de fournir des résumés des films, généré des embeddings textuels pour les titres de films, et utilisé des embeddings pour faire correspondre les images des affiches au titre du film associé dans l'ensemble de données IMDB.

Étapes suivantes et informations supplémentaires

Formations et certifications Google Cloud

Les formations et certifications Google Cloud vous aident à tirer pleinement parti des technologies Google Cloud. Nos cours portent sur les compétences techniques et les bonnes pratiques à suivre pour être rapidement opérationnel et poursuivre votre apprentissage. Nous proposons des formations pour tous les niveaux, à la demande, en salle et à distance, pour nous adapter aux emplois du temps de chacun. Les certifications vous permettent de valider et de démontrer vos compétences et votre expérience en matière de technologies Google Cloud.

Dernière mise à jour du manuel : 4 octobre 2024

Dernier test de l'atelier : 23 mai 2024

Copyright 2025 Google LLC Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms d'entreprises et de produits peuvent être des marques des entreprises auxquelles ils sont associés.

Analyser des affiches de films dans BigQuery avec des modèles distants

Analyser des affiches de films dans BigQuery avec des modèles distants

GSP1247

Présentation

Exécuter des modèles de ML à l'aide de requêtes GoogleSQL

Objectifs

Préparation

Avant de cliquer sur le bouton "Démarrer l'atelier"

Démarrer l'atelier et se connecter à la console Google Cloud

Tâche 1 : Configurer votre environnement et votre projet pour utiliser les API

Tâche 2 : Créer une connexion à une ressource Cloud

Tâche 3 : Accorder des autorisations IAM au compte de service de la connexion

Tâche 4 : Créer l'ensemble de données et une table d'objets dans BigQuery pour les images d'affiches de films

Créer un ensemble de données

Créer la table d'objets

Tâche 5 : Créer les modèles distants Gemini dans BigQuery

Créer le modèle Gemini Pro

Créer le modèle Gemini Pro Vision

Tâche 6 : Demander à Gemini de fournir un résumé du film pour chaque affiche

Analyser les images avec le modèle Gemini Pro Vision

Demander à Gemini Pro de fournir des résumés de films

Tâche 7 : Générer des embeddings textuels avec un modèle distant

Créer le modèle distant

Générer des embeddings textuels pour le titre et l'année associés aux affiches

Générer des embeddings textuels pour un sous-ensemble de l'ensemble de données IMDB

Associer les images d'affiches de films aux ID de film (movie_id) IMDB à l'aide de la fonction VECTOR_SEARCH de BigQuery

Félicitations !

Étapes suivantes et informations supplémentaires

Formations et certifications Google Cloud

Before you begin

Use private browsing

Sign in to the Console

Use private browsing to run the lab