Obtén acceso a más de 700 labs y cursos

Usa APIs de aprendizaje automático en Google Cloud: Lab de desafío

Lab 1 hora 30 minutos universal_currency_alt 5 créditos show_chart Intermedio

info Es posible que este lab incorpore herramientas de IA para facilitar tu aprendizaje.

GSP329
Descripción general
Situación del desafío
Tarea 1: Configura una cuenta de servicio para acceder a las APIs de aprendizaje automático, BigQuery y Cloud Storage
Tarea 2: Crea y descarga un archivo de credenciales para tu cuenta de servicio
Tarea 3: Modifica la secuencia de comandos de Python para extraer texto de archivos de imagen
Tarea 4: Modifica la secuencia de comandos de Python para traducir el texto usando la API de Translation
Tarea 5: Identifica los idiomas usados con más frecuencia en los letreros del conjunto de datos
Sugerencias y trucos
¡Felicitaciones!

Obtén acceso a más de 700 labs y cursos

GSP329

Descripción general

En un lab de desafío, se le proporcionarán una situación y un conjunto de tareas. En lugar de seguir instrucciones paso a paso, deberás utilizar las habilidades aprendidas en los labs del curso para decidir cómo completar las tareas por tu cuenta. Un sistema automatizado de puntuación (en esta página) mostrará comentarios y determinará si completaste tus tareas correctamente.

En un lab de desafío, no se explican conceptos nuevos de Google Cloud, sino que se espera que amplíes las habilidades que adquiriste, como cambiar los valores predeterminados y leer o investigar los mensajes de error para corregir sus propios errores.

Debe completar correctamente todas las tareas dentro del período establecido para obtener una puntuación del 100%.

Se recomienda este lab a los estudiantes inscritos en el curso Usa APIs de aprendizaje automático en Google Cloud. ¿Aceptas el desafío?

Temas evaluados

Otorgar a la cuenta de servicio los privilegios correctos para BigQuery y Cloud Storage.
Crear y descargar un archivo de credenciales de cuentas de servicio para proporcionar credenciales de Google Cloud a una aplicación de Python
Modificar una secuencia de comandos de Python para extraer texto de archivos de imagen usando la API de Cloud Vision de Google
Modificar una secuencia de comandos de Python para traducir texto usando la API de Translation de Google
Verificar los idiomas disponibles en los datos extraídos ejecutando una consulta en SQL en BigQuery

Configuración y requisitos

Antes de hacer clic en el botón Comenzar lab

Lee estas instrucciones. Los labs cuentan con un temporizador que no se puede pausar. El temporizador, que comienza a funcionar cuando haces clic en Comenzar lab, indica por cuánto tiempo tendrás a tu disposición los recursos de Google Cloud.

Este lab práctico te permitirá realizar las actividades correspondientes en un entorno de nube real, no en uno de simulación o demostración. Para ello, se te proporcionan credenciales temporales nuevas que utilizarás para acceder a Google Cloud durante todo el lab.

Para completar este lab, necesitarás lo siguiente:

Acceso a un navegador de Internet estándar. Se recomienda el navegador Chrome.

Nota: Usa una ventana del navegador privada o de incógnito (opción recomendada) para ejecutar el lab. Así evitarás conflictos entre tu cuenta personal y la cuenta de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.

Tiempo para completar el lab (recuerda que, una vez que comienzas un lab, no puedes pausarlo).

Nota: Usa solo la cuenta de estudiante para este lab. Si usas otra cuenta de Google Cloud, es posible que se apliquen cargos a esa cuenta.

Cómo iniciar tu lab y acceder a la consola de Google Cloud

Haz clic en el botón Comenzar lab. Si debes pagar por el lab, se abrirá un diálogo para que selecciones la forma de pago. A la izquierda, se encuentra el panel Detalles del lab, que tiene estos elementos:
- El botón para abrir la consola de Google Cloud
- El tiempo restante
- Las credenciales temporales que debes usar para el lab
- Otra información para completar el lab, si es necesaria
Haz clic en Abrir la consola de Google Cloud (o haz clic con el botón derecho y selecciona Abrir el vínculo en una ventana de incógnito si ejecutas el navegador Chrome).

El lab inicia recursos y abre otra pestaña en la que se muestra la página de acceso.

Sugerencia: Ordena las pestañas en ventanas separadas, una junto a la otra.
Nota: Si ves el diálogo Elegir una cuenta, haz clic en Usar otra cuenta.
De ser necesario, copia el nombre de usuario a continuación y pégalo en el diálogo Acceder.
{{{user_0.username | "Username"}}}
También puedes encontrar el nombre de usuario en el panel Detalles del lab.
Haz clic en Siguiente.
Copia la contraseña que aparece a continuación y pégala en el diálogo Te damos la bienvenida.
{{{user_0.password | "Password"}}}
También puedes encontrar la contraseña en el panel Detalles del lab.
Haz clic en Siguiente.
Importante: Debes usar las credenciales que te proporciona el lab. No uses las credenciales de tu cuenta de Google Cloud. Nota: Usar tu propia cuenta de Google Cloud para este lab podría generar cargos adicionales.
Haz clic para avanzar por las páginas siguientes:
- Acepta los Términos y Condiciones.
- No agregues opciones de recuperación o autenticación de dos factores (esta es una cuenta temporal).
- No te registres para obtener pruebas gratuitas.

Después de un momento, se abrirá la consola de Google Cloud en esta pestaña.

Nota: Para acceder a los productos y servicios de Google Cloud, haz clic en el menú de navegación o escribe el nombre del servicio o producto en el campo Buscar.

Situación del desafío

Comenzaste a desempeñar una nueva función como miembro del equipo de estadísticas de Jooli Inc. Debes ayudar en el desarrollo y la evaluación de conjuntos de datos para los proyectos de aprendizaje automático de tu empresa. Entre las tareas comunes se incluyen la preparación, la limpieza y el análisis de diversos conjuntos de datos.

Se espera que tengas las capacidades y el conocimiento necesarios para realizar estas tareas, por lo que no se te proporcionarán guías paso a paso.

Tu desafío

Se te solicitó que desarrolles un proceso de análisis de conjuntos de imágenes de letreros para extraer y traducir el texto de ellas. La información de este texto extraído se usará para ayudar a clasificar las imágenes como parte de un proyecto de aprendizaje automático, en el que se empleará este conjunto de datos de imágenes para entrenamiento y evaluación de modelos. Todas las imágenes contienen texto, pero este puede estar en cualquier idioma. Las imágenes se almacenan en un bucket de Cloud Storage que se te proporcionó.

Para identificar el texto en cada imagen, debes usar una secuencia de comandos de Python para procesar cada uno de los archivos de imagen enviándolos a la API de Vision de Google. El texto de cada imagen se debe volver a guardar en Cloud Storage en archivos separados. Si la configuración regional del texto no es (locale=“”), debes enviar el texto a la API de Google Traductor para obtener la traducción al del texto original. Una vez que se procesan todas las imágenes, la secuencia de comandos debe subir los resultados a una tabla de BigQuery.

En este diagrama, se describe el proceso.

Los datos del texto procesado luego se deben escribir en una tabla preexistente de BigQuery llamada image_text_detail, en un conjunto de datos de tu proyecto. llamado image_classification_dataset.

Un colega de tu equipo había comenzado a trabajar en el código para procesar las imágenes a partir de una secuencia de comandos de Python usada anteriormente para procesar un conjunto de archivos de texto con la API de Natural Language. Tu colega pasó a trabajar en otro proyecto, y ahora debes completar la tarea.

La mayor parte del trabajo de la secuencia de comandos se completó; la versión que se te proporcionó accederá a un bucket de almacenamiento e iterará cada archivo de imagen que encuentre. Sin embargo, aún no se implementaron las llamadas a las API específicas que son necesarias para encontrar el texto en cada imagen y luego enviarlo a la API de Translation.

Se te proporcionaron una copia de la secuencia de comandos de trabajo en curso de Python y un conjunto de imágenes de muestra en un bucket de Cloud Storage, cuyo nombre se corresponde con tu ID de proyecto del lab.

Tu colega identificó las partes sin terminar de la secuencia de comandos y realizó comentarios sobre las llamadas a las API que se deben hacer. En la secuencia de comandos hay tres partes sin terminar que debes completar para realizar las llamadas correctas a las API de aprendizaje automático. Todas ellas van precedidas por un comentario con la etiqueta # TBD:.

Con la última línea de código se suben los datos de resultados a BigQuery. En la secuencia de comandos, esta línea se inhabilita con un carácter de comentario. Cuando hayas verificado que funciona el resto de la secuencia de comandos, quita el carácter de comentario para habilitar la línea final.

Antes de trabajar en la secuencia de comandos, debes preparar tu entorno creando una cuenta de servicio con los permisos correctos y descargar el archivo de credenciales para dicha cuenta. Una vez que dispongas de las credenciales de la cuenta de servicio, podrás modificar la secuencia de comandos de Python y usarla para procesar los archivos de imagen.

Para completar el desafío, los datos del texto original extraído, la configuración regional y el texto traducido de todas las imágenes se deben cargar en la tabla de BigQuery llamada image_text_detail. El código necesario para hacer esto se encuentra en la secuencia de comandos, pero debes quitar los caracteres de comentario para habilitar la línea de código al final de la secuencia.

Una vez que hayas procesado bien los archivos de imagen usando la secuencia de comandos de Python actualizada y hayas subido los datos a BigQuery, deberás confirmar que los datos de las imágenes se hayan procesado correctamente ejecutando la siguiente consulta en BigQuery:

SELECT locale,COUNT(locale) as lcount FROM image_classification_dataset.image_text_detail GROUP BY locale ORDER BY lcount DESC

Esta consulta informará el número de letreros de cada tipo de idioma que haya encontrado en el conjunto de imágenes de muestra.

Tarea 1: Configura una cuenta de servicio para acceder a las APIs de aprendizaje automático, BigQuery y Cloud Storage

Crea una nueva cuenta de servicio que proporcione credenciales para la secuencia de comandos.
Cuando hayas creado la cuenta, vincula los roles y a la cuenta de servicio para proporcionar los permisos requeridos de IAM para procesar los archivos de Cloud Storage e insertar los datos del resultado en una tabla de BigQuery. Verifica que exista una cuenta de servicio con permisos de administrador para acceder a BigQuery y Cloud Storage.

Tarea 2: Crea y descarga un archivo de credenciales para tu cuenta de servicio

Una vez que hayas configurado los permisos de la cuenta de servicio, descarga el archivo de credenciales de IAM en formato JSON para la cuenta.
No olvides configurar la variable de entorno que proporciona el nombre del archivo de credenciales para la secuencia de comandos de Python. Verifica que se haya creado un archivo de credenciales de IAM para la cuenta de servicio.

Tarea 3: Modifica la secuencia de comandos de Python para extraer texto de archivos de imagen

Copia en Cloud Shell el archivo analyze-images-v2.py del bucket de Cloud Storage que se creó para ti.
Debes modificar esta secuencia de comandos de Python para extraer texto de los archivos de imagen almacenados en el bucket de tu proyecto y luego guardar los datos de texto de cada uno en un archivo de texto que se vuelve a escribir en el mismo bucket. Recuerda que las partes de la secuencia de comandos en las que debes agregar el código para acceder a las API se marcan con el comentario # TBD.
Después de modificar la primera parte de la secuencia de comandos para usar la API de Cloud Vision, para extraer datos de texto de los archivos de imagen, debes ejecutar la secuencia de comandos incompleta para verificar el progreso y asegurarte de que vas por buen camino.

Confirma que la aplicación puede extraer texto de las imágenes.

Tarea 4: Modifica la secuencia de comandos de Python para traducir el texto usando la API de Translation

A continuación, modifica la segunda parte de la secuencia de comandos de Python para identificar los datos de texto en encontrados en la API de Vision y usa la API de Translation para traducir el texto original al .
Confirma que la aplicación pueda traducir texto y almacenar los resultados en BigQuery.

Tarea 5: Identifica los idiomas usados con más frecuencia en los letreros del conjunto de datos

Después de actualizar la secuencia de comandos para que encuentre y traduzca correctamente el texto de las imágenes, quita el carácter de comentario de la línea al final de la secuencia que sube los datos a BigQuery.
Una vez que se suban los datos a BigQuery, confirma que se hayan cargado todos los datos necesarios en esa herramienta ejecutando una consulta que cuente la cantidad de veces que detecta cada idioma. Ejecuta una consulta de BigQuery para notificar la frecuencia con la que se encuentra cada idioma en las imágenes.

Sugerencias y trucos

Sugerencia 1: Debes configurar una variable de entorno para proporcionar los detalles del archivo de credenciales que la secuencia de comandos de Python debería usar para acceder a las APIs de Google Cloud.
Sugerencia 2: Puedes encontrar información sobre la llamada document_text_detection del cliente a la API de Vision en la página de referencia de la documentación de la API de Python relacionada con el cliente de la API de Vision. Asimismo, la información del objeto de respuesta de anotación de la API de Vision se encuentra disponible en la página de referencia de la documentación de la API de Python relacionada con los objetos de la API de Vision.
Sugerencia 3: Para obtener información sobre la llamada translate del cliente de la API de Translation, consulta la documentación de la API de Python relacionada con el cliente de la API de Translation V2.

¡Felicitaciones!

Desarrollaste un proceso para analizar imágenes de letreros, extraer el texto de estas y traducirlo.

Capacitación y certificación de Google Cloud

Recibe la formación que necesitas para aprovechar al máximo las tecnologías de Google Cloud. Nuestras clases incluyen habilidades técnicas y recomendaciones para ayudarte a avanzar rápidamente y a seguir aprendiendo. Para que puedas realizar nuestros cursos cuando más te convenga, ofrecemos distintos tipos de capacitación de nivel básico a avanzado: a pedido, presenciales y virtuales. Las certificaciones te ayudan a validar y demostrar tus habilidades y tu conocimiento técnico respecto a las tecnologías de Google Cloud.

Última actualización del manual: 30 de agosto de 2024

Prueba más reciente del lab: 30 de agosto de 2024

Copyright 2025 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.

Usa APIs de aprendizaje automático en Google Cloud: Lab de desafío

Usa APIs de aprendizaje automático en Google Cloud: Lab de desafío

GSP329

Descripción general

Temas evaluados

Configuración y requisitos

Antes de hacer clic en el botón Comenzar lab

Cómo iniciar tu lab y acceder a la consola de Google Cloud

Situación del desafío

Tu desafío

Tarea 1: Configura una cuenta de servicio para acceder a las APIs de aprendizaje automático, BigQuery y Cloud Storage

Tarea 2: Crea y descarga un archivo de credenciales para tu cuenta de servicio

Tarea 3: Modifica la secuencia de comandos de Python para extraer texto de archivos de imagen

Tarea 4: Modifica la secuencia de comandos de Python para traducir el texto usando la API de Translation

Tarea 5: Identifica los idiomas usados con más frecuencia en los letreros del conjunto de datos

Sugerencias y trucos

¡Felicitaciones!

Capacitación y certificación de Google Cloud

Antes de comenzar

Usa la navegación privada

Accede a la consola

Usa la navegación privada para ejecutar el lab