arrow_back

Crea una malla de datos con Dataplex: Lab de desafío

Acceder Unirse
Obtén acceso a más de 700 labs y cursos

Crea una malla de datos con Dataplex: Lab de desafío

Lab 1 hora 30 minutos universal_currency_alt 1 crédito show_chart Introductorio
info Es posible que este lab incorpore herramientas de IA para facilitar tu aprendizaje.
Obtén acceso a más de 700 labs y cursos

GSP514

Descripción general

En un lab de desafío, se le proporcionarán una situación y un conjunto de tareas. En lugar de seguir instrucciones paso a paso, deberás utilizar las habilidades aprendidas en los labs del curso para decidir cómo completar las tareas por tu cuenta. Un sistema automatizado de puntuación (en esta página) mostrará comentarios y determinará si completaste tus tareas correctamente.

En un lab de desafío, no se explican conceptos nuevos de Google Cloud, sino que se espera que amplíes las habilidades que adquiriste, como cambiar los valores predeterminados y leer o investigar los mensajes de error para corregir sus propios errores.

Debe completar correctamente todas las tareas dentro del período establecido para obtener una puntuación del 100%.

Se recomienda este lab a los estudiantes inscritos en la insignia de habilidad Crea una malla de datos con Dataplex. ¿Aceptas el desafío?

Configuración y requisitos

Antes de hacer clic en el botón Comenzar lab

Lee estas instrucciones. Los labs cuentan con un temporizador que no se puede pausar. El temporizador, que comienza a funcionar cuando haces clic en Comenzar lab, indica por cuánto tiempo tendrás a tu disposición los recursos de Google Cloud.

Este lab práctico te permitirá realizar las actividades correspondientes en un entorno de nube real, no en uno de simulación o demostración. Para ello, se te proporcionan credenciales temporales nuevas que utilizarás para acceder a Google Cloud durante todo el lab.

Para completar este lab, necesitarás lo siguiente:

  • Acceso a un navegador de Internet estándar. Se recomienda el navegador Chrome.
Nota: Usa una ventana del navegador privada o de incógnito (opción recomendada) para ejecutar el lab. Así evitarás conflictos entre tu cuenta personal y la cuenta de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.
  • Tiempo para completar el lab (recuerda que, una vez que comienzas un lab, no puedes pausarlo).
Nota: Usa solo la cuenta de estudiante para este lab. Si usas otra cuenta de Google Cloud, es posible que se apliquen cargos a esa cuenta.

Situación del desafío

Recién comienzas a desempeñarte en tu rol como ingeniero júnior de datos. Hasta ahora, estuviste ayudando a los equipos a crear y administrar recursos de Dataplex.

Se espera que tengas las habilidades y el conocimiento necesarios para realizar estas tareas.

Tu desafío

Se te solicitó ayudar a un equipo de desarrollo recién formado con la creación de una nueva malla de datos usando Dataplex. En específico, debes crear un lake de Dataplex con múltiples zonas y recursos. También debes etiquetar recursos en el nuevo lake y evaluar la calidad de sus datos. Te pidieron llevar a cabo las siguientes tareas:

  • Crear un lake de Dataplex con dos zonas y dos recursos
  • Crear y aplicar una plantilla de etiquetas para etiquetar una zona completa como datos protegidos
  • Asignarle un rol de IAM de Dataplex a otro usuario
  • Crear un archivo de especificación de calidad de los datos y subirlo a Cloud Storage
  • Definir y ejecutar un trabajo de calidad de los datos en Dataplex

Estos son algunos estándares que debes seguir:

  • Asegúrate de que todas las APIs necesarias (como Dataplex, Data Catalog y Dataproc) están habilitadas correctamente.
  • Crea todos los recursos en la región , a menos que se indique lo contrario.

A continuación, se describe cada tarea en detalle. ¡Buena suerte!

Tarea 1: Crea un lake de Dataplex con dos zonas y dos recursos

Nota: Para todas las tareas de este lab de desafío, crea los recursos en la región , a menos que se indique lo contrario.

Ya se crearon en este lab el bucket de Cloud Storage y el conjunto de datos de BigQuery para el paso 2.

  1. Crea un lake de Dataplex llamado Sales Lake con las siguientes dos zonas regionales:
  • Una zona sin procesar con el nombre Raw Customer Zone
  • Una zona seleccionada con el nombre Curated Customer Zone
  1. Conecta un recurso creado previamente a cada zona:
  • En la zona sin procesar, conecta el bucket de Cloud Storage llamado -customer-online-sessions como un nuevo recurso con el nombre Customer Engagements.
  • En la zona seleccionada, conecta el conjunto de datos de BigQuery llamado .customer_orders como un nuevo recurso con el nombre Customer Orders.

Sugerencia útil para crear un lake de Dataplex:

Haz clic en Revisar mi progreso para verificar el objetivo. Crear un lake de Dataplex con dos zonas y dos recursos

Tarea 2: Crea y aplica una plantilla de etiqueta a una zona

  1. Crea una plantilla de etiquetas pública con el nombre Protected Customer Data Template con dos campos enumerados:
  • El primer campo llamado Raw Data Flag con dos valores: Yes y No.
  • El segundo campo llamado Protected Contact Information Flag con dos valores: Yes y No
  1. Usa esta plantilla para etiquetar la Raw Customer Zone con un valor de Yes para ambas marcas.

Sugerencia útil para crear y aplicar plantillas de etiquetas:

Haz clic en Revisar mi progreso para verificar el objetivo. Crear y aplicar una plantilla de etiqueta a una zona

Tarea 3: Asígnale un rol de IAM de Dataplex a otro usuario

  • Usa el principio de privilegio mínimo para asignarle el rol de IAM de Dataplex adecuado al Usuario 2 (), que permite subir nuevos archivos de Cloud Storage al recurso de Dataplex llamado Customer Engagements.

Sugerencia útil para asignar roles de IAM de Dataplex:

Haz clic en Revisar mi progreso para verificar el objetivo. Asignarle un rol de IAM de Dataplex a otro usuario

Tarea 4: Crea un archivo de especificación de calidad de los datos y súbelo a Cloud Storage

Ya se creó en este lab el bucket de Cloud Storage para el paso 2.

  1. Crea un archivo de especificación de calidad de los datos llamado dq-customer-orders.yaml que tenga las siguientes características:
  • Una regla NOT NULL que se aplique a la columna user_id de la tabla customer_orders.ordered_items
  • Una regla NOT NULL que se aplique a la columna order_id de la tabla customer_orders.ordered_items
  1. Debes subir el archivo al bucket de Cloud Storage llamado -dq-config

Sugerencia útil para crear archivos de especificación de calidad de los datos:

Haz clic en Revisar mi progreso para verificar el objetivo. Crear y subir un archivo de especificación de calidad de los datos

Tarea 5: Define y ejecuta un trabajo de calidad de los datos en Dataplex

Ya se creó en este lab el conjunto de datos de BigQuery para el paso 1.

  1. Define un trabajo de calidad de los datos usando el archivo dq-customer-orders.yaml con las siguientes especificaciones:
Propiedad Valor
Nombre del trabajo de calidad de los datos Trabajo de calidad de los datos de pedidos del cliente
Tabla de destino de BigQuery para los resultados .orders_dq_dataset.results
Cuenta de servicio de usuario Cuenta de servicio predeterminada de Compute Engine
  1. Ejecuta de inmediato el trabajo de calidad de los datos.
El trabajo puede tardar varios minutos en ejecutarse. Es posible que debas actualizar la página para ver si el trabajo se ejecutó correctamente.

Sugerencia útil para definir y ejecutar los trabajos de calidad de los datos:

Haz clic en Revisar mi progreso para verificar el objetivo. Definir y ejecutar un trabajo de calidad de los datos en Dataplex

¡Felicitaciones!

Creaste una malla de datos con un lake de Dataplex con múltiples zonas y recursos, etiquetaste recursos en el nuevo lake y los evaluaste para determinar la calidad de los datos.

Obtén tu próxima insignia de habilidad

Este lab de autoaprendizaje es parte de la insignia de habilidad Crea una malla de datos con Dataplex. Si completas esta Quest, obtendrás la insignia de habilidad que se muestra arriba como reconocimiento de tu logro. Comparte la insignia en tu currículum y tus plataformas sociales, y anuncia tu logro con el hashtag #GoogleCloudBadge.

Esta insignia de habilidad es parte de la ruta de aprendizaje de Ingeniero de datos de Google Cloud. Si ya completaste las otras Quests con insignia de habilidad en esta ruta de aprendizaje, revisa el catálogo y encuentra otras Quests con insignia de habilidad en las que puedes inscribirte.

Capacitación y certificación de Google Cloud

Recibe la formación que necesitas para aprovechar al máximo las tecnologías de Google Cloud. Nuestras clases incluyen habilidades técnicas y recomendaciones para ayudarte a avanzar rápidamente y a seguir aprendiendo. Para que puedas realizar nuestros cursos cuando más te convenga, ofrecemos distintos tipos de capacitación de nivel básico a avanzado: a pedido, presenciales y virtuales. Las certificaciones te ayudan a validar y demostrar tus habilidades y tu conocimiento técnico respecto a las tecnologías de Google Cloud.

Actualización más reciente del manual: 18 de noviembre de 2024

Prueba más reciente del lab: 23 de julio de 2024

Copyright 2025 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.

Antes de comenzar

  1. Los labs crean un proyecto de Google Cloud y recursos por un tiempo determinado
  2. .
  3. Los labs tienen un límite de tiempo y no tienen la función de pausa. Si finalizas el lab, deberás reiniciarlo desde el principio.
  4. En la parte superior izquierda de la pantalla, haz clic en Comenzar lab para empezar

Este contenido no está disponible en este momento

Te enviaremos una notificación por correo electrónico cuando esté disponible

¡Genial!

Nos comunicaremos contigo por correo electrónico si está disponible

Un lab a la vez

Confirma para finalizar todos los labs existentes y comenzar este

Usa la navegación privada para ejecutar el lab

Usa una ventana de navegación privada o de Incógnito para ejecutar el lab. Así evitarás cualquier conflicto entre tu cuenta personal y la cuenta de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.