arrow_back

Crea una malla de datos con Dataplex: Lab de desafío

Acceder Unirse
Pon a prueba tus conocimientos y compártelos con nuestra comunidad
done
Obtén acceso a más de 700 labs prácticos, insignias de habilidad y cursos

Crea una malla de datos con Dataplex: Lab de desafío

Lab 1 hora 30 minutos universal_currency_alt 1 crédito show_chart Introductorio
info Es posible que este lab incorpore herramientas de IA para facilitar tu aprendizaje.
Pon a prueba tus conocimientos y compártelos con nuestra comunidad
done
Obtén acceso a más de 700 labs prácticos, insignias de habilidad y cursos

GSP514

Labs de autoaprendizaje de Google Cloud

Descripción general

En un lab de desafío, se le proporcionarán una situación y un conjunto de tareas. En lugar de seguir instrucciones paso a paso, deberás utilizar las habilidades aprendidas en los labs del curso para decidir cómo completar las tareas por tu cuenta. Un sistema automatizado de puntuación (en esta página) mostrará comentarios y determinará si completaste tus tareas correctamente.

En un lab de desafío, no se explican conceptos nuevos de Google Cloud, sino que se espera que amplíes las habilidades que adquiriste, como cambiar los valores predeterminados y leer o investigar los mensajes de error para corregir sus propios errores.

Debe completar correctamente todas las tareas dentro del período establecido para obtener una puntuación del 100%.

Configuración

Antes de hacer clic en el botón Comenzar lab

Lee estas instrucciones. Los labs son cronometrados y no se pueden pausar. El cronómetro, que comienza a funcionar cuando haces clic en Comenzar lab, indica por cuánto tiempo tendrás a tu disposición los recursos de Google Cloud.

Este lab práctico te permitirá realizar las actividades correspondientes en un entorno de nube real, no en uno de simulación o demostración. Para ello, se te proporcionan credenciales temporales nuevas que utilizarás para acceder a Google Cloud durante todo el lab.

Para completar este lab, necesitarás lo siguiente:

  • Acceso a un navegador de Internet estándar (se recomienda el navegador Chrome)
Nota: Usa una ventana de navegador privada o de Incógnito para ejecutar este lab. Así evitarás cualquier conflicto entre tu cuenta personal y la cuenta de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.
  • Tiempo para completar el lab: Recuerda que, una vez que comienzas un lab, no puedes pausarlo.
Nota: Si ya tienes un proyecto o una cuenta personal de Google Cloud, no los uses en este lab para evitar cargos adicionales en tu cuenta.

Situación del desafío

Recién comienzas a desempeñarte en tu rol como ingeniero júnior de datos. Hasta ahora, estuviste ayudando a los equipos a crear y administrar recursos de Dataplex.

Se espera que tengas las habilidades y el conocimiento necesarios para realizar estas tareas.

Tu desafío

Se te solicitó ayudar a un equipo de desarrollo recién formado con la creación de una nueva malla de datos usando Dataplex. En específico, debes crear un lake de Dataplex con múltiples zonas y recursos. También debes etiquetar recursos en el nuevo lake y evaluar la calidad de sus datos. Te pidieron llevar a cabo las siguientes tareas:

  • Crear un lake de Dataplex con dos zonas y dos recursos
  • Crear y aplicar una plantilla de etiquetas para etiquetar una zona completa como datos protegidos
  • Asignarle un rol de IAM de Dataplex a otro usuario
  • Crear un archivo de especificación de calidad de los datos y subirlo a Cloud Storage
  • Definir y ejecutar un trabajo de calidad de los datos en Dataplex

Estos son algunos estándares que debes seguir:

  • Asegúrate de que todas las APIs necesarias (como Dataplex, Data Catalog y Dataproc) están habilitadas correctamente.
  • Crea todos los recursos en la región , a menos que se indique lo contrario.

A continuación, se describe cada tarea en detalle. ¡Buena suerte!

Tarea 1: Crea un lake de Dataplex con dos zonas y dos recursos

Ya se crearon en este lab el bucket de Cloud Storage y el conjunto de datos de BigQuery para el paso 2.

  1. Crea un lake de Dataplex llamado Sales Lake con las siguientes dos zonas regionales:
  • Una zona sin procesar con el nombre Raw Customer Zone
  • Una zona seleccionada con el nombre Curated Customer Zone
  1. Conecta un recurso creado previamente a cada zona:
  • En la zona sin procesar, conecta el bucket de Cloud Storage llamado -customer-online-sessions como un nuevo recurso con el nombre Customer Engagements.
  • En la zona seleccionada, conecta el conjunto de datos de BigQuery llamado .customer_orders como un nuevo recurso con el nombre Customer Orders.

Haz clic en Revisar mi progreso para verificar el objetivo. Crear un lake de Dataplex con dos zonas y dos recursos

Tarea 2: Crea y aplica una plantilla de etiqueta a una zona

  1. Crea una plantilla de etiquetas pública con el nombre Protected Customer Data Template con dos campos enumerados:
  • El primer campo llamado Raw Data Flag con dos valores: Yes y No.
  • El segundo campo llamado Protected Contact Information Flag con dos valores: Yes y No
  1. Usa esta plantilla para etiquetar la Raw Customer Zone con un valor de Yes para ambas marcas.

Haz clic en Revisar mi progreso para verificar el objetivo. Crear y aplicar una plantilla de etiqueta a una zona

Tarea 3: Asígnale un rol de IAM de Dataplex a otro usuario

  • Usa el principio de privilegio mínimo para asignarle el rol de IAM de Dataplex al Usuario 2 (), que permite subir nuevos archivos de Cloud Storage al recurso de Dataplex llamado Customer Engagements.

Haz clic en Revisar mi progreso para verificar el objetivo. Asignarle un rol de IAM de Dataplex a otro usuario

Tarea 4: Crea un archivo de especificación de calidad de los datos y súbelo a Cloud Storage

Ya se creó en este lab el bucket de Cloud Storage para el paso 2.

  1. Crea un archivo de especificación de calidad de los datos llamado dq-customer-orders.yaml que tenga las siguientes características:
  • Una regla NOT NULL que se aplique a la columna user_id de la tabla customer_orders.ordered_items
  • Una regla NOT NULL que se aplique a la columna order_id de la tabla customer_orders.ordered_items
  1. Debes subir el archivo al bucket de Cloud Storage llamado -dq-config

Haz clic en Revisar mi progreso para verificar el objetivo. Crear y subir un archivo de especificación de calidad de los datos

Tarea 5: Define y ejecuta un trabajo de calidad de los datos en Dataplex

Ya se creó en este lab el conjunto de datos de BigQuery para el paso 1.

  1. Define un trabajo de calidad de los datos usando el archivo dq-customer-orders.yaml con las siguientes especificaciones:
Propiedad Valor
Nombre del trabajo de calidad de los datos Trabajo de calidad de los datos de pedidos del cliente
Tabla de destino de BigQuery para los resultados .orders_dq_dataset.results
Cuenta de servicio de usuario Cuenta de servicio predeterminada de Compute Engine
  1. Ejecuta de inmediato el trabajo de calidad de los datos.
El trabajo puede tardar varios minutos en ejecutarse. Es posible que debas actualizar la página para ver si el trabajo se ejecutó correctamente.

Haz clic en Revisar mi progreso para verificar el objetivo. Definir y ejecutar un trabajo de calidad de los datos en Dataplex

¡Felicitaciones!

Insignia de Build a Data Mesh with Dataplex

Obtén tu próxima insignia de habilidad

Este lab de autoaprendizaje es parte de la Quest para obtener la insignia de habilidad Build a Data Mesh with Dataplex. Si completas esta Quest, obtendrás la insignia de habilidad que se muestra arriba como reconocimiento de tu logro. Comparte la insignia en tu currículum y tus plataformas de redes sociales, y anuncia tu logro con el hashtag #GoogleCloudBadge.

Capacitación y certificación de Google Cloud

Recibe la formación que necesitas para aprovechar al máximo las tecnologías de Google Cloud. Nuestras clases incluyen habilidades técnicas y recomendaciones para ayudarte a avanzar rápidamente y a seguir aprendiendo. Para que puedas realizar nuestros cursos cuando más te convenga, ofrecemos distintos tipos de capacitación de nivel básico a avanzado: a pedido, presenciales y virtuales. Las certificaciones te ayudan a validar y demostrar tus habilidades y tu conocimiento técnico respecto a las tecnologías de Google Cloud.

Última actualización del manual: 4 de julio de 2023

Prueba más reciente del lab: 4 de julio de 2023

Copyright 2024 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.

Este contenido no está disponible en este momento

Te enviaremos una notificación por correo electrónico cuando esté disponible

¡Genial!

Nos comunicaremos contigo por correo electrónico si está disponible