En un lab de desafío, se le proporcionarán una situación y un conjunto de tareas. En lugar de seguir instrucciones paso a paso, deberás utilizar las habilidades aprendidas en los labs del curso para decidir cómo completar las tareas por tu cuenta. Un sistema automatizado de puntuación (en esta página) mostrará comentarios y determinará si completaste tus tareas correctamente.
En un lab de desafío, no se explican conceptos nuevos de Google Cloud, sino que se espera que amplíes las habilidades que adquiriste, como cambiar los valores predeterminados y leer o investigar los mensajes de error para corregir sus propios errores.
Debe completar correctamente todas las tareas dentro del período establecido para obtener una puntuación del 100%.
Lee estas instrucciones. Los labs cuentan con un temporizador que no se puede pausar. El temporizador, que comienza a funcionar cuando haces clic en Comenzar lab, indica por cuánto tiempo tendrás a tu disposición los recursos de Google Cloud.
Este lab práctico te permitirá realizar las actividades correspondientes en un entorno de nube real, no en uno de simulación o demostración. Para ello, se te proporcionan credenciales temporales nuevas que utilizarás para acceder a Google Cloud durante todo el lab.
Para completar este lab, necesitarás lo siguiente:
Acceso a un navegador de Internet estándar. Se recomienda el navegador Chrome.
Nota: Usa una ventana del navegador privada o de incógnito (opción recomendada) para ejecutar el lab. Así evitarás conflictos entre tu cuenta personal y la cuenta de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.
Tiempo para completar el lab (recuerda que, una vez que comienzas un lab, no puedes pausarlo).
Nota: Usa solo la cuenta de estudiante para este lab. Si usas otra cuenta de Google Cloud, es posible que se apliquen cargos a esa cuenta.
Situación del desafío
Recién comienzas a desempeñarte en tu rol como ingeniero júnior de datos. Hasta ahora, estuviste ayudando a los equipos a crear y administrar recursos de Dataplex.
Se espera que tengas las habilidades y el conocimiento necesarios para realizar estas tareas.
Tu desafío
Se te solicitó ayudar a un equipo de desarrollo recién formado con la creación de una nueva malla de datos usando Dataplex. En específico, debes crear un lake de Dataplex con múltiples zonas y recursos. También debes etiquetar recursos en el nuevo lake y evaluar la calidad de sus datos. Te pidieron llevar a cabo las siguientes tareas:
Crear un lake de Dataplex con dos zonas y dos recursos
Crear y aplicar una plantilla de etiquetas para etiquetar una zona completa como datos protegidos
Asignarle un rol de IAM de Dataplex a otro usuario
Crear un archivo de especificación de calidad de los datos y subirlo a Cloud Storage
Definir y ejecutar un trabajo de calidad de los datos en Dataplex
Estos son algunos estándares que debes seguir:
Asegúrate de que todas las APIs necesarias (como Dataplex, Data Catalog y Dataproc) están habilitadas correctamente.
Crea todos los recursos en la región , a menos que se indique lo contrario.
A continuación, se describe cada tarea en detalle. ¡Buena suerte!
Tarea 1: Crea un lake de Dataplex con dos zonas y dos recursos
Nota: Para todas las tareas de este lab de desafío, crea los recursos en la región , a menos que se indique lo contrario.
Ya se crearon en este lab el bucket de Cloud Storage y el conjunto de datos de BigQuery para el paso 2.
Crea un lake de Dataplex llamado Sales Lake con las siguientes dos zonas regionales:
Una zona sin procesar con el nombre Raw Customer Zone
Una zona seleccionada con el nombre Curated Customer Zone
Conecta un recurso creado previamente a cada zona:
En la zona sin procesar, conecta el bucket de Cloud Storage llamado -customer-online-sessions como un nuevo recurso con el nombre Customer Engagements.
En la zona seleccionada, conecta el conjunto de datos de BigQuery llamado .customer_orders como un nuevo recurso con el nombre Customer Orders.
Sugerencia útil para crear un lake de Dataplex:
Haz clic en Revisar mi progreso para verificar el objetivo.
Crear un lake de Dataplex con dos zonas y dos recursos
Tarea 2: Crea y aplica una plantilla de etiqueta a una zona
Crea una plantilla de etiquetas pública con el nombre Protected Customer Data Template con dos campos enumerados:
El primer campo llamado Raw Data Flag con dos valores: Yes y No.
El segundo campo llamado Protected Contact Information Flag con dos valores: Yes y No
Usa esta plantilla para etiquetar la Raw Customer Zone con un valor de Yes para ambas marcas.
Sugerencia útil para crear y aplicar plantillas de etiquetas:
Haz clic en Revisar mi progreso para verificar el objetivo.
Crear y aplicar una plantilla de etiqueta a una zona
Tarea 3: Asígnale un rol de IAM de Dataplex a otro usuario
Usa el principio de privilegio mínimo para asignarle el rol de IAM de Dataplex adecuado al Usuario 2 (), que permite subir nuevos archivos de Cloud Storage al recurso de Dataplex llamado Customer Engagements.
Sugerencia útil para asignar roles de IAM de Dataplex:
Haz clic en Revisar mi progreso para verificar el objetivo.
Asignarle un rol de IAM de Dataplex a otro usuario
Tarea 4: Crea un archivo de especificación de calidad de los datos y súbelo a Cloud Storage
Ya se creó en este lab el bucket de Cloud Storage para el paso 2.
Crea un archivo de especificación de calidad de los datos llamado dq-customer-orders.yaml que tenga las siguientes características:
Una regla NOT NULL que se aplique a la columna user_id de la tabla customer_orders.ordered_items
Una regla NOT NULL que se aplique a la columna order_id de la tabla customer_orders.ordered_items
Debes subir el archivo al bucket de Cloud Storage llamado -dq-config
Sugerencia útil para crear archivos de especificación de calidad de los datos:
Haz clic en Revisar mi progreso para verificar el objetivo.
Crear y subir un archivo de especificación de calidad de los datos
Tarea 5: Define y ejecuta un trabajo de calidad de los datos en Dataplex
Ya se creó en este lab el conjunto de datos de BigQuery para el paso 1.
Define un trabajo de calidad de los datos usando el archivo dq-customer-orders.yaml con las siguientes especificaciones:
Propiedad
Valor
Nombre del trabajo de calidad de los datos
Trabajo de calidad de los datos de pedidos del cliente
Tabla de destino de BigQuery para los resultados
.orders_dq_dataset.results
Cuenta de servicio de usuario
Cuenta de servicio predeterminada de Compute Engine
Ejecuta de inmediato el trabajo de calidad de los datos.
El trabajo puede tardar varios minutos en ejecutarse. Es posible que debas actualizar la página para ver si el trabajo se ejecutó correctamente.
Sugerencia útil para definir y ejecutar los trabajos de calidad de los datos:
Haz clic en Revisar mi progreso para verificar el objetivo.
Definir y ejecutar un trabajo de calidad de los datos en Dataplex
¡Felicitaciones!
Creaste una malla de datos con un lake de Dataplex con múltiples zonas y recursos, etiquetaste recursos en el nuevo lake y los evaluaste para determinar la calidad de los datos.
Obtén tu próxima insignia de habilidad
Este lab de autoaprendizaje es parte de la insignia de habilidad Crea una malla de datos con Dataplex. Si completas esta Quest, obtendrás la insignia de habilidad que se muestra arriba como reconocimiento de tu logro. Comparte la insignia en tu currículum y tus plataformas sociales, y anuncia tu logro con el hashtag #GoogleCloudBadge.
Esta insignia de habilidad es parte de la ruta de aprendizaje de Ingeniero de datos de Google Cloud. Si ya completaste las otras Quests con insignia de habilidad en esta ruta de aprendizaje, revisa el catálogo y encuentra otras Quests con insignia de habilidad en las que puedes inscribirte.
Capacitación y certificación de Google Cloud
Recibe la formación que necesitas para aprovechar al máximo las tecnologías de Google Cloud. Nuestras clases incluyen habilidades técnicas y recomendaciones para ayudarte a avanzar rápidamente y a seguir aprendiendo. Para que puedas realizar nuestros cursos cuando más te convenga, ofrecemos distintos tipos de capacitación de nivel básico a avanzado: a pedido, presenciales y virtuales. Las certificaciones te ayudan a validar y demostrar tus habilidades y tu conocimiento técnico respecto a las tecnologías de Google Cloud.
Actualización más reciente del manual: 18 de noviembre de 2024
Prueba más reciente del lab: 23 de julio de 2024
Copyright 2025 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.
Los labs crean un proyecto de Google Cloud y recursos por un tiempo determinado
.
Los labs tienen un límite de tiempo y no tienen la función de pausa. Si finalizas el lab, deberás reiniciarlo desde el principio.
En la parte superior izquierda de la pantalla, haz clic en Comenzar lab para empezar
Usa la navegación privada
Copia el nombre de usuario y la contraseña proporcionados para el lab
Haz clic en Abrir la consola en modo privado
Accede a la consola
Accede con tus credenciales del lab. Si usas otras credenciales, se generarán errores o se incurrirá en cargos.
Acepta las condiciones y omite la página de recursos de recuperación
No hagas clic en Finalizar lab, a menos que lo hayas terminado o quieras reiniciarlo, ya que se borrará tu trabajo y se quitará el proyecto
Este contenido no está disponible en este momento
Te enviaremos una notificación por correo electrónico cuando esté disponible
¡Genial!
Nos comunicaremos contigo por correo electrónico si está disponible
Un lab a la vez
Confirma para finalizar todos los labs existentes y comenzar este
Usa la navegación privada para ejecutar el lab
Usa una ventana de navegación privada o de Incógnito para ejecutar el lab. Así
evitarás cualquier conflicto entre tu cuenta personal y la cuenta
de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.
Este lab de desafío pone a prueba tus habilidades y conocimientos obtenidos de los labs de la insignia de habilidad Crea una malla de datos con Dataplex. Debes conocer el contenido de esos labs antes de realizar este.
Duración:
1 min de configuración
·
Acceso por 90 min
·
90 min para completar