Puntos de control
Enable cloud service
/ 30
Create an instance of AI Platform Pipelines
/ 10
Create an instance of Cloud AI Platform Notebooks.
/ 10
Clone the example repo within AI Platform Notebooks instance
/ 5
Configure and run CsvExampleGen
/ 10
Create and run training component
/ 10
Explicación de componentes estándar de TFX
- Descripción general
- Configuración
- Tarea 1: Habilita los servicios de Cloud
- Tarea 2: Crea una instancia de AI Platform Pipelines
- Tarea 3: Crea una instancia de AI Platform Notebooks de Cloud
- Tarea 4: Clona el repo de ejemplo en tu instancia de AI Platform Notebooks
- Tarea 5: Ejecuta tu trabajo de entrenamiento en la nube
- ¡Felicitaciones!
- Finalice su lab
Descripción general
En este lab, trabajarás con el conjunto de datos Covertype y usarás TFX para analizar, comprender y procesar previamente el conjunto de datos, así como entrenar, analizar, validar y, luego, implementar un modelo de clasificación de clases múltiples para predecir el tipo de cobertura forestal a partir de atributos cartográficos.
Objetivos
- Desarrollar una comprensión general de los componentes de canalizaciones de TFX
- Aprender a usar un contexto interactivo de TFX para desarrollar prototipos de canalizaciones de TFX
- Trabajar con la biblioteca TensorFlow Data Validation (TFDV) para verificar y analizar datos de entrada
- Usar la biblioteca TensorFlow Transform (TFT) preprocesar datos escalables y transformar atributos
- Usar la biblioteca TensorFlow Model Analysis (TFMA) para evaluar modelos
Configuración
En cada lab, recibirá un proyecto de Google Cloud y un conjunto de recursos nuevos por tiempo limitado y sin costo adicional.
-
Accede a Qwiklabs desde una ventana de incógnito.
-
Ten en cuenta el tiempo de acceso del lab (por ejemplo,
1:15:00
) y asegúrate de finalizarlo en el plazo asignado.
No existe una función de pausa. Si lo necesita, puede reiniciar el lab, pero deberá hacerlo desde el comienzo. -
Cuando esté listo, haga clic en Comenzar lab.
-
Anote las credenciales del lab (el nombre de usuario y la contraseña). Las usarás para acceder a la consola de Google Cloud.
-
Haga clic en Abrir Google Console.
-
Haga clic en Usar otra cuenta, copie las credenciales para este lab y péguelas en el mensaje emergente que aparece.
Si usa otras credenciales, se generarán errores o incurrirá en cargos. -
Acepta las condiciones y omite la página de recursos de recuperación.
Active Cloud Shell
Cloud Shell es una máquina virtual que contiene herramientas de desarrollo y un directorio principal persistente de 5 GB. Se ejecuta en Google Cloud. Cloud Shell proporciona acceso de línea de comandos a sus recursos de Google Cloud. gcloud
es la herramienta de línea de comandos de Google Cloud, la cual está preinstalada en Cloud Shell y es compatible con la función de autocompletado con tabulador.
-
En el panel de navegación de Google Cloud Console, haga clic en Activar Cloud Shell ().
-
Haga clic en Continuar.
El aprovisionamiento y la conexión al entorno tardan solo unos momentos. Una vez que se conecte, también estará autenticado, y el proyecto estará configurado con su PROJECT_ID. Por ejemplo:
Comandos de muestra
-
Si desea ver el nombre de cuenta activa, use este comando:
(Resultado)
(Resultado de ejemplo)
-
Si desea ver el ID del proyecto, use este comando:
(Resultado)
(Resultado de ejemplo)
Tarea 1: Habilita los servicios de Cloud
- En Cloud Shell, ejecuta el siguiente comando para establecer el ID de proyecto como el de tu proyecto de Google Cloud:
- Luego, ejecuta los siguientes comandos para habilitar los servicios de Cloud necesarios:
- Después, agrega el permiso Editor a tu cuenta de servicio de Cloud Build:
- A continuación, crea una cuenta de servicio personalizada para otorgar acceso al servicio de AI Platform Vizier al trabajo de entrenamiento de CAIP para ajustar los hiperparámetros de las canalizaciones:
- Otorga a la cuenta de servicio de AI Platform permisos adicionales de acceso al servicio de AI Platform Vizier para ajustar los hiperparámetros de las canalizaciones:
- Otorga a la cuenta de servicio acceso al rol Administrador de objetos de almacenamiento:
- Otorga a la cuenta de servicio acceso al rol AI Platform Vizier:
- Otorga a la cuenta de servicio de AI Platform administrada por Google el rol Administrador de cuenta de servicio para tu cuenta de servicio de AI Platform:
Haga clic en Revisar mi progreso para verificar el objetivo.
Tarea 2: Crea una instancia de AI Platform Pipelines
- En el menú de navegación, desplázate hacia abajo hasta AI Platform y fija la sección para acceder a ella con más facilidad en etapas posteriores del lab.
- Haz clic en Canalizaciones.
- Luego, haz clic en Nueva instancia.
- Haz clic en Configurar.
- En la página de Kubeflow Pipelines, marca Permitir el acceso a las siguientes APIs de Cloud, deja el nombre como está y, luego, haz clic en Crear un nuevo clúster.
El proceso debería tardar entre 2 y 3 minutos en completarse. Espera a que finalice el clúster para continuar con el siguiente paso. En la primera pestaña abierta, puedes ver el proceso de creación del clúster en la sección de GKE de la consola de Cloud o ver las VMs individuales que se están inicializando en la sección de GCE de la consola de Cloud.
- Cuando la creación del clúster haya finalizado, marque la casilla Condiciones del Servicio, deje los otros parámetros de configuración sin modificar y, luego, haga clic en Implementar. Verá los servicios individuales de KFP implementados en su clúster de GKE.
Continúa con el siguiente paso mientras se ejecuta la instalación.
Haz clic en Revisar mi progreso para verificar el objetivo.
Tarea 3: Crea una instancia de AI Platform Notebooks de Cloud
- En Cloud Shell, ejecuta los siguientes comandos para crear un notebook administrado por el usuario:
-
Haz clic en el Menú de navegación. Navega a Vertex AI y selecciona Workbench.
-
Haz clic en NOTEBOOKS ADMINISTRADOS POR EL USUARIO.
La creación del notebook tardará entre 2 y 3 minutos en completarse.
-
Haz clic en Abrir JupyterLab junto al nombre de tu notebook. Se abrirá una ventana de JupyterLab en una pestaña nueva.
Haz clic en Revisar mi progreso para verificar el objetivo.
Tarea 4: Clona el repo de ejemplo en tu instancia de AI Platform Notebooks
Sigue estos pasos para clonar el notebook mlops-on-gcp
en tu instancia de JupyterLab:
-
En JupyterLab, haz clic en el ícono de terminal para abrir una terminal nueva.
-
En la ventana de línea de comandos, ingresa el siguiente comando y presiona Intro:
git clone https://github.com/GoogleCloudPlatform/mlops-on-gcp Nota: Si el repo clonado no aparece en la IU de JupyterLab, puedes usar el menú de la línea superior, y en Git > Clone a repository, clona el repo (https://github.com/GoogleCloudPlatform/mlops-on-gcp) usando la IU. -
Para verificar que se haya clonado el repositorio, haz doble clic en el directorio
mlops-on-gcp
y confirma que puedes ver su contenido. Los archivos de los labs de Jupyter basados en notebooks de este curso se encuentran en este directorio.
Navega al notebook de ejemplo
- En JupyterLab, abre una terminal y ejecuta los siguientes comandos:
-
A continuación, en AI Platform Notebooks, navega a
mlops-on-gcp/workshops/tfx-caip-tf23/lab-01-tfx-walkthrough/labs
y abrelab-01.ipynb
. -
Borra todas las celdas en el notebook (Editar > Borrar todos los resultados) y, luego, ejecútalas una por una.
-
Cuando se te solicite, regresa a estas instrucciones para verificar tu progreso.
Si necesitas más ayuda, puedes consultar la solución completa. Para ello, navega a mlops-on-gcp/workshops/tfx-caip-tf23/lab-01-tfx-walkthrough/solutions
y abre lab-01.ipynb
.
Haz clic en Revisar mi progreso para verificar el objetivo.
Tarea 5: Ejecuta tu trabajo de entrenamiento en la nube
Prueba las tareas completadas: Configura y ejecuta CsvExampleGen
Haz clic en Revisar mi progreso para verificar el objetivo.
Prueba la tarea completada: Crea y ejecuta el componente de entrenamiento
Haz clic en Revisar mi progreso para verificar el objetivo.
¡Felicitaciones!
Así finaliza la explicación introductoria sobre los componentes de canalizaciones de TFX. En el lab, usaste TFX para analizar, comprender y preprocesar el conjunto de datos, así como entrenar, analizar, validar y, luego, implementar un modelo de clasificación de clases múltiples para predecir el tipo de cobertura forestal a partir de atributos cartográficos.
Finalice su lab
Cuando haya completado su lab, haga clic en Finalizar lab. Qwiklabs quitará los recursos que usó y limpiará la cuenta por usted.
Tendrá la oportunidad de calificar su experiencia en el lab. Seleccione la cantidad de estrellas que corresponda, ingrese un comentario y haga clic en Enviar.
La cantidad de estrellas indica lo siguiente:
- 1 estrella = Muy insatisfecho
- 2 estrellas = Insatisfecho
- 3 estrellas = Neutral
- 4 estrellas = Satisfecho
- 5 estrellas = Muy satisfecho
Puede cerrar el cuadro de diálogo si no desea proporcionar comentarios.
Para enviar comentarios, sugerencias o correcciones, use la pestaña Asistencia.
Copyright 2020 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.