En este lab, trabajarás con el conjunto de datos Covertype y usarás TFX para analizar, comprender y procesar previamente el conjunto de datos, así como entrenar, analizar, validar y, luego, implementar un modelo de clasificación de clases múltiples para predecir el tipo de cobertura forestal a partir de atributos cartográficos.
Objetivos
Desarrollar una comprensión general de los componentes de canalizaciones de TFX
Aprender a usar un contexto interactivo de TFX para desarrollar prototipos de canalizaciones de TFX
Trabajar con la biblioteca TensorFlow Data Validation (TFDV) para verificar y analizar datos de entrada
Usar la biblioteca TensorFlow Transform (TFT) preprocesar datos escalables y transformar atributos
Usar la biblioteca TensorFlow Model Analysis (TFMA) para evaluar modelos
Configuración
En cada lab, recibirá un proyecto de Google Cloud y un conjunto de recursos nuevos por tiempo limitado y sin costo adicional.
Accede a Qwiklabs desde una ventana de incógnito.
Ten en cuenta el tiempo de acceso del lab (por ejemplo, 1:15:00) y asegúrate de finalizarlo en el plazo asignado.
No existe una función de pausa. Si lo necesita, puede reiniciar el lab, pero deberá hacerlo desde el comienzo.
Cuando esté listo, haga clic en Comenzar lab.
Anote las credenciales del lab (el nombre de usuario y la contraseña). Las usarás para acceder a la consola de Google Cloud.
Haga clic en Abrir Google Console.
Haga clic en Usar otra cuenta, copie las credenciales para este lab y péguelas en el mensaje emergente que aparece.
Si usa otras credenciales, se generarán errores o incurrirá en cargos.
Acepta las condiciones y omite la página de recursos de recuperación.
Active Cloud Shell
Cloud Shell es una máquina virtual que contiene herramientas de desarrollo y un directorio principal persistente de 5 GB. Se ejecuta en Google Cloud. Cloud Shell proporciona acceso de línea de comandos a sus recursos de Google Cloud. gcloud es la herramienta de línea de comandos de Google Cloud, la cual está preinstalada en Cloud Shell y es compatible con la función de autocompletado con tabulador.
En el panel de navegación de Google Cloud Console, haga clic en Activar Cloud Shell ().
Haga clic en Continuar.
El aprovisionamiento y la conexión al entorno tardan solo unos momentos. Una vez que se conecte, también estará autenticado, y el proyecto estará configurado con su PROJECT_ID. Por ejemplo:
Comandos de muestra
Si desea ver el nombre de cuenta activa, use este comando:
A continuación, crea una cuenta de servicio personalizada para otorgar acceso al servicio de AI Platform Vizier al trabajo de entrenamiento de CAIP para ajustar los hiperparámetros de las canalizaciones:
SERVICE_ACCOUNT_ID=tfx-tuner-caip-service-account
gcloud iam service-accounts create $SERVICE_ACCOUNT_ID \
--description="A custom service account for CAIP training job to access AI Platform Vizier service for pipeline hyperparameter tuning." \
--display-name="TFX Tuner CAIP Vizier"
Otorga a la cuenta de servicio de AI Platform permisos adicionales de acceso al servicio de AI Platform Vizier para ajustar los hiperparámetros de las canalizaciones:
Otorga a la cuenta de servicio de AI Platform administrada por Google el rol Administrador de cuenta de servicio para tu cuenta de servicio de AI Platform:
gcloud iam service-accounts add-iam-policy-binding \
--role=roles/iam.serviceAccountAdmin \
--member=serviceAccount:service-${PROJECT_NUMBER}@cloud-ml.google.com.iam.gserviceaccount.com \
${SERVICE_ACCOUNT_ID}@${PROJECT_ID}.iam.gserviceaccount.com
Haga clic en Revisar mi progreso para verificar el objetivo.
Habilitar los servicios de Cloud
Tarea 2: Crea una instancia de AI Platform Pipelines
En el menú de navegación, desplázate hacia abajo hasta AI Platform y fija la sección para acceder a ella con más facilidad en etapas posteriores del lab.
Haz clic en Canalizaciones.
Luego, haz clic en Nueva instancia.
Haz clic en Configurar.
En la página de Kubeflow Pipelines, marca Permitir el acceso a las siguientes APIs de Cloud, deja el nombre como está y, luego, haz clic en Crear un nuevo clúster.
El proceso debería tardar entre 2 y 3 minutos en completarse. Espera a que finalice el clúster para continuar con el siguiente paso. En la primera pestaña abierta, puedes ver el proceso de creación del clúster en la sección de GKE de la consola de Cloud o ver las VMs individuales que se están inicializando en la sección de GCE de la consola de Cloud.
Cuando la creación del clúster haya finalizado, marque la casilla Condiciones del Servicio, deje los otros parámetros de configuración sin modificar y, luego, haga clic en Implementar. Verá los servicios individuales de KFP implementados en su clúster de GKE.
Continúa con el siguiente paso mientras se ejecuta la instalación.
Haz clic en Revisar mi progreso para verificar el objetivo.
Crear una instancia de AI Platform Pipelines
Tarea 3: Crea una instancia de AI Platform Notebooks de Cloud
En Cloud Shell, ejecuta los siguientes comandos para crear un notebook administrado por el usuario:
Haz clic en el Menú de navegación. Navega a Vertex AI y selecciona Workbench.
Haz clic en NOTEBOOKS ADMINISTRADOS POR EL USUARIO.
La creación del notebook tardará entre 2 y 3 minutos en completarse.
Haz clic en Abrir JupyterLab junto al nombre de tu notebook. Se abrirá una ventana de JupyterLab en una pestaña nueva.
Haz clic en Revisar mi progreso para verificar el objetivo.
Crear una instancia de AI Platform Notebooks de Cloud
Tarea 4: Clona el repo de ejemplo en tu instancia de AI Platform Notebooks
Sigue estos pasos para clonar el notebook mlops-on-gcp en tu instancia de JupyterLab:
En JupyterLab, haz clic en el ícono de terminal para abrir una terminal nueva.
En la ventana de línea de comandos, ingresa el siguiente comando y presiona Intro:
git clone https://github.com/GoogleCloudPlatform/mlops-on-gcp
Nota: Si el repo clonado no aparece en la IU de JupyterLab, puedes usar el menú de la línea superior, y en Git > Clone a repository, clona el repo (https://github.com/GoogleCloudPlatform/mlops-on-gcp) usando la IU.
Para verificar que se haya clonado el repositorio, haz doble clic en el directorio mlops-on-gcp y confirma que puedes ver su contenido. Los archivos de los labs de Jupyter basados en notebooks de este curso se encuentran en este directorio.
Navega al notebook de ejemplo
En JupyterLab, abre una terminal y ejecuta los siguientes comandos:
cd mlops-on-gcp/workshops/tfx-caip-tf23
./install.sh
Nota: Ignora las advertencias de incompatibilidad de pip y los errores de cliente 404.
A continuación, en AI Platform Notebooks, navega a mlops-on-gcp/workshops/tfx-caip-tf23/lab-01-tfx-walkthrough/labs y abre lab-01.ipynb.
Borra todas las celdas en el notebook (Editar > Borrar todos los resultados) y, luego, ejecútalas una por una.
Cuando se te solicite, regresa a estas instrucciones para verificar tu progreso.
Si necesitas más ayuda, puedes consultar la solución completa. Para ello, navega a mlops-on-gcp/workshops/tfx-caip-tf23/lab-01-tfx-walkthrough/solutions y abre lab-01.ipynb.
Haz clic en Revisar mi progreso para verificar el objetivo.
Clonar el repo de ejemplo en la instancia de AI Platform Notebooks
Tarea 5: Ejecuta tu trabajo de entrenamiento en la nube
Prueba las tareas completadas: Configura y ejecuta CsvExampleGen
Haz clic en Revisar mi progreso para verificar el objetivo.
Configurar y ejecutar CsvExampleGen
Prueba la tarea completada: Crea y ejecuta el componente de entrenamiento
Haz clic en Revisar mi progreso para verificar el objetivo.
Crear y ejecutar el componente de entrenamiento
¡Felicitaciones!
Así finaliza la explicación introductoria sobre los componentes de canalizaciones de TFX. En el lab, usaste TFX para analizar, comprender y preprocesar el conjunto de datos, así como entrenar, analizar, validar y, luego, implementar un modelo de clasificación de clases múltiples para predecir el tipo de cobertura forestal a partir de atributos cartográficos.
Finalice su lab
Cuando haya completado su lab, haga clic en Finalizar lab. Qwiklabs quitará los recursos que usó y limpiará la cuenta por usted.
Tendrá la oportunidad de calificar su experiencia en el lab. Seleccione la cantidad de estrellas que corresponda, ingrese un comentario y haga clic en Enviar.
La cantidad de estrellas indica lo siguiente:
1 estrella = Muy insatisfecho
2 estrellas = Insatisfecho
3 estrellas = Neutral
4 estrellas = Satisfecho
5 estrellas = Muy satisfecho
Puede cerrar el cuadro de diálogo si no desea proporcionar comentarios.
Para enviar comentarios, sugerencias o correcciones, use la pestaña Asistencia.
Copyright 2020 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.
Los labs crean un proyecto de Google Cloud y recursos por un tiempo determinado
.
Los labs tienen un límite de tiempo y no tienen la función de pausa. Si finalizas el lab, deberás reiniciarlo desde el principio.
En la parte superior izquierda de la pantalla, haz clic en Comenzar lab para empezar
Usa la navegación privada
Copia el nombre de usuario y la contraseña proporcionados para el lab
Haz clic en Abrir la consola en modo privado
Accede a la consola
Accede con tus credenciales del lab. Si usas otras credenciales, se generarán errores o se incurrirá en cargos.
Acepta las condiciones y omite la página de recursos de recuperación
No hagas clic en Finalizar lab, a menos que lo hayas terminado o quieras reiniciarlo, ya que se borrará tu trabajo y se quitará el proyecto
Este contenido no está disponible en este momento
Te enviaremos una notificación por correo electrónico cuando esté disponible
¡Genial!
Nos comunicaremos contigo por correo electrónico si está disponible
Un lab a la vez
Confirma para finalizar todos los labs existentes y comenzar este
Usa la navegación privada para ejecutar el lab
Usa una ventana de navegación privada o de Incógnito para ejecutar el lab. Así
evitarás cualquier conflicto entre tu cuenta personal y la cuenta
de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.
En este lab, se le explicará cómo configurar y ejecutar los componentes estándar de TFX. El objetivo principal del lab es obtener una comprensión general de la función y el uso de cada uno de los componentes. Trabajará en un Cloud AI Platform Notebook en modo interactivo, lo que es típico para un flujo de trabajo de prototipado de canalizaciones de TFX.
Duración:
0 min de configuración
·
Acceso por 120 min
·
120 min para completar