arrow_back

Vertex AI: Cómo predecir el riesgo de los préstamos con AutoML

Acceder Unirse
Quick tip: Review the prerequisites before you run the lab
Use an Incognito or private browser window to run this lab. This prevents any conflicts between your personal account and the student account, which may cause extra charges incurred to your personal account.
Pon a prueba tus conocimientos y compártelos con nuestra comunidad
done
Obtén acceso a más de 700 labs prácticos, insignias de habilidad y cursos

Vertex AI: Cómo predecir el riesgo de los préstamos con AutoML

Lab 1 hora universal_currency_alt 5 créditos show_chart Introductorio
info Es posible que este lab incorpore herramientas de IA para facilitar tu aprendizaje.
Pon a prueba tus conocimientos y compártelos con nuestra comunidad
done
Obtén acceso a más de 700 labs prácticos, insignias de habilidad y cursos

Descripción general

En este lab, usarás Vertex AI para entrenar y entregar un modelo de aprendizaje automático que pueda predecir el riesgo de un préstamo con un conjunto de datos tabular.

Objetivos

Aprenderás a hacer lo siguiente:

  • Subir un conjunto de datos a Vertex AI
  • Entrenar un modelo de aprendizaje automático con AutoML
  • Evaluar el rendimiento del modelo
  • Implementar el modelo en un extremo
  • Obtener predicciones

Configuración

Antes de hacer clic en el botón Comenzar lab

Lea estas instrucciones. Los labs tienen un tiempo límite; no puede ponerlos en pausa. El cronómetro, que comienza a funcionar cuando hace clic en Comenzar lab, indica por cuánto tiempo estarán los recursos en la nube a su disposición.

Este lab práctico de Qwiklabs le permitirá llevar a cabo las actividades correspondientes en un entorno de nube real, no en uno de simulación o demostración. Para ello, recibe nuevas credenciales temporales que utilizará para acceder a Google Cloud Platform durante el transcurso del lab.

Lo que necesita

Para completar este lab, necesitará lo siguiente:

  • Acceso a un navegador de Internet estándar. Se recomienda el navegador Chrome
  • Tiempo para completar el lab

Nota: Si ya tiene un proyecto o una cuenta personal de GCP, no los use para este lab.

Cómo iniciar tu lab y acceder a la consola

  1. Haz clic en el botón Comenzar lab. Si debes pagar por el lab, se abrirá una ventana emergente para que selecciones tu forma de pago. A la izquierda, verás un panel con las credenciales temporales que debes usar para este lab.

    Panel de credenciales

  2. Copia el nombre de usuario y, luego, haz clic en Abrir la consola de Google. El lab inicia los recursos y abre otra pestaña que muestra la página Elige una cuenta.

    Sugerencia: Abre las pestañas en ventanas separadas, una junto a la otra.
  3. En la página Elige una cuenta, haz clic en Usar otra cuenta. Se abrirá la página de acceso.

    Cuadro de diálogo Elige una cuenta el que se destaca la opción Usar otra cuenta

  4. Pega el nombre de usuario que copiaste del panel Detalles de la conexión. Luego, copia y pega la contraseña.

Nota: Debes usar las credenciales del panel Detalles de la conexión. No uses tus credenciales de Google Cloud Skills Boost. Si tienes una cuenta propia de Google Cloud, no la utilices para este lab para no incurrir en cargos.
  1. Haz clic para avanzar por las páginas siguientes:
  • Acepta los Términos y Condiciones.
  • No agregues opciones de recuperación o autenticación de dos factores (esta es una cuenta temporal).
  • No te registres para obtener pruebas gratuitas.

Después de un momento, se abrirá la consola de Cloud en esta pestaña.

Nota: Para ver el menú con una lista de los productos y servicios de Google Cloud, haz clic en el menú de navegación que se encuentra en la parte superior izquierda de la pantalla. Menú de la consola de Cloud

Introducción a Vertex AI

En este lab, usarás Vertex AI, la plataforma unificada de IA en Google Cloud, para entrenar un modelo de AA y, luego, implementarlo. Vertex AI cuenta con dos opciones en una plataforma para crear un modelo de AA: una solución sin código con AutoML y una solución basada en código con Entrenamiento personalizado por medio de Vertex Workbench. Utilizarás AutoML en este lab.

Crearás un modelo de AA para determinar si un cliente específico pagará un préstamo.

Tarea 1. Prepara los datos de entrenamiento

En el panel inicial de Vertex AI, se ilustran las etapas principales para entrenar e implementar un modelo de AA: preparar los datos de entrenamiento, entrenar el modelo y obtener las predicciones. Luego, en el panel se muestran tus actividades recientes, como conjuntos de datos, modelos, predicciones, extremos y, también, instancias de Notebooks recientes.

Crea un conjunto de datos

  1. En el Menú de navegación de la consola de Google Cloud, haz clic en Vertex AI > Conjuntos de datos.
  2. Haz clic en Crear conjunto de datos.
  3. Asígnale el nombre LoanRisk al conjunto de datos.
  4. Para el tipo de datos y el objetivo, haz clic en Tabulares y, luego, selecciona Regresión/clasificación.
  5. Haz clic en Crear.

Sube los datos

Existen tres opciones para importar datos en Vertex AI:

  • Subir archivos CSV desde tu computadora
  • Seleccionar archivos CSV desde Cloud Storage
  • Seleccionar una tabla o una vista desde BigQuery

Para tu conveniencia, el conjunto de datos ya se subió a Cloud Storage.

  1. En la fuente de datos, elige Selecciona archivos CSV de Cloud Storage.

  2. En Ruta del archivo de importación, ingresa lo siguiente:

spls/cbl455/loan_risk.csv
  1. Haz clic en Continuar.
Nota: También puedes configurar esta página haciendo clic en Conjuntos de datos en el menú de la izquierda. Luego, selecciona el nombre del conjunto de datos en la página Conjuntos de datos.

Opcional: Genera estadísticas

  1. Para ver las estadísticas descriptivas de cada columna del conjunto de datos, haz clic en Generar estadísticas.
    Esta acción puede tardar algunos minutos, especialmente si es la primera vez.

  2. Cuando las estadísticas estén listas, haz clic en el nombre de cada columna para mostrar los gráficos analíticos.

Tarea 2: Entrena el modelo

Cuando se haya subido el conjunto de datos, estará todo listo para entrenar el modelo que predecirá si un cliente va a devolver el préstamo.

  • Haz clic en Entrenar un modelo nuevo y selecciona Otra.

Método de entrenamiento

  1. El nombre del conjunto de datos ya es LoanRisk.

  2. En Objetivo, selecciona Clasificación.

Seleccionaste clasificación en lugar de regresión porque predecirás un número discreto (0 si el cliente pagará el préstamo o 1 si no lo hará, que es el valor predeterminado) en vez de uno continuo.

  1. Haz clic en Continuar.

Detalles del modelo

Especifica el nombre del modelo y la columna objetivo.

  1. Asigna un nombre para el modelo, como LoanRisk.

  2. En Columna objetivo, selecciona Predeterminada.

  3. Opcional: Explora las Opciones avanzadas para determinar cómo debes asignar los datos de entrenamiento frente a los de pruebas y especificar la encriptación.

  4. Haz clic en Continuar.

  5. Para agregar funciones, haz clic en Continuar.

Opciones de entrenamiento

Especifica cuáles columnas deseas incluir en el modelo de entrenamiento. Por ejemplo, puede que ClientID no sea relevante para la predicción de riesgo del préstamo.

  1. Haz clic en el signo menos en la fila ClientID para excluirla del modelo de entrenamiento.

  2. Opcional: Explora las Opciones avanzadas para seleccionar diferentes objetivos de optimización.
    Si quieres obtener más información sobre los objetivos de optimización para modelos de AutoML tabulares, consulta la Guía de objetivos de optimización para modelos de AutoML tabulares.

  3. Haz clic en Continuar.

Procesamiento y precios

  1. En Presupuesto, que representa la cantidad de horas de procesamiento de nodo para el entrenamiento, ingresa 1.
    Entrenar el modelo de AutoML durante 1 hora de procesamiento suele ser un buen comienzo para determinar si existe una relación entre los atributos y la etiqueta que seleccionaste. Así, puedes modificar tus atributos y realizar un entrenamiento más prolongado para mejorar el rendimiento del modelo.

  2. Deja habilitada la opción de interrupción anticipada.

  3. Haz clic en Comenzar entrenamiento.

Dependiendo del tamaño de los datos y el método de entrenamiento, este puede tardar entre algunos minutos y un par de horas. Normalmente, recibes un correo electrónico de Google Cloud cuando se completa el trabajo de entrenamiento, pero no será así en el entorno de Qwiklabs.

Nota: Para eliminar la espera típica de una hora para el entrenamiento del modelo, descarga un modelo previamente entrenado en la tarea 5. Este modelo es el resultado de las tareas 1 y 2. Las tareas 3 y 4 son solo para demostración y se aplican si entrenas el modelo por tu cuenta.

Tarea 3: Evalúa el rendimiento del modelo (solo demostración)

Vertex AI proporciona muchas métricas para evaluar el rendimiento del modelo. Te enfocarás en estas tres:

  • Curva de precisión-recuperación
  • Matriz de confusión
  • Importancia de los atributos
Nota: Si tuvieras un modelo entrenado, podrías navegar a la pestaña Registro de modelos en Vertex AI.

1. Navega a Registro de modelos.

2. Haz clic en el modelo que acabas de entrenar.

3. Explora la pestaña Evaluar.

Sin embargo, en este lab puedes saltarte este paso porque usas un modelo previamente entrenado.

La curva de precisión/recuperación

Control deslizante del umbral de confianza fijado en 0.5 y gráficos de la curva de precisión/recuperación, curva ROC y Precisión-recuperación por umbral

El umbral de confianza determina cómo un modelo de AA cuenta los casos positivos. Un umbral más alto aumenta la precisión, pero disminuye la recuperación. Uno más bajo disminuye la precisión, pero aumenta la recuperación.

Puedes ajustar manualmente el umbral para observar su impacto en la precisión y recuperación, y encontrar el mejor punto de compensación entre ambos para satisfacer tus necesidades empresariales.

La matriz de confusión

En una matriz de confusión, se indica el porcentaje de ejemplos de cada clase en el conjunto de prueba que tu modelo predijo correctamente.

Tabla de matriz de confusión en la que se muestran las clasificaciones de la etiqueta verdadera y la de la predicción

En la matriz de confusión, se indica que tu modelo inicial puede predecir correctamente un 100% de los ejemplos de devolución y un 87% de los ejemplos predeterminados en tu conjunto de prueba, lo que es bastante bueno.

Puedes mejorar el porcentaje agregando más ejemplos (más datos), diseñando atributos nuevos y cambiando el método de entrenamiento, etcétera.

La importancia de los atributos

En Vertex AI, la importancia de los atributos se muestra por medio de un gráfico de barras para ilustrar el modo en que cada atributo influye en una predicción. Mientras más alta sea la barra o el valor numérico asociado con un atributo, más importante será.

Gráfico de barras que indica la importancia de los atributos para el préstamo, los ingresos y la edad

Estos valores de importancia de los atributos podrían usarse para mejorar el modelo y tener más confianza en sus predicciones. Es posible que decidas quitar los atributos menos importantes la próxima vez que entrenes un modelo o crear una combinación de atributos con los dos más significativos para comprobar si esto mejora el rendimiento del modelo.

La importancia de los atributos es un ejemplo de la funcionalidad de aprendizaje automático integral de Vertex AI, llamada Explainable AI. Explainable AI es un conjunto de herramientas y frameworks que te permiten interpretar y comprender las predicciones que hacen tus modelos de aprendizaje automático.

Tarea 4: Implementa el modelo (solo demostración)

Nota: No implementarás el modelo en un extremo porque el entrenamiento puede tardar una hora. Aquí, puedes revisar los pasos que realizarías en un entorno de producción.

Ahora que tienes un modelo entrenado, el próximo paso es crear un extremo en Vertex. Un recurso de modelo en Vertex puede tener varios extremos asociados, y puedes dividir el tráfico entre varios extremos.

Crea y define un extremo

  1. En la página de tu modelo, haz clic en Implementa y prueba y, luego, en Implementar en el extremo.

  2. En Nombre del extemo, escribe LoanRisk.

  3. Haz clic en Continuar.

Configuración del modelo y supervisión

  1. No modifiques la configuración de división del tráfico.

  2. En Tipo de máquina, selecciona e2-standard-8, 8 CPU virtuales, memoria de 32 GiB.

  3. En Opciones de explicabilidad, haz clic en Atribución de atributos.

  4. Haz clic en Listo.

  5. Haz clic en Continuar.

  6. En Supervisión de modelos, haz clic en Continuar.

  7. En Model objectives > Fuente de datos de entrenamiento, selecciona Conjunto de datos de Vertex AI.

  8. Selecciona tu conjunto de datos en el menú desplegable.

  9. En Columna objetivo, escribe Predeterminada.

  10. Deja la configuración restante tal y como está y haz clic en Implementar.

El extremo tardará unos minutos en implementarse. Cuando esté listo, se mostrará una marca de verificación verde junto al nombre.

Ahora está todo listo para obtener predicciones en el modelo implementado.

Tarea 5: Obtén predicciones

En esta sección, usarás AutoML-Gateway para trabajar con un modelo entrenado existente.

VARIABLE DE ENTORNO VALOR
EXTREMO de Credit_Risk 1411183591831896064
INPUT_DATA_FILE INPUT-JSON

Para usar el modelo entrenado, debes crear algunas variables de entorno.

  1. Abre una ventana de Cloud Shell.

  2. Descarga los recursos del lab:

gcloud storage cp gs://cloud-training/CBL455/INPUT-JSON .
  1. Crea una variable de entorno INPUT_DATA_FILE:
export INPUT_DATA_FILE="INPUT-JSON"
  1. Crea una variable de entorno PROJECT_NUMBER:
export PROJECT_NUMBER=$(gcloud projects describe $(gcloud config get-value project) --format="value(projectNumber)")
  1. Crea una variable de entorno AUTOML_SERVICE:
export AUTOML_SERVICE="https://automl-proxy-$PROJECT_NUMBER.us-central1.run.app/v1" Nota: Después de que se extraigan los elementos del lab, dedica un momento a revisar el contenido.

Se usa el archivo INPUT-JSON para aprovisionar Vertex AI con los datos del modelo requeridos. Modifica este archivo para generar predicciones personalizadas.

El archivo INPUT-JSON se compone de los siguientes valores:

{ "instances": [ { "age": 40.77430558, "ClientID": "997", "income": 44964.0106, "loan": 3944.219318 } ] }
  1. Ingresa el siguiente comando para solicitar una predicción:
curl -X POST -H "Content-Type: application/json" $AUTOML_SERVICE -d "@${INPUT_DATA_FILE}" -s | jq

Resultado esperado:

{ "predictions": [ { "scores": [ 0.9999980926513672, 0.000001897001311590429 ], "classes": [ "0", "1" ] } ], "deployedModelId": "3093594712003575808", "model": "projects/1030115194620/locations/us-central1/models/4831874217005809664", "modelDisplayName": "credit_risk_20211119212817", "modelVersionId": "1" }

Si usas la consola de Google Cloud, la siguiente imagen ilustra la forma en que se debe realizar la acción:

Pasos de la predicción destacados en las secciones relevantes

Felicitaciones

Ahora puedes usar Vertex AI para realizar las siguientes acciones:

  • Subir un conjunto de datos
  • Entrenar un modelo con AutoML
  • Evaluar el rendimiento del modelo
  • Implementar el modelo de AutoML entrenado en un extremo
  • Obtener predicciones

Para obtener más información sobre los distintos componentes de Vertex AI, consulta la documentación del servicio.

Finalice su lab

Cuando haya completado el lab, haga clic en Finalizar lab. Google Cloud Skills Boost quitará los recursos que usó y limpiará la cuenta.

Tendrá la oportunidad de calificar su experiencia en el lab. Seleccione la cantidad de estrellas que corresponda, ingrese un comentario y haga clic en Enviar.

La cantidad de estrellas indica lo siguiente:

  • 1 estrella = Muy insatisfecho
  • 2 estrellas = Insatisfecho
  • 3 estrellas = Neutral
  • 4 estrellas = Satisfecho
  • 5 estrellas = Muy satisfecho

Puede cerrar el cuadro de diálogo si no desea proporcionar comentarios.

Para enviar comentarios, sugerencias o correcciones, use la pestaña Asistencia.

Copyright 2020 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.

Before you begin

  1. Labs create a Google Cloud project and resources for a fixed time
  2. Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
  3. On the top left of your screen, click Start lab to begin

Use private browsing

  1. Copy the provided Username and Password for the lab
  2. Click Open console in private mode

Sign in to the Console

  1. Sign in using your lab credentials. Using other credentials might cause errors or incur charges.
  2. Accept the terms, and skip the recovery resource page
  3. Don't click End lab unless you've finished the lab or want to restart it, as it will clear your work and remove the project

Este contenido no está disponible en este momento

Te enviaremos una notificación por correo electrónico cuando esté disponible

¡Genial!

Nos comunicaremos contigo por correo electrónico si está disponible

One lab at a time

Confirm to end all existing labs and start this one

Setup your console before you begin

Use an Incognito or private browser window to run this lab. This prevents any conflicts between your personal account and the Student account, which may cause extra charges incurred to your personal account.