arrow_back

Vertex AI: Cómo predecir el riesgo de los préstamos con AutoML

Acceder Unirse
Pon a prueba tus conocimientos y compártelos con nuestra comunidad
done
Obtén acceso a más de 700 labs prácticos, insignias de habilidad y cursos

Vertex AI: Cómo predecir el riesgo de los préstamos con AutoML

Lab 2 horas 30 minutos universal_currency_alt 5 créditos show_chart Introductorio
info Es posible que este lab incorpore herramientas de IA para facilitar tu aprendizaje.
Pon a prueba tus conocimientos y compártelos con nuestra comunidad
done
Obtén acceso a más de 700 labs prácticos, insignias de habilidad y cursos

Descripción general

En este lab, usarás Vertex AI para entrenar y entregar un modelo de aprendizaje automático que pueda predecir el riesgo de un préstamo con un conjunto de datos tabular.

Objetivos

Aprenderás a hacer lo siguiente:

  • Subir un conjunto de datos a Vertex AI
  • Entrenar un modelo de aprendizaje automático con AutoML
  • Evaluar el rendimiento del modelo
  • Implementar el modelo en un extremo
  • Obtener predicciones

Configuración

Antes de hacer clic en el botón Comenzar lab

Lea estas instrucciones. Los labs tienen un tiempo límite; no puede ponerlos en pausa. El cronómetro, que comienza a funcionar cuando hace clic en Comenzar lab, indica por cuánto tiempo estarán los recursos en la nube a su disposición.

Este lab práctico de Qwiklabs le permitirá llevar a cabo las actividades correspondientes en un entorno de nube real, no en uno de simulación o demostración. Para ello, recibe nuevas credenciales temporales que utilizará para acceder a Google Cloud Platform durante el transcurso del lab.

Lo que necesita

Para completar este lab, necesitará lo siguiente:

  • Acceso a un navegador de Internet estándar. Se recomienda el navegador Chrome
  • Tiempo para completar el lab

Nota: Si ya tiene un proyecto o una cuenta personal de GCP, no los use para este lab.

Cómo iniciar tu lab y acceder a la consola

  1. Haz clic en el botón Comenzar lab. Si debes pagar por el lab, se abrirá una ventana emergente para que selecciones tu forma de pago. A la izquierda, verás un panel con las credenciales temporales que debes usar para este lab.

    Panel de credenciales

  2. Copia el nombre de usuario y, luego, haz clic en Abrir la consola de Google. El lab inicia los recursos y abre otra pestaña que muestra la página Elige una cuenta.

    Sugerencia: Abre las pestañas en ventanas separadas, una junto a la otra.
  3. En la página Elige una cuenta, haz clic en Usar otra cuenta. Se abrirá la página de acceso.

    Cuadro de diálogo Elige una cuenta el que se destaca la opción Usar otra cuenta

  4. Pega el nombre de usuario que copiaste del panel Detalles de la conexión. Luego, copia y pega la contraseña.

Nota: Debes usar las credenciales del panel Detalles de la conexión. No uses tus credenciales de Google Cloud Skills Boost. Si tienes una cuenta propia de Google Cloud, no la utilices para este lab para no incurrir en cargos.
  1. Haz clic para avanzar por las páginas siguientes:
  • Acepta los Términos y Condiciones.
  • No agregues opciones de recuperación o autenticación de dos factores (esta es una cuenta temporal).
  • No te registres para obtener pruebas gratuitas.

Después de un momento, se abrirá la consola de Cloud en esta pestaña.

Nota: Para ver el menú con una lista de los productos y servicios de Google Cloud, haz clic en el menú de navegación que se encuentra en la parte superior izquierda de la pantalla. Menú de la consola de Cloud

Introducción a Vertex AI

En este lab, usarás Vertex AI, la plataforma unificada de IA en Google Cloud, para entrenar un modelo de AA y, luego, implementarlo. Vertex AI cuenta con dos opciones en una plataforma para crear un modelo de AA: una solución sin código con AutoML y una solución basada en código con Entrenamiento personalizado por medio de Vertex Workbench. Utilizarás AutoML en este lab.

Crearás un modelo de AA para determinar si un cliente específico pagará un préstamo.

Tarea 1. Prepara los datos de entrenamiento

En el panel inicial de Vertex AI, se ilustran las etapas principales para entrenar e implementar un modelo de AA: preparar los datos de entrenamiento, entrenar el modelo y obtener las predicciones. Luego, en el panel se muestran tus actividades recientes, como conjuntos de datos, modelos, predicciones, extremos y, también, instancias de Notebooks recientes.

Crea un conjunto de datos

  1. En el Menú de navegación de la consola de Google Cloud, haz clic en Vertex AI > Conjuntos de datos.
  2. Haz clic en Crear conjunto de datos.
  3. Asígnale el nombre LoanRisk al conjunto de datos.
  4. Para el tipo de datos y el objetivo, haz clic en Tabulares y, luego, selecciona Regresión/clasificación.
  5. Haz clic en Crear.

Sube los datos

Existen tres opciones para importar datos en Vertex AI:

  • Subir archivos CSV desde tu computadora
  • Seleccionar archivos CSV desde Cloud Storage
  • Seleccionar una tabla o una vista desde BigQuery

Para tu conveniencia, el conjunto de datos ya se subió a Cloud Storage.

  1. En la fuente de datos, elige Selecciona archivos CSV de Cloud Storage.

  2. En Ruta del archivo de importación, ingresa lo siguiente:

spls/cbl455/loan_risk.csv
  1. Haz clic en Continuar.
Nota: También puedes configurar esta página haciendo clic en Conjuntos de datos en el menú de la izquierda. Luego, selecciona el nombre del conjunto de datos en la página Conjuntos de datos.

Opcional: Genera estadísticas

  1. Para ver las estadísticas descriptivas de cada columna del conjunto de datos, haz clic en Generar estadísticas.
    Esta acción puede tardar algunos minutos, especialmente si es la primera vez.

  2. Cuando las estadísticas estén listas, haz clic en el nombre de cada columna para mostrar los gráficos analíticos.

Tarea 2: Entrena el modelo

Cuando se haya subido el conjunto de datos, estará todo listo para entrenar el modelo que predecirá si un cliente va a devolver el préstamo.

  • Haz clic en Entrenar un modelo nuevo y selecciona Otra.

Método de entrenamiento

  1. El nombre del conjunto de datos ya es LoanRisk.

  2. En Objetivo, selecciona Clasificación.

Seleccionaste clasificación en lugar de regresión porque predecirás un número discreto (0 si el cliente pagará el préstamo o 1 si no lo hará, que es el valor predeterminado) en vez de uno continuo.

  1. Haz clic en Continuar.

Detalles del modelo

Especifica el nombre del modelo y la columna objetivo.

  1. Asigna un nombre para el modelo, como LoanRisk.

  2. En Columna objetivo, selecciona Predeterminada.

  3. Opcional: Explora las Opciones avanzadas para determinar cómo debes asignar los datos de entrenamiento frente a los de pruebas y especificar la encriptación.

  4. Haz clic en Continuar.

  5. Para agregar funciones, haz clic en Continuar.

Opciones de entrenamiento

Especifica cuáles columnas deseas incluir en el modelo de entrenamiento. Por ejemplo, puede que ClientID no sea relevante para la predicción de riesgo del préstamo.

  1. Haz clic en el signo menos en la fila ClientID para excluirla del modelo de entrenamiento.

  2. Opcional: Explora las Opciones avanzadas para seleccionar diferentes objetivos de optimización.
    Si quieres obtener más información sobre los objetivos de optimización para modelos de AutoML tabulares, consulta la Guía de objetivos de optimización para modelos de AutoML tabulares.

  3. Haz clic en Continuar.

Procesamiento y precios

  1. En Presupuesto, que representa la cantidad de horas de procesamiento de nodo para el entrenamiento, ingresa 1.
    Entrenar el modelo de AutoML durante 1 hora de procesamiento suele ser un buen comienzo para determinar si existe una relación entre los atributos y la etiqueta que seleccionaste. Así, puedes modificar tus atributos y realizar un entrenamiento más prolongado para mejorar el rendimiento del modelo.

  2. Deja habilitada la opción de interrupción anticipada.

  3. Haz clic en Comenzar entrenamiento.

Dependiendo del tamaño de los datos y el método de entrenamiento, este puede tardar entre algunos minutos y un par de horas. Normalmente, recibirás un correo electrónico de Google Cloud cuando se complete el trabajo de entrenamiento. Sin embargo, en el entorno de Qwiklabs no recibirás un correo electrónico.

Para no esperar a que se complete el entrenamiento del modelo, descarga un modelo previamente entrenado en la Tarea 5 para obtener predicciones en la Tarea 6. Este modelo previamente entrenado es el resultado del entrenamiento después de seguir los mismos pasos de las Tareas 1 y 2.

Tarea 3: Evalúa el rendimiento del modelo (solo demostración)

Vertex AI proporciona muchas métricas para evaluar el rendimiento del modelo. Te enfocarás en estas tres:

  • Curva de precisión-recuperación
  • Matriz de confusión
  • Importancia de los atributos
Nota: Si tuvieras un modelo entrenado, podrías navegar a la pestaña Registro de modelos en Vertex AI.

1. Navega a Registro de modelos.

2. Haz clic en el modelo que acabas de entrenar.

3. Explora la pestaña Evaluar.

Sin embargo, en este lab puedes saltarte este paso porque usas un modelo previamente entrenado.

La curva de precisión/recuperación

Control deslizante del umbral de confianza fijado en 0.5 y gráficos de la curva de precisión/recuperación, curva ROC y Precisión-recuperación por umbral

El umbral de confianza determina cómo un modelo de AA cuenta los casos positivos. Un umbral más alto aumenta la precisión, pero disminuye la recuperación. Uno más bajo disminuye la precisión, pero aumenta la recuperación.

Puedes ajustar manualmente el umbral para observar su impacto en la precisión y recuperación, y encontrar el mejor punto de compensación entre ambos para satisfacer tus necesidades empresariales.

La matriz de confusión

En una matriz de confusión, se indica el porcentaje de ejemplos de cada clase en el conjunto de prueba que tu modelo predijo correctamente.

Tabla de matriz de confusión en la que se muestran las clasificaciones de la etiqueta verdadera y la de la predicción

En la matriz de confusión, se indica que tu modelo inicial puede predecir correctamente un 100% de los ejemplos de devolución y un 87% de los ejemplos predeterminados en tu conjunto de prueba, lo que es bastante bueno.

Puedes mejorar el porcentaje agregando más ejemplos (más datos), diseñando atributos nuevos y cambiando el método de entrenamiento, etcétera.

La importancia de los atributos

En Vertex AI, la importancia de los atributos se muestra por medio de un gráfico de barras para ilustrar el modo en que cada atributo influye en una predicción. Mientras más alta sea la barra o el valor numérico asociado con un atributo, más importante será.

Gráfico de barras que indica la importancia de los atributos para el préstamo, los ingresos y la edad

Estos valores de importancia de los atributos podrían usarse para mejorar el modelo y tener más confianza en sus predicciones. Es posible que decidas quitar los atributos menos importantes la próxima vez que entrenes un modelo o crear una combinación de atributos con los dos más significativos para comprobar si esto mejora el rendimiento del modelo.

La importancia de los atributos es un ejemplo de la funcionalidad de aprendizaje automático integral de Vertex AI, llamada Explainable AI. Explainable AI es un conjunto de herramientas y frameworks que te permiten interpretar y comprender las predicciones que hacen tus modelos de aprendizaje automático.

Tarea 4: Implementa el modelo (solo demostración)

Nota: No implementarás el modelo en un extremo porque el entrenamiento puede tardar una hora. Aquí, puedes revisar los pasos que realizarías en un entorno de producción.

Ahora que tienes un modelo entrenado, el próximo paso es crear un extremo en Vertex. Un recurso de modelo en Vertex puede tener varios extremos asociados, y puedes dividir el tráfico entre varios extremos.

Crea y define un extremo

  1. En la página de tu modelo, haz clic en Implementa y prueba y, luego, en Implementar en el extremo.

  2. En Nombre del extemo, escribe LoanRisk.

  3. Haz clic en Continuar.

Configuración del modelo y supervisión

  1. No modifiques la configuración de división del tráfico.

  2. En Tipo de máquina, selecciona e2-standard-8, 8 CPU virtuales, memoria de 32 GiB.

  3. En Opciones de explicabilidad, haz clic en Atribución de atributos.

  4. Haz clic en Listo.

  5. Haz clic en Continuar.

  6. En Supervisión de modelos, haz clic en Continuar.

  7. En Model objectives > Fuente de datos de entrenamiento, selecciona Conjunto de datos de Vertex AI.

  8. Selecciona tu conjunto de datos en el menú desplegable.

  9. En Columna objetivo, escribe Predeterminada.

  10. Deja la configuración restante tal y como está y haz clic en Implementar.

El extremo tardará unos minutos en implementarse. Cuando esté listo, se mostrará una marca de verificación verde junto al nombre.

Ahora está todo listo para obtener predicciones en el modelo implementado.

Tarea 5: Token del portador de SML

Obtenga su token del portador

Para permitir que se autentique la canalización y que se lo autorice a llamar al extremo a fin de obtener predicciones, debe proporcionar su token del portador.

Siga estas instrucciones para obtener su token. Si tiene problemas para conseguirlo, puede deberse a las cookies en la ventana de incógnito. Intente realizar este proceso en una ventana que no sea de incógnito.

  1. Acceda a https://gsp-auth-kjyo252taq-uc.a.run.app/.

  2. Cuando lo haga, use su dirección de correo electrónico y contraseña de alumno.

  3. Haga clic en el botón Copiar. Se copiará un token muy extenso en el portapapeles.

bearer-login.png

El token solo estará disponible durante unos 60 segundos, así que cópielo y continúe con los siguientes pasos.

Si tiene problemas para obtener el token del portador, puede deberse a las cookies en la ventana de incógnito. Use una que no sea de incógnito.

Tarea 6: Obtén predicciones

En esta sección, usarás el servicio de Aprendizaje automático compartido (SML) para trabajar con un modelo entrenado existente.

VARIABLE DE ENTORNO VALOR
AUTH_TOKEN Usa el valor de la sección anterior
ENDPOINT https://sml-api-vertex-kjyo252taq-uc.a.run.app/vertex/predict/tabular_classification
INPUT_DATA_FILE INPUT-JSON

Para usar el modelo entrenado, debes crear algunas variables de entorno.

  1. Abre una ventana de Cloud Shell.

  2. Reemplaza INSERT_SML_BEARER_TOKEN por el valor del token del portador de la sección anterior:

export AUTH_TOKEN="INSERT_SML_BEARER_TOKEN"
  1. Descarga los recursos del lab:
gcloud storage cp gs://spls/cbl455/cbl455.tar.gz .
  1. Extrae los recursos del lab:
tar -xvf cbl455.tar.gz
  1. Crea una variable de entorno ENDPOINT:
export ENDPOINT="https://sml-api-vertex-kjyo252taq-uc.a.run.app/vertex/predict/tabular_classification"
  1. Crea una variable de entorno INPUT_DATA_FILE:
export INPUT_DATA_FILE="INPUT-JSON" Nota: Después de que se extraigan los elementos del lab, tómate un momento para revisar el contenido.

Se usa el archivo INPUT-JSON para aprovisionar Vertex AI con los datos del modelo requeridos. Modifica este archivo para generar predicciones personalizadas.

La aplicación smlproxy se usa para comunicarse con el backend.

El archivo INPUT-JSON se compone de los siguientes valores:

age ClientID income loan
40.77 997 44964.01 3944.22
  1. Pasa los parámetros especificados en las variables de entorno para probar el servicio de SML.

  2. Realiza una solicitud al servicio de SML:

./smlproxy tabular \ -a $AUTH_TOKEN \ -e $ENDPOINT \ -d $INPUT_DATA_FILE

La consulta debe dar como resultado una respuesta similar a esta:

SML Tabular HTTP Response: 2022/01/10 15:04:45 {"model_class":"0","model_score":0.9999981}
  1. Modifica el archivo INPUT-JSON para probar una situación nueva:
age ClientID income loan
30.00 998 50000.00 20000.00
  1. Edita el archivo INPUT-JSON y reemplaza los valores originales (puedes usar el editor que prefieras, como vim, nano, emacs o el editor de código de Cloud Shell).

  2. Pasa los parámetros especificados en las variables de entorno para probar el servicio de SML.

  3. Realiza una solicitud al servicio de SML:

./smlproxy tabular \ -a $AUTH_TOKEN \ -e $ENDPOINT \ -d $INPUT_DATA_FILE

En este caso, si suponemos que los ingresos de una persona son 50,000, tiene 30 años y solicita un préstamo de 20,000, el modelo predice que esta persona pagará el préstamo.

La consulta debe dar como resultado una respuesta similar a esta:

SML Tabular HTTP Response: 2022/01/10 15:04:45 {"model_class":"0","model_score":1.0322887E-5}

Si usas la consola de Google Cloud, la siguiente imagen ilustra la forma en que se debe realizar la acción:

Pasos de la predicción destacados en las secciones relevantes

Felicitaciones

Ahora puedes usar Vertex AI para realizar las siguientes acciones:

  • Subir un conjunto de datos
  • Entrenar un modelo con AutoML
  • Evaluar el rendimiento del modelo
  • Implementar el modelo de AutoML entrenado en un extremo
  • Obtener predicciones

Para obtener más información sobre las distintas partes de Vertex AI, consulta la documentación de Vertex AI.

Finalice su lab

Cuando haya completado el lab, haga clic en Finalizar lab. Google Cloud Skills Boost quitará los recursos que usó y limpiará la cuenta.

Tendrá la oportunidad de calificar su experiencia en el lab. Seleccione la cantidad de estrellas que corresponda, ingrese un comentario y haga clic en Enviar.

La cantidad de estrellas indica lo siguiente:

  • 1 estrella = Muy insatisfecho
  • 2 estrellas = Insatisfecho
  • 3 estrellas = Neutral
  • 4 estrellas = Satisfecho
  • 5 estrellas = Muy satisfecho

Puede cerrar el cuadro de diálogo si no desea proporcionar comentarios.

Para enviar comentarios, sugerencias o correcciones, use la pestaña Asistencia.

Copyright 2020 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.

Este contenido no está disponible en este momento

Te enviaremos una notificación por correo electrónico cuando esté disponible

¡Genial!

Nos comunicaremos contigo por correo electrónico si está disponible