Vertex AI: Cómo predecir el riesgo de los préstamos con AutoML
- Descripción general
- Configuración
- Introducción a Vertex AI
- Tarea 1. Prepara los datos de entrenamiento
- Tarea 2: Entrena el modelo
- Tarea 3: Evalúa el rendimiento del modelo (solo demostración)
- Tarea 4: Implementa el modelo (solo demostración)
- Tarea 5: Token del portador de SML
- Tarea 6: Obtén predicciones
- Felicitaciones
- Finalice su lab
Descripción general
En este lab, usarás Vertex AI para entrenar y entregar un modelo de aprendizaje automático que pueda predecir el riesgo de un préstamo con un conjunto de datos tabular.
Objetivos
Aprenderás a hacer lo siguiente:
- Subir un conjunto de datos a Vertex AI
- Entrenar un modelo de aprendizaje automático con AutoML
- Evaluar el rendimiento del modelo
- Implementar el modelo en un extremo
- Obtener predicciones
Configuración
Antes de hacer clic en el botón Comenzar lab
Lea estas instrucciones. Los labs tienen un tiempo límite; no puede ponerlos en pausa. El cronómetro, que comienza a funcionar cuando hace clic en Comenzar lab, indica por cuánto tiempo estarán los recursos en la nube a su disposición.
Este lab práctico de Qwiklabs le permitirá llevar a cabo las actividades correspondientes en un entorno de nube real, no en uno de simulación o demostración. Para ello, recibe nuevas credenciales temporales que utilizará para acceder a Google Cloud Platform durante el transcurso del lab.
Lo que necesita
Para completar este lab, necesitará lo siguiente:
- Acceso a un navegador de Internet estándar. Se recomienda el navegador Chrome
- Tiempo para completar el lab
Nota: Si ya tiene un proyecto o una cuenta personal de GCP, no los use para este lab.
Cómo iniciar tu lab y acceder a la consola
-
Haz clic en el botón Comenzar lab. Si debes pagar por el lab, se abrirá una ventana emergente para que selecciones tu forma de pago. A la izquierda, verás un panel con las credenciales temporales que debes usar para este lab.
-
Copia el nombre de usuario y, luego, haz clic en Abrir la consola de Google. El lab inicia los recursos y abre otra pestaña que muestra la página Elige una cuenta.
Sugerencia: Abre las pestañas en ventanas separadas, una junto a la otra. -
En la página Elige una cuenta, haz clic en Usar otra cuenta. Se abrirá la página de acceso.
-
Pega el nombre de usuario que copiaste del panel Detalles de la conexión. Luego, copia y pega la contraseña.
- Haz clic para avanzar por las páginas siguientes:
- Acepta los Términos y Condiciones.
- No agregues opciones de recuperación o autenticación de dos factores (esta es una cuenta temporal).
- No te registres para obtener pruebas gratuitas.
Después de un momento, se abrirá la consola de Cloud en esta pestaña.
Introducción a Vertex AI
En este lab, usarás Vertex AI, la plataforma unificada de IA en Google Cloud, para entrenar un modelo de AA y, luego, implementarlo. Vertex AI cuenta con dos opciones en una plataforma para crear un modelo de AA: una solución sin código con AutoML y una solución basada en código con Entrenamiento personalizado por medio de Vertex Workbench. Utilizarás AutoML en este lab.
Crearás un modelo de AA para determinar si un cliente específico pagará un préstamo.
Tarea 1. Prepara los datos de entrenamiento
En el panel inicial de Vertex AI, se ilustran las etapas principales para entrenar e implementar un modelo de AA: preparar los datos de entrenamiento, entrenar el modelo y obtener las predicciones. Luego, en el panel se muestran tus actividades recientes, como conjuntos de datos, modelos, predicciones, extremos y, también, instancias de Notebooks recientes.
Crea un conjunto de datos
- En el Menú de navegación de la consola de Google Cloud, haz clic en Vertex AI > Conjuntos de datos.
- Haz clic en Crear conjunto de datos.
- Asígnale el nombre LoanRisk al conjunto de datos.
- Para el tipo de datos y el objetivo, haz clic en Tabulares y, luego, selecciona Regresión/clasificación.
- Haz clic en Crear.
Sube los datos
Existen tres opciones para importar datos en Vertex AI:
- Subir archivos CSV desde tu computadora
- Seleccionar archivos CSV desde Cloud Storage
- Seleccionar una tabla o una vista desde BigQuery
Para tu conveniencia, el conjunto de datos ya se subió a Cloud Storage.
-
En la fuente de datos, elige Selecciona archivos CSV de Cloud Storage.
-
En Ruta del archivo de importación, ingresa lo siguiente:
- Haz clic en Continuar.
Opcional: Genera estadísticas
-
Para ver las estadísticas descriptivas de cada columna del conjunto de datos, haz clic en Generar estadísticas.
Esta acción puede tardar algunos minutos, especialmente si es la primera vez. -
Cuando las estadísticas estén listas, haz clic en el nombre de cada columna para mostrar los gráficos analíticos.
Tarea 2: Entrena el modelo
Cuando se haya subido el conjunto de datos, estará todo listo para entrenar el modelo que predecirá si un cliente va a devolver el préstamo.
- Haz clic en Entrenar un modelo nuevo y selecciona Otra.
Método de entrenamiento
-
El nombre del conjunto de datos ya es LoanRisk.
-
En Objetivo, selecciona Clasificación.
Seleccionaste clasificación en lugar de regresión porque predecirás un número discreto (0 si el cliente pagará el préstamo o 1 si no lo hará, que es el valor predeterminado) en vez de uno continuo.
- Haz clic en Continuar.
Detalles del modelo
Especifica el nombre del modelo y la columna objetivo.
-
Asigna un nombre para el modelo, como LoanRisk.
-
En Columna objetivo, selecciona Predeterminada.
-
Opcional: Explora las Opciones avanzadas para determinar cómo debes asignar los datos de entrenamiento frente a los de pruebas y especificar la encriptación.
-
Haz clic en Continuar.
-
Para agregar funciones, haz clic en Continuar.
Opciones de entrenamiento
Especifica cuáles columnas deseas incluir en el modelo de entrenamiento. Por ejemplo, puede que ClientID no sea relevante para la predicción de riesgo del préstamo.
-
Haz clic en el signo menos en la fila ClientID para excluirla del modelo de entrenamiento.
-
Opcional: Explora las Opciones avanzadas para seleccionar diferentes objetivos de optimización.
Si quieres obtener más información sobre los objetivos de optimización para modelos de AutoML tabulares, consulta la Guía de objetivos de optimización para modelos de AutoML tabulares. -
Haz clic en Continuar.
Procesamiento y precios
-
En Presupuesto, que representa la cantidad de horas de procesamiento de nodo para el entrenamiento, ingresa 1.
Entrenar el modelo de AutoML durante 1 hora de procesamiento suele ser un buen comienzo para determinar si existe una relación entre los atributos y la etiqueta que seleccionaste. Así, puedes modificar tus atributos y realizar un entrenamiento más prolongado para mejorar el rendimiento del modelo. -
Deja habilitada la opción de interrupción anticipada.
-
Haz clic en Comenzar entrenamiento.
Dependiendo del tamaño de los datos y el método de entrenamiento, este puede tardar entre algunos minutos y un par de horas. Normalmente, recibirás un correo electrónico de Google Cloud cuando se complete el trabajo de entrenamiento. Sin embargo, en el entorno de Qwiklabs no recibirás un correo electrónico.
Para no esperar a que se complete el entrenamiento del modelo, descarga un modelo previamente entrenado en la Tarea 5 para obtener predicciones en la Tarea 6. Este modelo previamente entrenado es el resultado del entrenamiento después de seguir los mismos pasos de las Tareas 1 y 2.
Tarea 3: Evalúa el rendimiento del modelo (solo demostración)
Vertex AI proporciona muchas métricas para evaluar el rendimiento del modelo. Te enfocarás en estas tres:
- Curva de precisión-recuperación
- Matriz de confusión
- Importancia de los atributos
La curva de precisión/recuperación
El umbral de confianza determina cómo un modelo de AA cuenta los casos positivos. Un umbral más alto aumenta la precisión, pero disminuye la recuperación. Uno más bajo disminuye la precisión, pero aumenta la recuperación.
Puedes ajustar manualmente el umbral para observar su impacto en la precisión y recuperación, y encontrar el mejor punto de compensación entre ambos para satisfacer tus necesidades empresariales.
La matriz de confusión
En una matriz de confusión, se indica el porcentaje de ejemplos de cada clase en el conjunto de prueba que tu modelo predijo correctamente.
En la matriz de confusión, se indica que tu modelo inicial puede predecir correctamente un 100% de los ejemplos de devolución y un 87% de los ejemplos predeterminados en tu conjunto de prueba, lo que es bastante bueno.
Puedes mejorar el porcentaje agregando más ejemplos (más datos), diseñando atributos nuevos y cambiando el método de entrenamiento, etcétera.
La importancia de los atributos
En Vertex AI, la importancia de los atributos se muestra por medio de un gráfico de barras para ilustrar el modo en que cada atributo influye en una predicción. Mientras más alta sea la barra o el valor numérico asociado con un atributo, más importante será.
Estos valores de importancia de los atributos podrían usarse para mejorar el modelo y tener más confianza en sus predicciones. Es posible que decidas quitar los atributos menos importantes la próxima vez que entrenes un modelo o crear una combinación de atributos con los dos más significativos para comprobar si esto mejora el rendimiento del modelo.
La importancia de los atributos es un ejemplo de la funcionalidad de aprendizaje automático integral de Vertex AI, llamada Explainable AI. Explainable AI es un conjunto de herramientas y frameworks que te permiten interpretar y comprender las predicciones que hacen tus modelos de aprendizaje automático.
Tarea 4: Implementa el modelo (solo demostración)
Ahora que tienes un modelo entrenado, el próximo paso es crear un extremo en Vertex. Un recurso de modelo en Vertex puede tener varios extremos asociados, y puedes dividir el tráfico entre varios extremos.
Crea y define un extremo
-
En la página de tu modelo, haz clic en Implementa y prueba y, luego, en Implementar en el extremo.
-
En Nombre del extemo, escribe LoanRisk.
-
Haz clic en Continuar.
Configuración del modelo y supervisión
-
No modifiques la configuración de división del tráfico.
-
En Tipo de máquina, selecciona e2-standard-8, 8 CPU virtuales, memoria de 32 GiB.
-
En Opciones de explicabilidad, haz clic en Atribución de atributos.
-
Haz clic en Listo.
-
Haz clic en Continuar.
-
En Supervisión de modelos, haz clic en Continuar.
-
En Model objectives > Fuente de datos de entrenamiento, selecciona Conjunto de datos de Vertex AI.
-
Selecciona tu conjunto de datos en el menú desplegable.
-
En Columna objetivo, escribe Predeterminada.
-
Deja la configuración restante tal y como está y haz clic en Implementar.
El extremo tardará unos minutos en implementarse. Cuando esté listo, se mostrará una marca de verificación verde junto al nombre.
Ahora está todo listo para obtener predicciones en el modelo implementado.
Tarea 5: Token del portador de SML
Obtenga su token del portador
Para permitir que se autentique la canalización y que se lo autorice a llamar al extremo a fin de obtener predicciones, debe proporcionar su token del portador.
Siga estas instrucciones para obtener su token. Si tiene problemas para conseguirlo, puede deberse a las cookies en la ventana de incógnito. Intente realizar este proceso en una ventana que no sea de incógnito.
-
Cuando lo haga, use su dirección de correo electrónico y contraseña de alumno.
-
Haga clic en el botón Copiar. Se copiará un token muy extenso en el portapapeles.
El token solo estará disponible durante unos 60 segundos, así que cópielo y continúe con los siguientes pasos.
Tarea 6: Obtén predicciones
En esta sección, usarás el servicio de Aprendizaje automático compartido (SML) para trabajar con un modelo entrenado existente.
VARIABLE DE ENTORNO | VALOR |
---|---|
AUTH_TOKEN | Usa el valor de la sección anterior |
ENDPOINT | https://sml-api-vertex-kjyo252taq-uc.a.run.app/vertex/predict/tabular_classification |
INPUT_DATA_FILE | INPUT-JSON |
Para usar el modelo entrenado, debes crear algunas variables de entorno.
-
Abre una ventana de Cloud Shell.
-
Reemplaza
INSERT_SML_BEARER_TOKEN
por el valor del token del portador de la sección anterior:
- Descarga los recursos del lab:
- Extrae los recursos del lab:
- Crea una variable de entorno ENDPOINT:
- Crea una variable de entorno
INPUT_DATA_FILE
:
El archivo INPUT-JSON
se compone de los siguientes valores:
age | ClientID | income | loan |
---|---|---|---|
40.77 | 997 | 44964.01 | 3944.22 |
-
Pasa los parámetros especificados en las variables de entorno para probar el servicio de SML.
-
Realiza una solicitud al servicio de SML:
La consulta debe dar como resultado una respuesta similar a esta:
- Modifica el archivo
INPUT-JSON
para probar una situación nueva:
age | ClientID | income | loan |
---|---|---|---|
30.00 | 998 | 50000.00 | 20000.00 |
-
Edita el archivo
INPUT-JSON
y reemplaza los valores originales (puedes usar el editor que prefieras, comovim
,nano
,emacs
o el editor de código de Cloud Shell). -
Pasa los parámetros especificados en las variables de entorno para probar el servicio de SML.
-
Realiza una solicitud al servicio de SML:
En este caso, si suponemos que los ingresos de una persona son 50,000, tiene 30 años y solicita un préstamo de 20,000, el modelo predice que esta persona pagará el préstamo.
La consulta debe dar como resultado una respuesta similar a esta:
Si usas la consola de Google Cloud, la siguiente imagen ilustra la forma en que se debe realizar la acción:
Felicitaciones
Ahora puedes usar Vertex AI para realizar las siguientes acciones:
- Subir un conjunto de datos
- Entrenar un modelo con AutoML
- Evaluar el rendimiento del modelo
- Implementar el modelo de AutoML entrenado en un extremo
- Obtener predicciones
Para obtener más información sobre las distintas partes de Vertex AI, consulta la documentación de Vertex AI.
Finalice su lab
Cuando haya completado el lab, haga clic en Finalizar lab. Google Cloud Skills Boost quitará los recursos que usó y limpiará la cuenta.
Tendrá la oportunidad de calificar su experiencia en el lab. Seleccione la cantidad de estrellas que corresponda, ingrese un comentario y haga clic en Enviar.
La cantidad de estrellas indica lo siguiente:
- 1 estrella = Muy insatisfecho
- 2 estrellas = Insatisfecho
- 3 estrellas = Neutral
- 4 estrellas = Satisfecho
- 5 estrellas = Muy satisfecho
Puede cerrar el cuadro de diálogo si no desea proporcionar comentarios.
Para enviar comentarios, sugerencias o correcciones, use la pestaña Asistencia.
Copyright 2020 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.