Puntos de control
Create a BigQuery dataset
/ 20
Create a model to predict visitor transaction
/ 20
Evaluate the model
/ 20
Predict purchases per country
/ 20
Predict purchases per user
/ 20
Primeros pasos con BigQuery ML
GSP247
Descripción general
BigQuery ML permite a los usuarios crear y ejecutar modelos de aprendizaje automático en BigQuery con consultas en SQL. El objetivo es permitir que más personas tengan acceso al aprendizaje automático facultando a los profesionales de SQL para que creen modelos mediante sus herramientas existentes y quitando la necesidad de trasladar datos para aumentar la velocidad de desarrollo.
Tenemos disponible un conjunto de datos de comercio electrónico con millones de registros de Google Analytics para Google Merchandise Store cargados en BigQuery. En este lab, usarás estos datos para crear un modelo que prediga si un visitante hará una transacción.
Aprendizajes esperados
En este lab, aprenderás a hacer lo siguiente:
- Crear conjuntos de datos de BigQuery
- Crear, evaluar y usar modelos de aprendizaje automático en BigQuery
Requisitos
Para maximizar tu aprendizaje, debes tener conocimientos básicos de SQL o BigQuery.
Configuración y requisitos
Antes de hacer clic en el botón Comenzar lab
Lee estas instrucciones. Los labs son cronometrados y no se pueden pausar. El cronómetro, que comienza a funcionar cuando haces clic en Comenzar lab, indica por cuánto tiempo tendrás a tu disposición los recursos de Google Cloud.
Este lab práctico te permitirá realizar las actividades correspondientes en un entorno de nube real, no en uno de simulación o demostración. Para ello, se te proporcionan credenciales temporales nuevas que utilizarás para acceder a Google Cloud durante todo el lab.
Para completar este lab, necesitarás lo siguiente:
- Acceso a un navegador de Internet estándar (se recomienda el navegador Chrome)
- Tiempo para completar el lab: Recuerda que, una vez que comienzas un lab, no puedes pausarlo.
Cómo iniciar tu lab y acceder a la consola de Google Cloud
-
Haga clic en el botón Comenzar lab. Si debe pagar por el lab, se abrirá una ventana emergente para que seleccione su forma de pago. A la izquierda, se encuentra el panel Detalles del lab, que tiene estos elementos:
- El botón Abrir la consola de Google Cloud
- El tiempo restante
- Las credenciales temporales que debe usar para el lab
- Otra información para completar el lab, si es necesaria
-
Haz clic en Abrir la consola de Google Cloud (o haz clic con el botón derecho y selecciona Abrir el vínculo en una ventana de incógnito si ejecutas el navegador Chrome).
El lab inicia recursos y abre otra pestaña en la que se muestra la página de acceso.
Sugerencia: Ordene las pestañas en ventanas separadas, una junto a la otra.
Nota: Si ves el diálogo Elegir una cuenta, haz clic en Usar otra cuenta. -
De ser necesario, copia el nombre de usuario a continuación y pégalo en el diálogo Acceder.
{{{user_0.username | "Username"}}} También puedes encontrar el nombre de usuario en el panel Detalles del lab.
-
Haz clic en Siguiente.
-
Copia la contraseña que aparece a continuación y pégala en el diálogo Te damos la bienvenida.
{{{user_0.password | "Password"}}} También puedes encontrar la contraseña en el panel Detalles del lab.
-
Haz clic en Siguiente.
Importante: Debes usar las credenciales que te proporciona el lab. No uses las credenciales de tu cuenta de Google Cloud. Nota: Usar tu propia Cuenta de Google podría generar cargos adicionales. -
Haga clic para avanzar por las páginas siguientes:
- Acepta los Términos y Condiciones.
- No agregues opciones de recuperación o autenticación de dos factores (esta es una cuenta temporal).
- No te registres para obtener pruebas gratuitas.
Después de un momento, se abrirá la consola de Google Cloud en esta pestaña.
Cómo abrir la consola de BigQuery
- En la consola de Google Cloud, seleccione elmenú de navegación > BigQuery.
Se abrirá el cuadro de mensaje Te damos la bienvenida a BigQuery en la consola de Cloud. Este cuadro de mensaje contiene un vínculo a la guía de inicio rápido y las notas de la versión.
- Haga clic en Listo.
Se abrirá la consola de BigQuery.
Tarea 1: Crea un conjunto de datos
- Para crear un conjunto de datos, haz clic en el ícono Ver acciones (View actions) junto al ID del proyecto y selecciona Crear conjunto de datos (Create dataset).
- A continuación, asigna el nombre
bqml_lab
al ID del conjunto de datos y haz clic en Crear conjunto de datos.
Prueba la tarea completada
Haz clic en Revisar mi progreso para verificar la tarea realizada. Si la completaste correctamente, se te otorgará una puntuación de evaluación.
Tarea 2: Crea un modelo
Ahora, avanza a tu tarea.
- Ve al EDITOR de BigQuery y escribe o pega la siguiente consulta para crear un modelo que prediga si un visitante realizará una transacción:
- Haz clic en EJECUTAR.
Aquí se utiliza el sistema operativo del dispositivo del visitante, la información sobre si este es un dispositivo móvil, el país del visitante y la cantidad de vistas de página como criterio para determinar si se realizó una transacción.
En este caso, bqml_lab
es el nombre del conjunto de datos y sample_model
es el nombre del modelo. El tipo de modelo especificado es regresión logística binaria. En este caso, label
es lo que estás intentado ajustar.
input_label_cols
.
Los datos de entrenamiento se limitan a los recolectados entre el 1 de agosto de 2016 y el 30 de junio de 2017. Esto se hace para guardar el último mes de datos para la “predicción”. Se limita, además, a 100,000 datos para ahorrar tiempo.
La ejecución del comando CREATE MODEL
crea un trabajo de consulta que se ejecutará de manera asíncrona para que puedas, por ejemplo, cerrar o actualizar la ventana de la IU de BigQuery.
Prueba la tarea completada
Haz clic en Revisar mi progreso para verificar la tarea realizada. Si la completaste correctamente, se te otorgará una puntuación de evaluación.
Opcional: Información del modelo y estadísticas de entrenamiento
Si te interesa, expande el conjunto de datos bqml_lab
y, luego, haz clic en el modelo sample_model
en la IU para obtener información sobre el modelo. En la pestaña Detalles (Details), deberías encontrar información básica sobre el modelo y opciones de entrenamiento que se usan para producir el modelo. En Entrenamiento (Training), deberías ver una tabla o gráficos, dependiendo de la configuración de Ver como (View as):
Tarea 3: Evalúa el modelo
- Reemplaza la consulta anterior por lo siguiente y, luego, haz clic en Ejecutar:
Si la utilizas con un modelo de regresión lineal, la consulta anterior muestra las siguientes columnas:
-
mean_absolute_error
,mean_squared_error
,mean_squared_log_error
, -
median_absolute_error
,r2_score
,explained_variance
.
Si la utilizas con un modelo de regresión logística, la consulta anterior muestra las siguientes columnas:
-
precision
,recall
-
accuracy
,f1_score
-
log_loss
,roc_auc
Consulta el glosario de aprendizaje automático o ejecuta una búsqueda de Google para comprender cómo se calcula y qué significa cada una de estas métricas.
Te darás cuenta de que las partes SELECT
y FROM
de la consulta son idénticas a las usadas durante el entrenamiento. La parte WHERE
refleja el cambio en el período y la parte FROM
muestra que estás llamando a ml.EVALUATE
.
Deberías ver una tabla similar a la siguiente:
Prueba la tarea completada
Haz clic en Revisar mi progreso para verificar la tarea realizada. Si la completaste correctamente, se te otorgará una puntuación de evaluación.
Tarea 4: Usa el modelo
Predice compras por país
Con esta consulta, intentarás predecir la cantidad de transacciones realizadas por visitantes de cada país, ordenar los resultados y seleccionar los 10 países que realizaron más compras:
- Reemplaza la consulta anterior por lo siguiente y, luego, haz clic en Ejecutar:
Esta consulta es muy parecida a la consulta de evaluación demostrada en la sección anterior. En lugar de ml.EVALUATE
, estás usando ml.PREDICT
y la parte de BigQuery ML de la consulta está unida con comandos de SQL estándar. En este lab, te interesan el país y la suma de las compras de cada país, por eso se usan SELECT
, GROUP BY
y ORDER BY
. LIMIT
se usa para garantizar que solo obtengas los 10 resultados principales.
Deberías ver una tabla similar a la siguiente:
Prueba la tarea completada
Haz clic en Revisar mi progreso para verificar la tarea realizada. Si la completaste correctamente, se te otorgará una puntuación de evaluación.
Predice compras por usuario
A continuación, se muestra otro ejemplo. Esta vez, intentarás predecir la cantidad de transacciones realizadas por cada visitante, ordenar los resultados y seleccionar los 10 visitantes que más transacciones realizan:
- Reemplaza la consulta anterior por lo siguiente y, luego, haz clic en Ejecutar:
Deberías ver una tabla similar a la siguiente:
Prueba la tarea completada
Haz clic en Revisar mi progreso para verificar la tarea realizada. Si la completaste correctamente, se te otorgará una puntuación de evaluación.
Tarea 5: Pon a prueba tus conocimientos
A continuación, se presentan algunas preguntas de opción múltiple para reforzar tus conocimientos de los conceptos de este lab. Trata de responderlas lo mejor posible.
¡Felicitaciones!
Utilizaste BigQuery ML para crear un modelo de regresión logística binario, evaluarlo y usarlo para realizar predicciones.
Próximos pasos y más información
- Para obtener más información sobre BigQuery ML, consulta la documentación.
- ¿Tienes una cuenta de Google Analytics y deseas consultar tus propios conjuntos de datos en BigQuery? Sigue esta guía de exportación.
- Como recurso adicional, puedes encontrar la guía de referencia completa de BigQuery SQL aquí: https://cloud.google.com/bigquery/docs/reference/standard-sql/query-syntax
Capacitación y certificación de Google Cloud
Recibe la formación que necesitas para aprovechar al máximo las tecnologías de Google Cloud. Nuestras clases incluyen habilidades técnicas y recomendaciones para ayudarte a avanzar rápidamente y a seguir aprendiendo. Para que puedas realizar nuestros cursos cuando más te convenga, ofrecemos distintos tipos de capacitación de nivel básico a avanzado: a pedido, presenciales y virtuales. Las certificaciones te ayudan a validar y demostrar tus habilidades y tu conocimiento técnico respecto a las tecnologías de Google Cloud.
Última actualización del manual: 22 de febrero de 2024
Prueba más reciente del lab: 22 de febrero de 2024
Copyright 2024 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.