En este lab, aprenderás el proceso de analizar un conjunto de datos almacenado en BigQuery con Colab Enterprise para realizar consultas y presentar los datos utilizando varias técnicas de representación de datos estadísticos. El análisis te ayudará a descubrir patrones en los datos.
Objetivos de aprendizaje
Crear un notebook de Colab Enterprise
Conectarte a conjuntos de datos de BigQuery
Realizar un análisis estadístico en un DataFrame de Pandas
Crear diagramas de Seaborn para realizar un análisis exploratorio de datos en Python
Escribir una consulta en SQL para seleccionar campos específicos de un conjunto de datos de BigQuery
Usar el historial de versiones para ver los cambios de código
Compartir un notebook de Colab Enterprise
Vertex AI es una plataforma unificada para compilar, implementar y administrar aplicaciones de aprendizaje automático (AA).
Vertex AI Colab Enterprise es una poderosa herramienta interactiva colaborativa creada para explorar, analizar, transformar y visualizar datos, además de compilar modelos de aprendizaje automático en Google Cloud. Ofrece las funciones de seguridad y cumplimiento necesarias para las organizaciones empresariales y se integra en otros servicios de Google Cloud, como Vertex AI y BigQuery, para mejorar el flujo de trabajo de ciencia de datos y aprendizaje automático.
BigQuery es un almacén de datos sin servidores, potente y completamente administrado que te permite analizar y administrar grandes conjuntos de datos con facilidad. Este producto utiliza un dialecto de SQL estándar conocido, lo que facilita su uso para los analistas y científicos de datos, que no necesitan aprender un lenguaje nuevo.
Vertex AI ofrece dos soluciones de notebook, Workbench y Colab Enterprise.
Colab Enterprise
El espacio de trabajo de Colab Enterprise consta de cinco secciones principales (como se muestra en la siguiente imagen): (1) almacenamiento de notebooks, (2) acciones para notebooks, (3) entornos de ejecución y plantillas de entornos de ejecución, (4) editor de notebooks y (5) celdas de código de notebooks. El almacenamiento de notebooks es la ubicación de los notebooks, las acciones para notebooks son acciones que se pueden realizar con un notebook, los entornos de ejecución te permiten "ejecutar" el notebook, el editor de notebooks sirve para realizar cambios en el notebook y las celdas de código te permiten ingresar código.
Configura tus entornos de Qwiklabs
Configuración de Qwiklabs
En cada lab, recibirá un proyecto de Google Cloud y un conjunto de recursos nuevos por tiempo limitado y sin costo adicional.
Accede a Qwiklabs desde una ventana de incógnito.
Ten en cuenta el tiempo de acceso del lab (por ejemplo, 1:15:00) y asegúrate de finalizarlo en el plazo asignado.
No existe una función de pausa. Si lo necesita, puede reiniciar el lab, pero deberá hacerlo desde el comienzo.
Cuando esté listo, haga clic en Comenzar lab.
Anote las credenciales del lab (el nombre de usuario y la contraseña). Las usarás para acceder a la consola de Google Cloud.
Haga clic en Abrir Google Console.
Haga clic en Usar otra cuenta, copie las credenciales para este lab y péguelas en el mensaje emergente que aparece.
Si usa otras credenciales, se generarán errores o incurrirá en cargos.
Acepta las condiciones y omite la página de recursos de recuperación.
En la sección Vertex AI, desplázate hacia abajo hasta Notebooks. Haz clic en Colab Enterprise.
A continuación, aparece la página "Te damos la bienvenida a Colab Enterprise".
En el menú Región, selecciona la región en la que crearás el notebook.
Haz clic en + CREAR NOTEBOOK en la sección Acciones rápidas.
Se abrirá un notebook nuevo.
Para ejecutar las celdas, debes crear un entorno de ejecución. Recuerda que los entornos de ejecución son instancias derivadas de las plantillas de entornos de ejecución que permiten a los usuarios ejecutar notebooks de Colab. Para crear un entorno de ejecución, primero debes crear una plantilla de entorno de ejecución.
Haz clic en PLANTILLAS DE ENTORNOS DE EJECUCIÓN. En esa página, haz clic en + NUEVA PLANTILLA.
Conceptos básicos del entorno de ejecución
Son tres pasos. Los pasos 2 y 3 son opcionales.
Paso 1: Proporciona información básica sobre el entorno de ejecución y selecciona la región como
Configura el procesamiento
Paso 2: Configura el procesamiento (opcional)
Redes y seguridad
Paso 3: Redes y seguridad (opcional)
Haz clic en Crear.
Tarea 3. Ejecuta código en un notebook de Colab Enterprise
En este ejemplo, la celda de código debajo de "Comenzar" usa NumPy para generar algunos datos aleatorios y matplotlib para visualizarlos.
Haz clic en Colab Enterprise y, luego, en el notebook que creaste.
Copia el código que se muestra a continuación y haz clic en el ícono Ejecutar para ejecutar la celda.
import numpy as np
from matplotlib import pyplot as plt
ys = 200 + np.random.randn(100)
x = [x for x in range(len(ys))]
plt.plot(x, ys, '-')
plt.fill_between(x, ys, 195, where=(ys > 195), facecolor='g', alpha=0.6)
plt.title("Sample Visualization")
plt.show()
Cuando ejecutas la celda, aparece un mensaje que indica que el entorno de ejecución está activo y que se está iniciando una conexión, como se muestra en la siguiente imagen.
Haz clic en Abrir para abrir la ventana emergente de OAuth, luego, selecciona tu Nombre de usuario y haz clic en Permitir.
Ahora, revisa la celda que ejecutaste. Debería haber una marca de verificación verde junto a ella, lo que indica que la celda se ejecutó correctamente.
Ahora, haz un cambio en el código. Por ejemplo, cambia el título del gráfico de "Visualización de muestra" a "Colab Enterprise". Luego, ejecuta la celda.
Tarea 4. Muestra el historial de revisión
Una de las características más importantes del desarrollo de software es la capacidad de hacer un seguimiento del historial de versiones.
Ve a la sección Almacenamiento de notebooks. Haz clic en los tres puntos junto al notebook que creaste.
Selecciona Historial de revisión (como se muestra en la burbuja 1 de la imagen que aparece a continuación).
Cuando se selecciona el historial de revisión, verás los cambios uno al lado del otro con una fecha y un código de color para ver el "antiguo" en rojo y el "nuevo" en verde (como se muestra en la burbuja 2).
Hay tres opciones para visualizar el historial de revisión: el código fuente sin procesar, las diferencias intercaladas o el resultado del código fuente (como se muestra en la burbuja 3).
Tarea 5. Agrega código a las celdas
Para agregar código o texto a un notebook, solo debes hacer clic en el código o el texto en la barra de menú sobre el editor de notebooks.
Ahora, agregarás varios bloques de código al notebook. Después de copiar un bloque de código, ejecútalo para ver el resultado. Nota: Algunas celdas no tendrán resultado (como cuando importas las bibliotecas). Cuando termines, comparte el notebook.
Vuelve a la sección de almacenamiento de notebooks y, luego, haz clic en tu notebook.
Vuelve a ejecutar el primer código.
Agrega una celda de código.
Copia el código que se muestra a continuación en la nueva celda.
Importa las bibliotecas
import seaborn as sns
import pandas as pd
import numpy as np
from google.cloud import bigquery
bq = bigquery.Client()
Haz clic en el ícono Ejecutar para ejecutar la celda.
No debería aparecer ningún resultado.
Inserta el siguiente código como celdas para importar los módulos necesarios y así inicializar un cliente de BigQuery. El cliente de BigQuery se usará para enviar y recibir mensajes de la API de BigQuery.
Descarga una tabla de BigQuery en un DataFrame de Pandas
En Google, %%bigquery es un comando mágico que se usa en los notebooks de Jupyter y otros entornos interactivos para interactuar con BigQuery. Por lo tanto, %%bigquery le indica a tu entorno que cambie al modo de BigQuery: prepara el entorno para aceptar y ejecutar consultas de BigQuery. BigQuery ejecutará la consulta, recuperará los datos y los presentará en el entorno del notebook, a menudo, como un DataFrame de Pandas (p. ej., el "df" que se muestra en el código).
%%bigquery df
SELECT *
FROM `bigquery-public-data.catalonian_mobile_coverage_eu.mobile_data_2015_2017`
Se muestra el resultado:
Muestra las primeras cinco filas del DataFrame de Pandas
Escribe una consulta en SQL para seleccionar campos específicos de un conjunto de datos de BigQuery
%%bigquery df2
SELECT signal, status
FROM `bigquery-public-data.catalonian_mobile_coverage_eu.mobile_data_2015_2017`
Se muestra el resultado:
Obtén las primeras cinco filas de los nuevos campos
df2.head()
Se muestra el resultado:
Tarea 6. Comparte el notebook
A continuación, comparte tu notebook.
Cuando seleccionas "Compartir" haciendo clic con el botón derecho en el notebook, aparece una ventana de permisos de uso compartido que te permite editar o borrar permisos, o seleccionar "Agregar principal" para otorgar acceso nuevo.
Cuando otorgas a las principales acceso a un recurso, también agregas roles para especificar qué acciones pueden realizar. De manera opcional, puedes agregar condiciones para otorgar acceso a las principales solo cuando se cumplan criterios específicos.
Las principales son usuarios, grupos, dominios o cuentas de servicio. Los roles se componen de conjuntos de permisos y determinan lo que la principal puede hacer con este recurso.
¡Felicitaciones!
En este lab, aprendiste a realizar las siguientes tareas:
Crear un notebook de Colab Enterprise
Conectarte a conjuntos de datos de BigQuery
Realizar un análisis estadístico en un DataFrame de Pandas
Crear diagramas de Seaborn para realizar un análisis exploratorio de datos en Python
Escribir una consulta en SQL para seleccionar campos específicos de un conjunto de datos de BigQuery
Usar el historial de versiones para ver los cambios de código
Compartir un notebook de Colab Enterprise
Finalice su lab
Cuando haya completado su lab, haga clic en Finalizar lab. Qwiklabs quitará los recursos que usó y limpiará la cuenta por usted.
Tendrá la oportunidad de calificar su experiencia en el lab. Seleccione la cantidad de estrellas que corresponda, ingrese un comentario y haga clic en Enviar.
La cantidad de estrellas indica lo siguiente:
1 estrella = Muy insatisfecho
2 estrellas = Insatisfecho
3 estrellas = Neutral
4 estrellas = Satisfecho
5 estrellas = Muy satisfecho
Puede cerrar el cuadro de diálogo si no desea proporcionar comentarios.
Para enviar comentarios, sugerencias o correcciones, use la pestaña Asistencia.
Última actualización del manual: 11 de diciembre de 2024
Prueba más reciente del lab: 11 de diciembre de 2024
Copyright 2024 Google LLC. Todos los derechos reservados. Google y el logotipo de Google son marcas de Google LLC. El resto de los nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que están asociados.
Los labs crean un proyecto de Google Cloud y recursos por un tiempo determinado
.
Los labs tienen un límite de tiempo y no tienen la función de pausa. Si finalizas el lab, deberás reiniciarlo desde el principio.
En la parte superior izquierda de la pantalla, haz clic en Comenzar lab para empezar
Usa la navegación privada
Copia el nombre de usuario y la contraseña proporcionados para el lab
Haz clic en Abrir la consola en modo privado
Accede a la consola
Accede con tus credenciales del lab. Si usas otras credenciales, se generarán errores o se incurrirá en cargos.
Acepta las condiciones y omite la página de recursos de recuperación
No hagas clic en Finalizar lab, a menos que lo hayas terminado o quieras reiniciarlo, ya que se borrará tu trabajo y se quitará el proyecto
Este contenido no está disponible en este momento
Te enviaremos una notificación por correo electrónico cuando esté disponible
¡Genial!
Nos comunicaremos contigo por correo electrónico si está disponible
Un lab a la vez
Confirma para finalizar todos los labs existentes y comenzar este
Usa la navegación privada para ejecutar el lab
Usa una ventana de navegación privada o de Incógnito para ejecutar el lab. Así
evitarás cualquier conflicto entre tu cuenta personal y la cuenta
de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.
Análisis exploratorio de datos con BigQuery y Colab Enterprise
Duración:
0 min de configuración
·
Acceso por 120 min
·
120 min para completar