BigQuery es la base de datos analítica de bajo costo, no-ops y completamente administrada de Google. Con BigQuery, puedes consultar muchos terabytes de datos sin tener que administrar infraestructuras y sin necesitar un administrador de base de datos. BigQuery usa SQL y puede aprovechar el modelo de pago por uso. Además, permite que te enfoques en el análisis de datos para buscar estadísticas valiosas.
En este lab, transferirás subconjuntos de datos de viajes en taxi en la ciudad de Nueva York a tablas de BigQuery.
Aprendizajes esperados
Cargar datos en BigQuery desde varias fuentes
Cargar datos en BigQuery con la CLI y la consola
Usar el DDL para crear tablas
Configuración
En cada lab, recibirá un proyecto de Google Cloud y un conjunto de recursos nuevos por tiempo limitado y sin costo adicional.
Accede a Qwiklabs desde una ventana de incógnito.
Ten en cuenta el tiempo de acceso del lab (por ejemplo, 1:15:00) y asegúrate de finalizarlo en el plazo asignado.
No existe una función de pausa. Si lo necesita, puede reiniciar el lab, pero deberá hacerlo desde el comienzo.
Cuando esté listo, haga clic en Comenzar lab.
Anote las credenciales del lab (el nombre de usuario y la contraseña). Las usarás para acceder a la consola de Google Cloud.
Haga clic en Abrir Google Console.
Haga clic en Usar otra cuenta, copie las credenciales para este lab y péguelas en el mensaje emergente que aparece.
Si usa otras credenciales, se generarán errores o incurrirá en cargos.
Acepta las condiciones y omite la página de recursos de recuperación.
Abra BigQuery en Console
En Google Cloud Console, seleccione el menú de navegación > BigQuery.
Se abrirá el cuadro de mensaje Te damos la bienvenida a BigQuery en Cloud Console, que contiene un vínculo a la guía de inicio rápido y enumera las actualizaciones de la IU.
Haga clic en Listo.
Tarea 1. Crea un nuevo conjunto de datos para almacenar las tablas
Para crear un conjunto de datos, haz clic en el ícono Ver acciones (los tres puntos verticales) junto al ID de tu proyecto y selecciona Crear conjunto de datos.
A continuación, asigna el nombre nyctaxi al ID del conjunto de datos y deja todas las demás opciones con sus valores predeterminados. Luego, haz clic en Crear conjunto de datos.
Ahora, verás el conjunto de datos nyctaxi debajo del nombre de tu proyecto.
Haz clic en Revisar mi progreso para verificar el objetivo.
Crear un conjunto de datos para almacenar nuevas tablas
Tarea 2. Transfiere un nuevo conjunto de datos desde un archivo CSV
En esta sección, cargarás un archivo CSV local en una tabla de BigQuery.
Descarga localmente en tu computadora un subconjunto de datos de los viajes en taxi en la ciudad de Nueva York de 2018 desde este vínculo.
En la consola de BigQuery, selecciona el conjunto de datos nyctaxi y, luego, haz clic en Crear tabla.
Especifica las siguientes opciones de tabla:
Fuente:
Crear tabla desde: Subir
Seleccionar archivo: selecciona el archivo que descargaste antes de forma local
Formato de archivo: CSV
Destino:
Nombre de la tabla: 2018trips
(deja el resto de las opciones con la configuración predeterminada)
Esquema:
Marca Detección automática. (Nota: ¿No encuentras la casilla de verificación? Asegúrate de que el formato de archivo sea CSV y no Avro).
Opciones avanzadas
Deja la configuración predeterminada.
Haz clic en Crear tabla.
Ahora, deberías ver la tabla 2018trips debajo del conjunto de datos nyctaxi.
Selecciona la tabla 2018trips y observa los detalles:
Selecciona Vista previa y confirma que todas las columnas se hayan cargado (muestra a continuación):
Cargaste correctamente un archivo CSV en una nueva tabla de BigQuery.
Ejecuta consultas en SQL
A continuación, practica con una consulta básica en la tabla 2018trips.
En el Editor de consultas, escribe una consulta para enumerar los 5 viajes más costosos del año:
#standardSQL
SELECT
*
FROM
nyctaxi.2018trips
ORDER BY
fare_amount DESC
LIMIT 5
Haz clic en Revisar mi progreso para verificar el objetivo.
Transferir un nuevo conjunto de datos desde un archivo CSV
Tarea 3. Transfiere un nuevo conjunto de datos desde Google Cloud Storage
Ahora, prueba cargar otro subconjunto de los mismos datos de viajes de 2018 que se encuentra disponible en Cloud Storage. Esta vez, lo haremos con la herramienta de la CLI.
En Cloud Shell, ejecuta el siguiente comando:
bq load \
--source_format=CSV \
--autodetect \
--noreplace \
nyctaxi.2018trips \
gs://cloud-training/OCBL013/nyc_tlc_yellow_trips_2018_subset_2.csv
Nota: Con el trabajo de carga anterior, especificas que este subconjunto se debe anexar a la tabla 2018trips existente que creaste arriba.
Cuando se complete el trabajo de carga, se mostrará una confirmación en pantalla.
Vuelve a la consola de BigQuery, selecciona la tabla 2018trips y ve los detalles. Confirma que se haya casi duplicado el recuento de filas.
Puedes ejecutar la misma consulta que hiciste anteriormente para ver si cambian los resultados de los 5 viajes más costosos.
Haz clic en Revisar mi progreso para verificar el objetivo.
Transferir un conjunto de datos desde Google Cloud Storage
Tarea 4. Crea tablas desde otras tablas con el DDL
La tabla 2018trips ahora incluye los viajes de todo el año. Luego, ¿qué consulta deberías ejecutar si solo tuvieras interés en los viajes de enero? A los efectos de este lab y para no dificultar el aprendizaje, solo nos enfocaremos en la fecha y hora de partida. Usemos el DDL para extraer estos datos y almacenarlos en otra tabla.
En el Editor de consultas, ejecuta el siguiente comando CREATE TABLE:
#standardSQL
CREATE TABLE
nyctaxi.january_trips AS
SELECT
*
FROM
nyctaxi.2018trips
WHERE
EXTRACT(Month
FROM
pickup_datetime)=1;
Ahora, ejecuta la siguiente consulta en el Editor de consultas para encontrar la mayor distancia recorrida en el mes de enero:
#standardSQL
SELECT
*
FROM
nyctaxi.january_trips
ORDER BY
trip_distance DESC
LIMIT
1
Haz clic en Revisar mi progreso para verificar el objetivo.
Crear tablas desde otras tablas con el DDL
¡Felicitaciones!
Creaste correctamente un nuevo conjunto de datos y transferiste a BigQuery información de un archivo CSV, Google Cloud Storage y otras tablas de BigQuery.
Finalice su lab
Cuando haya completado el lab, haga clic en Finalizar lab. Google Cloud Skills Boost quitará los recursos que usó y limpiará la cuenta.
Tendrá la oportunidad de calificar su experiencia en el lab. Seleccione la cantidad de estrellas que corresponda, ingrese un comentario y haga clic en Enviar.
La cantidad de estrellas indica lo siguiente:
1 estrella = Muy insatisfecho
2 estrellas = Insatisfecho
3 estrellas = Neutral
4 estrellas = Satisfecho
5 estrellas = Muy satisfecho
Puede cerrar el cuadro de diálogo si no desea proporcionar comentarios.
Para enviar comentarios, sugerencias o correcciones, use la pestaña Asistencia.
Última actualización del manual: 27 de julio de 2022
Prueba más reciente del lab: 15 de julio de 2022
Copyright 2020 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.
Los labs crean un proyecto de Google Cloud y recursos por un tiempo determinado
.
Los labs tienen un límite de tiempo y no tienen la función de pausa. Si finalizas el lab, deberás reiniciarlo desde el principio.
En la parte superior izquierda de la pantalla, haz clic en Comenzar lab para empezar
Usa la navegación privada
Copia el nombre de usuario y la contraseña proporcionados para el lab
Haz clic en Abrir la consola en modo privado
Accede a la consola
Accede con tus credenciales del lab. Si usas otras credenciales, se generarán errores o se incurrirá en cargos.
Acepta las condiciones y omite la página de recursos de recuperación
No hagas clic en Finalizar lab, a menos que lo hayas terminado o quieras reiniciarlo, ya que se borrará tu trabajo y se quitará el proyecto
Este contenido no está disponible en este momento
Te enviaremos una notificación por correo electrónico cuando esté disponible
¡Genial!
Nos comunicaremos contigo por correo electrónico si está disponible
Un lab a la vez
Confirma para finalizar todos los labs existentes y comenzar este
Usa la navegación privada para ejecutar el lab
Usa una ventana de navegación privada o de Incógnito para ejecutar el lab. Así
evitarás cualquier conflicto entre tu cuenta personal y la cuenta
de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.
En este lab, nos enfocaremos en cómo transferir datos a tablas de BigQuery.
Duración:
0 min de configuración
·
Acceso por 90 min
·
90 min para completar