arrow_back

Cómo cargar datos en BigQuery

Acceder Unirse
Obtén acceso a más de 700 labs y cursos

Cómo cargar datos en BigQuery

Lab 1 hora 30 minutos universal_currency_alt 5 créditos show_chart Introductorio
info Es posible que este lab incorpore herramientas de IA para facilitar tu aprendizaje.
Obtén acceso a más de 700 labs y cursos

Descripción general

BigQuery es la base de datos analítica de bajo costo, no-ops y completamente administrada de Google. Con BigQuery, puedes consultar muchos terabytes de datos sin tener que administrar infraestructuras y sin necesitar un administrador de base de datos. BigQuery usa SQL y puede aprovechar el modelo de pago por uso. Además, permite que te enfoques en el análisis de datos para buscar estadísticas valiosas.

En este lab, transferirás subconjuntos de datos de viajes en taxi en la ciudad de Nueva York a tablas de BigQuery.

Aprendizajes esperados

  • Cargar datos en BigQuery desde varias fuentes
  • Cargar datos en BigQuery con la CLI y la consola
  • Usar el DDL para crear tablas

Configuración

En cada lab, recibirá un proyecto de Google Cloud y un conjunto de recursos nuevos por tiempo limitado y sin costo adicional.

  1. Accede a Qwiklabs desde una ventana de incógnito.

  2. Ten en cuenta el tiempo de acceso del lab (por ejemplo, 1:15:00) y asegúrate de finalizarlo en el plazo asignado.
    No existe una función de pausa. Si lo necesita, puede reiniciar el lab, pero deberá hacerlo desde el comienzo.

  3. Cuando esté listo, haga clic en Comenzar lab.

  4. Anote las credenciales del lab (el nombre de usuario y la contraseña). Las usarás para acceder a la consola de Google Cloud.

  5. Haga clic en Abrir Google Console.

  6. Haga clic en Usar otra cuenta, copie las credenciales para este lab y péguelas en el mensaje emergente que aparece.
    Si usa otras credenciales, se generarán errores o incurrirá en cargos.

  7. Acepta las condiciones y omite la página de recursos de recuperación.

Abra BigQuery en Console

  1. En Google Cloud Console, seleccione el menú de navegación > BigQuery.

Se abrirá el cuadro de mensaje Te damos la bienvenida a BigQuery en Cloud Console, que contiene un vínculo a la guía de inicio rápido y enumera las actualizaciones de la IU.

  1. Haga clic en Listo.

Tarea 1. Crea un nuevo conjunto de datos para almacenar las tablas

  1. Para crear un conjunto de datos, haz clic en el ícono Ver acciones (los tres puntos verticales) junto al ID de tu proyecto y selecciona Crear conjunto de datos.

  2. A continuación, asigna el nombre nyctaxi al ID del conjunto de datos y deja todas las demás opciones con sus valores predeterminados. Luego, haz clic en Crear conjunto de datos.

Ahora, verás el conjunto de datos nyctaxi debajo del nombre de tu proyecto.

Haz clic en Revisar mi progreso para verificar el objetivo. Crear un conjunto de datos para almacenar nuevas tablas

Tarea 2. Transfiere un nuevo conjunto de datos desde un archivo CSV

En esta sección, cargarás un archivo CSV local en una tabla de BigQuery.

  1. Descarga localmente en tu computadora un subconjunto de datos de los viajes en taxi en la ciudad de Nueva York de 2018 desde este vínculo.

  2. En la consola de BigQuery, selecciona el conjunto de datos nyctaxi y, luego, haz clic en Crear tabla.

Especifica las siguientes opciones de tabla:

Fuente:

  • Crear tabla desde: Subir
  • Seleccionar archivo: selecciona el archivo que descargaste antes de forma local
  • Formato de archivo: CSV

Destino:

  • Nombre de la tabla: 2018trips (deja el resto de las opciones con la configuración predeterminada)

Esquema:

  • Marca Detección automática. (Nota: ¿No encuentras la casilla de verificación? Asegúrate de que el formato de archivo sea CSV y no Avro).

Opciones avanzadas

  • Deja la configuración predeterminada.

Haz clic en Crear tabla.

  1. Ahora, deberías ver la tabla 2018trips debajo del conjunto de datos nyctaxi.

Selecciona la tabla 2018trips y observa los detalles:

  1. Selecciona Vista previa y confirma que todas las columnas se hayan cargado (muestra a continuación):

Cargaste correctamente un archivo CSV en una nueva tabla de BigQuery.

Ejecuta consultas en SQL

A continuación, practica con una consulta básica en la tabla 2018trips.

  1. En el Editor de consultas, escribe una consulta para enumerar los 5 viajes más costosos del año:
#standardSQL SELECT * FROM nyctaxi.2018trips ORDER BY fare_amount DESC LIMIT 5

Haz clic en Revisar mi progreso para verificar el objetivo. Transferir un nuevo conjunto de datos desde un archivo CSV

Tarea 3. Transfiere un nuevo conjunto de datos desde Google Cloud Storage

Ahora, prueba cargar otro subconjunto de los mismos datos de viajes de 2018 que se encuentra disponible en Cloud Storage. Esta vez, lo haremos con la herramienta de la CLI.

  1. En Cloud Shell, ejecuta el siguiente comando:
bq load \ --source_format=CSV \ --autodetect \ --noreplace \ nyctaxi.2018trips \ gs://cloud-training/OCBL013/nyc_tlc_yellow_trips_2018_subset_2.csv Nota: Con el trabajo de carga anterior, especificas que este subconjunto se debe anexar a la tabla 2018trips existente que creaste arriba.
  1. Cuando se complete el trabajo de carga, se mostrará una confirmación en pantalla.

  2. Vuelve a la consola de BigQuery, selecciona la tabla 2018trips y ve los detalles. Confirma que se haya casi duplicado el recuento de filas.

  3. Puedes ejecutar la misma consulta que hiciste anteriormente para ver si cambian los resultados de los 5 viajes más costosos.

Haz clic en Revisar mi progreso para verificar el objetivo. Transferir un conjunto de datos desde Google Cloud Storage

Tarea 4. Crea tablas desde otras tablas con el DDL

La tabla 2018trips ahora incluye los viajes de todo el año. Luego, ¿qué consulta deberías ejecutar si solo tuvieras interés en los viajes de enero? A los efectos de este lab y para no dificultar el aprendizaje, solo nos enfocaremos en la fecha y hora de partida. Usemos el DDL para extraer estos datos y almacenarlos en otra tabla.

  1. En el Editor de consultas, ejecuta el siguiente comando CREATE TABLE:
#standardSQL CREATE TABLE nyctaxi.january_trips AS SELECT * FROM nyctaxi.2018trips WHERE EXTRACT(Month FROM pickup_datetime)=1;
  1. Ahora, ejecuta la siguiente consulta en el Editor de consultas para encontrar la mayor distancia recorrida en el mes de enero:
#standardSQL SELECT * FROM nyctaxi.january_trips ORDER BY trip_distance DESC LIMIT 1

Haz clic en Revisar mi progreso para verificar el objetivo. Crear tablas desde otras tablas con el DDL

¡Felicitaciones!

Creaste correctamente un nuevo conjunto de datos y transferiste a BigQuery información de un archivo CSV, Google Cloud Storage y otras tablas de BigQuery.

Finalice su lab

Cuando haya completado el lab, haga clic en Finalizar lab. Google Cloud Skills Boost quitará los recursos que usó y limpiará la cuenta.

Tendrá la oportunidad de calificar su experiencia en el lab. Seleccione la cantidad de estrellas que corresponda, ingrese un comentario y haga clic en Enviar.

La cantidad de estrellas indica lo siguiente:

  • 1 estrella = Muy insatisfecho
  • 2 estrellas = Insatisfecho
  • 3 estrellas = Neutral
  • 4 estrellas = Satisfecho
  • 5 estrellas = Muy satisfecho

Puede cerrar el cuadro de diálogo si no desea proporcionar comentarios.

Para enviar comentarios, sugerencias o correcciones, use la pestaña Asistencia.

Última actualización del manual: 27 de julio de 2022

Prueba más reciente del lab: 15 de julio de 2022

Copyright 2020 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.

Antes de comenzar

  1. Los labs crean un proyecto de Google Cloud y recursos por un tiempo determinado
  2. .
  3. Los labs tienen un límite de tiempo y no tienen la función de pausa. Si finalizas el lab, deberás reiniciarlo desde el principio.
  4. En la parte superior izquierda de la pantalla, haz clic en Comenzar lab para empezar

Este contenido no está disponible en este momento

Te enviaremos una notificación por correo electrónico cuando esté disponible

¡Genial!

Nos comunicaremos contigo por correo electrónico si está disponible

Un lab a la vez

Confirma para finalizar todos los labs existentes y comenzar este

Usa la navegación privada para ejecutar el lab

Usa una ventana de navegación privada o de Incógnito para ejecutar el lab. Así evitarás cualquier conflicto entre tu cuenta personal y la cuenta de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.