Puntos de control
Run a query (dataset: samples, table: shakespeare, substring: raisin)
/ 10
Run a query (dataset: samples, table: shakespeare, substring: huzzah)
/ 10
Create a new dataset (name: babynames)
/ 20
Load the data into a new table
/ 20
Run queries against your dataset table
/ 20
Remove the babynames dataset
/ 20
BigQuery: Qwik Start - Línea de comandos
GSP071
Descripción general
Almacenar y consultar grandes conjuntos de datos puede consumir bastante tiempo y dinero cuando no se cuenta con el hardware y la infraestructura adecuados. BigQuery es un almacén de datos en la nube, sin servidores y altamente escalable, que resuelve este problema a través de consultas rápidas en SQL, gracias a la potencia de procesamiento de la infraestructura de Google. Simplemente mueve tus datos a BigQuery y déjanos el trabajo duro a nosotros. Puedes controlar el acceso al proyecto y a tus datos (por ejemplo, puedes otorgar permisos de visualización o consulta de datos) según las necesidades de tu empresa.
Puedes acceder a BigQuery mediante la consola, la IU web o una herramienta de línea de comandos que use diversas bibliotecas cliente como Java, .NET o Python. También hay una variedad de proveedores de soluciones que puedes usar para interactuar con BigQuery.
En este lab práctico, se muestra cómo usar bq
, la herramienta de línea de comandos basada en Python de BigQuery, para consultar tablas públicas y cargar datos de muestra en BigQuery.
Actividades
- Consultar un conjunto de datos públicos
- Crear un conjunto de datos nuevo
- Cargar datos en una tabla nueva
- Consultar una tabla personalizada
Configuración y requisitos
Antes de hacer clic en el botón Comenzar lab
Lee estas instrucciones. Los labs son cronometrados y no se pueden pausar. El cronómetro, que comienza a funcionar cuando haces clic en Comenzar lab, indica por cuánto tiempo tendrás a tu disposición los recursos de Google Cloud.
Este lab práctico te permitirá realizar las actividades correspondientes en un entorno de nube real, no en uno de simulación o demostración. Para ello, se te proporcionan credenciales temporales nuevas que utilizarás para acceder a Google Cloud durante todo el lab.
Para completar este lab, necesitarás lo siguiente:
- Acceso a un navegador de Internet estándar (se recomienda el navegador Chrome)
- Tiempo para completar el lab: Recuerda que, una vez que comienzas un lab, no puedes pausarlo.
Cómo iniciar tu lab y acceder a la consola de Google Cloud
-
Haga clic en el botón Comenzar lab. Si debe pagar por el lab, se abrirá una ventana emergente para que seleccione su forma de pago. A la izquierda, se encuentra el panel Detalles del lab, que tiene estos elementos:
- El botón Abrir la consola de Google Cloud
- El tiempo restante
- Las credenciales temporales que debe usar para el lab
- Otra información para completar el lab, si es necesaria
-
Haz clic en Abrir la consola de Google Cloud (o haz clic con el botón derecho y selecciona Abrir el vínculo en una ventana de incógnito si ejecutas el navegador Chrome).
El lab inicia recursos y abre otra pestaña en la que se muestra la página de acceso.
Sugerencia: Ordene las pestañas en ventanas separadas, una junto a la otra.
Nota: Si ves el diálogo Elegir una cuenta, haz clic en Usar otra cuenta. -
De ser necesario, copia el nombre de usuario a continuación y pégalo en el diálogo Acceder.
{{{user_0.username | "Username"}}} También puedes encontrar el nombre de usuario en el panel Detalles del lab.
-
Haz clic en Siguiente.
-
Copia la contraseña que aparece a continuación y pégala en el diálogo Te damos la bienvenida.
{{{user_0.password | "Password"}}} También puedes encontrar la contraseña en el panel Detalles del lab.
-
Haz clic en Siguiente.
Importante: Debes usar las credenciales que te proporciona el lab. No uses las credenciales de tu cuenta de Google Cloud. Nota: Usar tu propia Cuenta de Google podría generar cargos adicionales. -
Haga clic para avanzar por las páginas siguientes:
- Acepta los Términos y Condiciones.
- No agregues opciones de recuperación o autenticación de dos factores (esta es una cuenta temporal).
- No te registres para obtener pruebas gratuitas.
Después de un momento, se abrirá la consola de Google Cloud en esta pestaña.
Activa Cloud Shell
Cloud Shell es una máquina virtual que cuenta con herramientas para desarrolladores. Ofrece un directorio principal persistente de 5 GB y se ejecuta en Google Cloud. Cloud Shell proporciona acceso de línea de comandos a tus recursos de Google Cloud.
- Haz clic en Activar Cloud Shell en la parte superior de la consola de Google Cloud.
Cuando te conectes, habrás completado la autenticación, y el proyecto estará configurado con tu PROJECT_ID. El resultado contiene una línea que declara el PROJECT_ID para esta sesión:
gcloud
es la herramienta de línea de comandos de Google Cloud. Viene preinstalada en Cloud Shell y es compatible con la función de autocompletado con tabulador.
- Puedes solicitar el nombre de la cuenta activa con este comando (opcional):
-
Haz clic en Autorizar.
-
Ahora, el resultado debería verse de la siguiente manera:
Resultado:
- Puedes solicitar el ID del proyecto con este comando (opcional):
Resultado:
Resultado de ejemplo:
gcloud
, consulta la guía con la descripción general de gcloud CLI en Google Cloud.
Tarea 1: Examina una tabla
BigQuery ofrece una variedad de tablas de muestra en las que puedes ejecutar consultas. En este lab, ejecutarás algunas consultas en la tabla shakespeare
, que contiene una entrada por cada palabra que aparece en cada obra.
Para examinar el esquema de la tabla Shakespeare en el conjunto de datos de muestra, ejecuta el siguiente comando:
Con este comando, realizas las siguientes acciones:
-
bq
para invocar la herramienta de línea de comandos de BigQuery -
show
es la acción - Luego, enumeras el nombre del
project:public dataset.table
que desees ver en BigQuery.
Resultado:
Tarea 2: Ejecuta el comando de ayuda
Puedes obtener información sobre un comando si incluyes su nombre a continuación del comando help.
- Por ejemplo, la siguiente llamada a
bq help
recupera información sobre el comandoquery
:
- Para ver la lista completa de los comandos que usa
bq
, ejecuta solo el comando de ayudabq help
.
Tarea 3: Ejecuta una consulta
Ahora, ejecutarás una consulta para ver cuántas veces aparece la subcadena “raisin” en las obras de Shakespeare.
- Para ejecutar una consulta, ejecuta el comando
bq query "[SQL_STATEMENT]"
:
-
Reemplaza cualquier comilla dentro de [SQL_STATEMENT] por \
-
Usa un tipo de comillas distinto fuera de ellas ("versus")
- Ejecuta la siguiente consulta en SQL estándar en Cloud Shell para registrar el número de veces que la substring “raisin” aparece en todas las obras de Shakespeare:
En este comando, la siguiente instrucción:
-
--use_legacy_sql=false
hace que el SQL estándar sea la sintaxis de consulta de forma predeterminada.
Resultado:
La tabla demuestra que, si bien la palabra raisin no aparece nunca, las letras que la conforman aparecen en ese orden en varias de las obras del autor.
Prueba la tarea completada
Haz clic en Revisar mi progreso para verificar la tarea realizada. Si has ejecutado con éxito una consulta con un conjunto de datos públicos, verás una puntuación de evaluación.
Si buscas una palabra que no está en las obras de Shakespeare, no se mostrarán resultados.
- Ejecuta la siguiente búsqueda de “huzzah” que no muestra ninguna coincidencia:
Prueba la tarea completada
Haz clic en Revisar mi progreso para verificar la tarea realizada. Si has ejecutado con éxito una consulta con un conjunto de datos públicos, verás una puntuación de evaluación.
Tarea 4: Crea una tabla nueva
Ahora, crea tu propia tabla. Cada tabla se almacena dentro de un conjunto de datos. Un conjunto de datos es un conjunto de recursos, como tablas y vistas.
Crear un conjunto de datos nuevo
- Utiliza el comando
bq ls
para enumerar los conjuntos de datos existentes en tu proyecto:
Como el proyecto aún no tiene conjuntos de datos, te redirigirá a la línea de comandos.
- Ejecuta
bq ls
y el ID del proyectobigquery-public-data
para listar los conjuntos de datos en ese proyecto específico, seguido de dos puntos (:):
Resultado:
A continuación, crea un conjunto de datos. El nombre de un conjunto de datos puede tener hasta 1,024 caracteres y llevar mayúsculas, minúsculas, números del 0 al 9 y guion bajo, pero no puede comenzar con un número o un guion bajo ni tener espacios.
- Usa el comando
bq mk
para crear un conjunto de datos nuevo con el nombrebabynames
en tu proyecto:
Resultado de muestra:
Prueba la tarea completada
Haz clic en Revisar mi progreso para verificar la tarea realizada. Si creaste con éxito un conjunto de datos de BigQuery llamado babynames, verás una puntuación de evaluación.
- Ejecuta
bq ls
para confirmar que el conjunto de datos aparece ahora como parte del proyecto:
Resultado de muestra:
Sube el conjunto de datos
Antes de generar la tabla, deberás agregar el conjunto de datos al proyecto. El archivo de datos personalizados que usarás contiene alrededor de 7 MB de datos con nombres populares de bebés proporcionados por la Administración de Seguridad Social de EE.UU.
- Ejecuta este comando para agregar el archivo ZIP baby names al proyecto con la URL del archivo de datos:
- Genera una lista del archivo:
Podrás ver el nombre del archivo agregado al proyecto.
- A continuación, descomprime el archivo:
- Como puedes ver, se trata de una larga lista de archivos de texto. Genera una lista de los archivos nuevamente:
El comando bq load
crea o actualiza una tabla y carga los datos en un solo paso.
Usarás el comando bq load
para cargar el archivo fuente en una tabla nueva llamada names2010 en el conjunto de datos babynames que acabas de crear. De forma predeterminada, este proceso se ejecuta sincrónicamente y tarda unos segundos.
Los argumentos bq load
que se ejecutarán son:
- Crea la tabla:
Resultado de muestra:
Prueba la tarea completada
Haz clic en Revisar mi progreso para verificar la tarea realizada. Si cargaste correctamente los datos en una tabla del conjunto de datos, verás una puntuación de evaluación.
- Ejecuta
bq ls
ybabynames
para confirmar que la tabla aparece ahora en el conjunto de datos:
Resultado:
- Ejecuta
bq show
y eldataset.table
para ver el esquema:
Resultado:
-E
. Para obtener más información sobre las codificaciones de caracteres, consulta la guía Introducción a la carga de datos.
Tarea 5: Ejecuta consultas
Sabes todo lo que necesitas para consultar los datos y obtener algunos resultados interesantes.
- Ejecuta el siguiente comando para mostrar los 5 nombres de niña más populares:
Resultado:
- Ejecuta el siguiente comando para ver los 5 nombres de niño más raros:
Resultado:
Prueba la tarea completada
Haz clic en Revisar mi progreso para verificar la tarea realizada. Si has conseguido con éxito consultar un conjunto de datos personalizado, verás una puntuación de evaluación.
Tarea 6: Pon a prueba tus conocimientos
A continuación, se presentan algunas preguntas de opción múltiple para reforzar tus conocimientos de los conceptos de este lab. Trata de responderlas lo mejor posible.
Tarea 7: Realiza una limpieza
- Ejecuta el comando
bq rm
para quitar el conjunto de datosbabynames
con la marca-r
y así eliminar todas las tablas del conjunto de datos:
- Escribe
Y
para confirmar el comando borrar.
Prueba la tarea completada
Haz clic en Revisar mi progreso para verificar la tarea realizada. Si has quitado con éxito el conjunto de datos babynames, verás una puntuación de evaluación.
¡Felicitaciones!
Ahora puedes usar la línea de comandos para consultar tablas públicas y cargar datos de muestra en BigQuery.
Próximos pasos y más información
Este lab también forma parte de una serie de labs denominada Qwik Starts. Estos labs están diseñados para ofrecerte una visión general de las numerosas funciones disponibles en Google Cloud. Busca “Qwik Starts” en el catálogo de labs para elegir el próximo lab que desees completar.
Capacitación y certificación de Google Cloud
Recibe la formación que necesitas para aprovechar al máximo las tecnologías de Google Cloud. Nuestras clases incluyen habilidades técnicas y recomendaciones para ayudarte a avanzar rápidamente y a seguir aprendiendo. Para que puedas realizar nuestros cursos cuando más te convenga, ofrecemos distintos tipos de capacitación de nivel básico a avanzado: a pedido, presenciales y virtuales. Las certificaciones te ayudan a validar y demostrar tus habilidades y tu conocimiento técnico respecto a las tecnologías de Google Cloud.
Última actualización del manual: 26 de enero de 2024
Prueba más reciente del lab: 24 de agosto de 2023
Copyright 2024 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.