
Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
- On the top left of your screen, click Start lab to begin
Run a query (dataset: samples, table: shakespeare, substring: raisin)
/ 10
Run a query (dataset: samples, table: shakespeare, substring: huzzah)
/ 10
Create a new dataset (name: babynames)
/ 20
Load the data into a new table
/ 20
Run queries against your dataset table
/ 20
Remove the babynames dataset
/ 20
Almacenar y consultar grandes conjuntos de datos puede consumir bastante tiempo y dinero cuando no se cuenta con el hardware y la infraestructura adecuados. BigQuery es un almacén de datos en la nube, sin servidores y altamente escalable, que resuelve este problema a través de consultas rápidas en SQL, gracias a la potencia de procesamiento de la infraestructura de Google. Simplemente mueve tus datos a BigQuery y déjanos el trabajo duro a nosotros. Puedes controlar el acceso al proyecto y a tus datos (por ejemplo, puedes otorgar permisos de visualización o consulta de datos) según las necesidades de tu empresa.
Puedes acceder a BigQuery mediante la consola, la IU web o una herramienta de línea de comandos que use diversas bibliotecas cliente como Java, .NET o Python. También hay una variedad de proveedores de soluciones que puedes usar para interactuar con BigQuery.
En este lab práctico, se muestra cómo usar bq
, la herramienta de línea de comandos basada en Python de BigQuery, para consultar tablas públicas y cargar datos de muestra en BigQuery.
Lee estas instrucciones. Los labs cuentan con un temporizador que no se puede pausar. El temporizador, que comienza a funcionar cuando haces clic en Comenzar lab, indica por cuánto tiempo tendrás a tu disposición los recursos de Google Cloud.
Este lab práctico te permitirá realizar las actividades correspondientes en un entorno de nube real, no en uno de simulación o demostración. Para ello, se te proporcionan credenciales temporales nuevas que utilizarás para acceder a Google Cloud durante todo el lab.
Para completar este lab, necesitarás lo siguiente:
Haz clic en el botón Comenzar lab. Si debes pagar por el lab, se abrirá un diálogo para que selecciones la forma de pago. A la izquierda, se encuentra el panel Detalles del lab, que tiene estos elementos:
Haz clic en Abrir la consola de Google Cloud (o haz clic con el botón derecho y selecciona Abrir el vínculo en una ventana de incógnito si ejecutas el navegador Chrome).
El lab inicia recursos y abre otra pestaña en la que se muestra la página de acceso.
Sugerencia: Ordena las pestañas en ventanas separadas, una junto a la otra.
De ser necesario, copia el nombre de usuario a continuación y pégalo en el diálogo Acceder.
También puedes encontrar el nombre de usuario en el panel Detalles del lab.
Haz clic en Siguiente.
Copia la contraseña que aparece a continuación y pégala en el diálogo Te damos la bienvenida.
También puedes encontrar la contraseña en el panel Detalles del lab.
Haz clic en Siguiente.
Haz clic para avanzar por las páginas siguientes:
Después de un momento, se abrirá la consola de Google Cloud en esta pestaña.
Cloud Shell es una máquina virtual que cuenta con herramientas para desarrolladores. Ofrece un directorio principal persistente de 5 GB y se ejecuta en Google Cloud. Cloud Shell proporciona acceso de línea de comandos a tus recursos de Google Cloud.
Cuando te conectes, habrás completado la autenticación, y el proyecto estará configurado con tu PROJECT_ID. El resultado contiene una línea que declara el PROJECT_ID para esta sesión:
gcloud
es la herramienta de línea de comandos de Google Cloud. Viene preinstalada en Cloud Shell y es compatible con la función de autocompletado con tabulador.
Haz clic en Autorizar.
Ahora, el resultado debería verse de la siguiente manera:
Resultado:
Resultado:
Resultado de ejemplo:
gcloud
, consulta la guía con la descripción general de gcloud CLI en Google Cloud.
BigQuery ofrece una variedad de tablas de muestra en las que puedes ejecutar consultas. En este lab, ejecutarás algunas consultas en la tabla shakespeare
, que contiene una entrada por cada palabra que aparece en cada obra.
Para examinar el esquema de la tabla Shakespeare en el conjunto de datos de muestra, ejecuta el siguiente comando:
Con este comando, realizas las siguientes acciones:
bq
para invocar la herramienta de línea de comandos de BigQueryshow
es la acciónproject:public dataset.table
que desees ver en BigQuery.Resultado:
Puedes obtener información sobre un comando si incluyes su nombre a continuación del comando help.
bq help
recupera información sobre el comando query
:bq
, ejecuta solo el comando de ayuda bq help
.Ahora, ejecutarás una consulta para ver cuántas veces aparece la subcadena “raisin” en las obras de Shakespeare.
bq query "[SQL_STATEMENT]"
:Reemplaza cualquier comilla dentro de [SQL_STATEMENT] por \
Usa un tipo de comillas distinto fuera de ellas ("versus")
En este comando, la siguiente instrucción:
--use_legacy_sql=false
hace que el SQL estándar sea la sintaxis de consulta de forma predeterminada.Resultado:
La tabla demuestra que, si bien la palabra raisin no aparece nunca, las letras que la conforman aparecen en ese orden en varias de las obras del autor.
Haz clic en Revisar mi progreso para verificar la tarea realizada. Si has ejecutado con éxito una consulta con un conjunto de datos públicos, verás una puntuación de evaluación.
Si buscas una palabra que no está en las obras de Shakespeare, no se mostrarán resultados.
Haz clic en Revisar mi progreso para verificar la tarea realizada. Si has ejecutado con éxito una consulta con un conjunto de datos públicos, verás una puntuación de evaluación.
Ahora, crea tu propia tabla. Cada tabla se almacena dentro de un conjunto de datos. Un conjunto de datos es un conjunto de recursos, como tablas y vistas.
bq ls
para enumerar los conjuntos de datos existentes en tu proyecto:Como el proyecto aún no tiene conjuntos de datos, te redirigirá a la línea de comandos.
bq ls
y el ID del proyecto bigquery-public-data
para listar los conjuntos de datos en ese proyecto específico, seguido de dos puntos (:):Resultado:
A continuación, crea un conjunto de datos. El nombre de un conjunto de datos puede tener hasta 1,024 caracteres y llevar mayúsculas, minúsculas, números del 0 al 9 y guion bajo, pero no puede comenzar con un número o un guion bajo ni tener espacios.
bq mk
para crear un conjunto de datos nuevo con el nombre babynames
en tu proyecto:Resultado de muestra:
Haz clic en Revisar mi progreso para verificar la tarea realizada. Si creaste con éxito un conjunto de datos de BigQuery llamado babynames, verás una puntuación de evaluación.
bq ls
para confirmar que el conjunto de datos aparece ahora como parte del proyecto:Resultado de muestra:
Antes de generar la tabla, deberás agregar el conjunto de datos al proyecto. El archivo de datos personalizados que usarás contiene alrededor de 7 MB de datos con nombres populares de bebés proporcionados por la Administración de Seguridad Social de EE.UU.
Podrás ver el nombre del archivo agregado al proyecto.
El comando bq load
crea o actualiza una tabla y carga los datos en un solo paso.
Usarás el comando bq load
para cargar el archivo fuente en una tabla nueva llamada names2010 en el conjunto de datos babynames que acabas de crear. De forma predeterminada, este proceso se ejecuta sincrónicamente y tarda unos segundos.
Los argumentos bq load
que se ejecutarán son:
Resultado de muestra:
Haz clic en Revisar mi progreso para verificar la tarea realizada. Si cargaste correctamente los datos en una tabla del conjunto de datos, verás una puntuación de evaluación.
bq ls
y babynames
para confirmar que la tabla aparece ahora en el conjunto de datos:Resultado:
bq show
y el dataset.table
para ver el esquema:Resultado:
-E
. Para obtener más información sobre las codificaciones de caracteres, consulta la guía Introducción a la carga de datos.
Sabes todo lo que necesitas para consultar los datos y obtener algunos resultados interesantes.
Resultado:
Resultado:
Haz clic en Revisar mi progreso para verificar la tarea realizada. Si has conseguido con éxito consultar un conjunto de datos personalizado, verás una puntuación de evaluación.
A continuación, se presentan algunas preguntas de opción múltiple para reforzar tus conocimientos de los conceptos de este lab. Trata de responderlas lo mejor posible.
bq rm
para quitar el conjunto de datos babynames
con la marca -r
y así eliminar todas las tablas del conjunto de datos:Y
para confirmar el comando borrar.Haz clic en Revisar mi progreso para verificar la tarea realizada. Si has quitado con éxito el conjunto de datos babynames, verás una puntuación de evaluación.
Ahora puedes usar la línea de comandos para consultar tablas públicas y cargar datos de muestra en BigQuery.
Este lab también forma parte de una serie de labs denominada Qwik Starts. Estos labs están diseñados para ofrecerte una visión general de las numerosas funciones disponibles en Google Cloud. Busca “Qwik Starts” en el catálogo de labs para elegir el próximo lab que desees completar.
Recibe la formación que necesitas para aprovechar al máximo las tecnologías de Google Cloud. Nuestras clases incluyen habilidades técnicas y recomendaciones para ayudarte a avanzar rápidamente y a seguir aprendiendo. Para que puedas realizar nuestros cursos cuando más te convenga, ofrecemos distintos tipos de capacitación de nivel básico a avanzado: a pedido, presenciales y virtuales. Las certificaciones te ayudan a validar y demostrar tus habilidades y tu conocimiento técnico respecto a las tecnologías de Google Cloud.
Última actualización del manual: 26 de enero de 2024
Prueba más reciente del lab: 24 de agosto de 2023
Copyright 2025 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.
Este contenido no está disponible en este momento
Te enviaremos una notificación por correo electrónico cuando esté disponible
¡Genial!
Nos comunicaremos contigo por correo electrónico si está disponible
One lab at a time
Confirm to end all existing labs and start this one