arrow_back

Aspectos básicos de GCP: Cómo comenzar a usar BigQuery

Acceder Unirse
Pon a prueba tus conocimientos y compártelos con nuestra comunidad
done
Obtén acceso a más de 700 labs prácticos, insignias de habilidad y cursos

Aspectos básicos de GCP: Cómo comenzar a usar BigQuery

Lab 30 minutos universal_currency_alt 5 créditos show_chart Introductorio
info Es posible que este lab incorpore herramientas de IA para facilitar tu aprendizaje.
Pon a prueba tus conocimientos y compártelos con nuestra comunidad
done
Obtén acceso a más de 700 labs prácticos, insignias de habilidad y cursos

Descripción general

En este lab, cargará un registro de servidor web en una tabla de BigQuery. Después de cargar los datos, realizará una consulta mediante la interfaz de usuario web y la CLI de BigQuery.

BigQuery ayuda a realizar análisis interactivos de bases de datos a escala de petabytes, lo que permite analizar conjuntos de datos masivos casi en tiempo real. Ofrece funciones y un lenguaje de consulta de SQL 2011 conocidos.

Los datos almacenados en BigQuery tienen alta durabilidad. De forma predeterminada, Google almacena sus datos de manera replicada y sin costo adicional para las réplicas. Con BigQuery, solo paga por los recursos que utiliza. El almacenamiento de datos en BigQuery es económico. Las consultas generan cargos en función de la cantidad de datos que procesan: cuando envía una consulta, pagará por los nodos de procesamiento solo durante esa consulta. No tiene que pagar para mantener funcionando un clúster de procesamiento.

Usar BigQuery implica interactuar con varios recursos de Google Cloud Platform, incluidos proyectos (que se abarcan en otra parte de este curso), conjuntos de datos, tablas y trabajos. En este lab, se presentan algunos de esos recursos, y esta breve introducción resume su función en la interacción con BigQuery.

Conjuntos de datos: Un conjunto de datos es un mecanismo de agrupación que conserva cero o más tablas. Un conjunto de datos es la unidad de control de acceso de nivel más bajo. Los conjuntos de datos son propiedad de los proyectos de GCP. Cada conjunto de datos puede compartirse con usuarios individuales.

Tablas: Una tabla es una estructura de filas y columnas que contiene datos reales. Cada tabla tiene un esquema que describe columnas de valores con tipo especificado. Cada tabla pertenece a un conjunto de datos.

Objetivos

En este lab, aprenderá a realizar las siguientes tareas:

  • Cargar datos de Cloud Storage en BigQuery

  • Realizar una consulta sobre los datos en BigQuery

Tarea 1: Acceda a Google Cloud Platform (GCP) Console

En cada lab, recibirá un proyecto de Google Cloud y un conjunto de recursos nuevos por tiempo limitado y sin costo adicional.

  1. Accede a Qwiklabs desde una ventana de incógnito.

  2. Ten en cuenta el tiempo de acceso del lab (por ejemplo, 1:15:00) y asegúrate de finalizarlo en el plazo asignado.
    No existe una función de pausa. Si lo necesita, puede reiniciar el lab, pero deberá hacerlo desde el comienzo.

  3. Cuando esté listo, haga clic en Comenzar lab.

  4. Anote las credenciales del lab (el nombre de usuario y la contraseña). Las usarás para acceder a la consola de Google Cloud.

  5. Haga clic en Abrir Google Console.

  6. Haga clic en Usar otra cuenta, copie las credenciales para este lab y péguelas en el mensaje emergente que aparece.
    Si usa otras credenciales, se generarán errores o incurrirá en cargos.

  7. Acepta las condiciones y omite la página de recursos de recuperación.

Tenga en cuenta si su región asignada está más cerca de los Estados Unidos o de Europa.

Tarea 2: Cargue datos de Cloud Storage en BigQuery

  1. En Console, abra Menú de navegación (Menú de navegación) y haga clic en BigQuery y, luego, en Listo.

  2. Crear un conjunto de datos dentro de su proyecto haciendo clic en el icono Ver acciones junto a su ID de proyecto en la sección Explorador. Luego seleccione Crear un conjunto de datos.

  3. En el diálogo Crear conjunto de datos, para ID del conjunto de datos, escriba logdata.

  4. En Ubicación de los datos, seleccione United States (US), haga clic en Crear conjunto de datos.

  5. Cree una tabla nueva en logdata para almacenar los datos del archivo CSV.

  6. Expanda su ID de proyecto, y haga clic en el icono Ver acciones al lado de su conjunto de datos logdata. Luego seleccione Abrir.

  7. Haga clic en Crear tabla. En la página Crear tabla, en la sección Fuente, siga estos pasos:

  • En el menú Crear tabla desde, seleccione Google Cloud Storage y, en el campo, escriba cloud-training/gcpfci/access_log.csv.
  • Verifique que en Formato de archivo se haya establecido CSV.
Nota: Una vez que haya creado una tabla, la opción Crear a partir de trabajo anterior le permitirá utilizar su configuración rápidamente para crear tablas similares.
  1. En la sección Destino, siga estos pasos:

  • En Nombre del conjunto de datos, deje seleccionado logdata.

  • En Nombre de la tabla, escriba accesslog.

  • En Tipo de tabla, se debe seleccionar la opción Tabla nativa.

  1. En la sección Esquema, marque la casilla de Detección automática.

  2. Acepte los valores predeterminados restantes y haga clic en Crear tabla.

    BigQuery generará un trabajo de carga para crear la tabla y subir los datos a ella (esto puede tardar algunos segundos).

  3. Opcional: Para hacer un seguimiento del progreso del trabajo, haga clic en Historial de trabajos.

  4. Una vez que se haya completado el trabajo de carga, haga clic en logdata > accesslog.

  5. En la página de detalles de la tabla, haga clic en Detalles para visualizar sus propiedades y, luego, elija Vista previa a fin de ver sus datos.

    Cada fila de esta tabla registra una coincidencia en un servidor web. El primer campo, string_field_0, es la dirección IP del cliente. Los campos del cuarto al noveno registran el día, el mes, el año, la hora, los minutos y los segundos en que se produjo la coincidencia. En esta actividad, aprenderá sobre el patrón diario de carga en este servidor web.

Haga clic en Revisar mi progreso para verificar el objetivo. Cargar datos de Cloud Storage en BigQuery

Tarea 3: Realice una consulta sobre los datos mediante la IU web de BigQuery

En esta sección del lab, usará la IU web de BigQuery para consultar la tabla accesslog que creó anteriormente.

  1. En la ventana Editor de consultas, escriba (o copie y pegue) la siguiente consulta:

  2. Debido a que le indicó a BigQuery que descubriera automáticamente el esquema cuando cargara los datos, la hora del día durante la cual llegó cada coincidencia web está en un campo llamado int_field_6.

    select int64_field_6 as hour, count(*) as hitcount from logdata.accesslog
    group by hour
    order by hour
    

    Observe que el Validador de consultas le indica que la sintaxis es válida (representada por la marca de verificación verde) y le informa la cantidad de datos que procesará la consulta. La cantidad de datos procesados le permite determinar el precio de la consulta mediante la calculadora de precios de Cloud Platform.

  3. Haga clic en Ejecutar y examine los resultados. ¿A qué hora del día se utiliza más el sitio web? ¿En qué momento se utiliza menos?

Tarea 4: Realice una consulta sobre los datos mediante el comando bq

En esta sección del lab, usará el comando bq en Cloud Shell para consultar la tabla accesslog que creó anteriormente.

  1. En Google Cloud Platform Console, haga clic en Activar Cloud Shell Activar Cloud Shell y, luego, en Continuar.

  2. En el símbolo del sistema de Cloud Shell, ingrese este comando:

    bq query "select string_field_10 as request, count(*) as requestcount from logdata.accesslog group by request order by requestcount desc"
    

    La primera vez que use el comando bq, almacenará en caché su credencial de Google Cloud Platform y, luego, le pedirá que elija su proyecto predeterminado. Elija el proyecto que le asignó Qwiklabs. Su nombre comenzará con qwiklabs-gcp- seguido de un número hexadecimal.

    Luego, el comando bq realizará la acción solicitada en su línea de comandos. ¿Cuál de las URL que ofrece este servidor web fue la más popular? ¿Y la menos popular?

¡Felicitaciones!

En este lab, cargó datos almacenados en Cloud Storage en una tabla alojada por Google BigQuery. Luego, consultó los datos para descubrir patrones.

Finalice su lab

Cuando haya completado el lab, haga clic en Finalizar lab. Google Cloud Skills Boost quitará los recursos que usó y limpiará la cuenta.

Tendrá la oportunidad de calificar su experiencia en el lab. Seleccione la cantidad de estrellas que corresponda, ingrese un comentario y haga clic en Enviar.

La cantidad de estrellas indica lo siguiente:

  • 1 estrella = Muy insatisfecho
  • 2 estrellas = Insatisfecho
  • 3 estrellas = Neutral
  • 4 estrellas = Satisfecho
  • 5 estrellas = Muy satisfecho

Puede cerrar el cuadro de diálogo si no desea proporcionar comentarios.

Para enviar comentarios, sugerencias o correcciones, use la pestaña Asistencia.

Copyright 2020 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.

Este contenido no está disponible en este momento

Te enviaremos una notificación por correo electrónico cuando esté disponible

¡Genial!

Nos comunicaremos contigo por correo electrónico si está disponible