
Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
- On the top left of your screen, click Start lab to begin
Create a Cloud SQL instance
/ 30
Whitelist the Cloud Shell instance to access your SQL instance
/ 30
Create a bts database and flights table using the create_table.sql file
/ 40
En este lab, importarás datos desde archivos de texto CSV a Cloud SQL y, luego, llevarás a cabo algunos análisis de datos básicos mediante consultas simples.
El conjunto de datos de este lab se obtuvo de la Oficina de Estadísticas del Transporte de EE.UU. y contiene información histórica sobre los vuelos internos en Estados Unidos. Este conjunto de datos puede usarse para demostrar una amplia variedad de conceptos y técnicas sobre la ciencia de datos y se utiliza en todos los demás labs de la Quest Data Science on Google Cloud Platform.
Lee estas instrucciones. Los labs son cronometrados y no se pueden pausar. El cronómetro, que comienza a funcionar cuando haces clic en Comenzar lab, indica por cuánto tiempo tendrás a tu disposición los recursos de Google Cloud.
Este lab práctico te permitirá realizar las actividades correspondientes en un entorno de nube real, no en uno de simulación o demostración. Para ello, se te proporcionan credenciales temporales nuevas que utilizarás para acceder a Google Cloud durante todo el lab.
Para completar este lab, necesitarás lo siguiente:
Haga clic en el botón Comenzar lab. Si debe pagar por el lab, se abrirá una ventana emergente para que seleccione su forma de pago. A la izquierda, se encuentra el panel Detalles del lab, que tiene estos elementos:
Haz clic en Abrir la consola de Google Cloud (o haz clic con el botón derecho y selecciona Abrir el vínculo en una ventana de incógnito si ejecutas el navegador Chrome).
El lab inicia recursos y abre otra pestaña en la que se muestra la página de acceso.
Sugerencia: Ordene las pestañas en ventanas separadas, una junto a la otra.
De ser necesario, copia el nombre de usuario a continuación y pégalo en el diálogo Acceder.
También puedes encontrar el nombre de usuario en el panel Detalles del lab.
Haz clic en Siguiente.
Copia la contraseña que aparece a continuación y pégala en el diálogo Te damos la bienvenida.
También puedes encontrar la contraseña en el panel Detalles del lab.
Haz clic en Siguiente.
Haga clic para avanzar por las páginas siguientes:
Después de un momento, se abrirá la consola de Google Cloud en esta pestaña.
Cloud Shell es una máquina virtual que cuenta con herramientas para desarrolladores. Ofrece un directorio principal persistente de 5 GB y se ejecuta en Google Cloud. Cloud Shell proporciona acceso de línea de comandos a tus recursos de Google Cloud.
Cuando te conectes, habrás completado la autenticación, y el proyecto estará configurado con tu PROJECT_ID. El resultado contiene una línea que declara el PROJECT_ID para esta sesión:
gcloud
es la herramienta de línea de comandos de Google Cloud. Viene preinstalada en Cloud Shell y es compatible con la función de autocompletado con tabulador.
Haz clic en Autorizar.
Ahora, el resultado debería verse de la siguiente manera:
Resultado:
Resultado:
Resultado de ejemplo:
gcloud
, consulta la guía con la descripción general de gcloud CLI en Google Cloud.
En este lab, se utiliza un conjunto de muestras de código y secuencias de comandos que se desarrollaron para la 2ª edición del libro Data Science on Google Cloud Platform de O'Reilly Media, Inc. El lab aborda la configuración de Google Cloud SQL y las tareas de importación de datos que se tratan en la primera parte del capítulo 3, “Creating Compelling Dashboards”. Clonarás el repositorio de muestra que se usa en el capítulo 2 desde GitHub a Cloud Shell y llevarás a cabo todas las tareas del lab desde allí.
Este proceso tarda unos minutos en completarse.
Haz clic en Revisar mi progreso para verificar la tarea realizada. Si creaste correctamente una instancia de Cloud SQL, verás una puntuación de evaluación.
Haz clic en Revisar mi progreso para verificar la tarea realizada. Si incluiste correctamente Cloud Shell en la lista de entidades permitidas para acceder a la instancia de SQL, verás una puntuación de evaluación.
Para importar datos en una tabla de Postgres, primero debes crear una base de datos vacía y una tabla con el esquema correcto.
En la consola de Cloud, ve al menú de navegación () y haz clic en SQL.
Para abrir la página de Descripción general de una instancia, haz clic en el nombre flights
.
Selecciona Bases de datos en el menú de navegación de SQL de la izquierda.
Haz clic en Crear base de datos.
En el cuadro de diálogo Nueva base de datos, ingresa el nombre bts
para la base de datos.
Haz clic en Crear.
Para abrir la página de descripción general de una instancia, selecciona Descripción general en el menú de navegación de SQL.
Haz clic en Importar en la parte superior.
En el campo del archivo de Cloud Storage, haz clic en Explorar.
En la sección Buckets, haz clic en la flecha que se encuentra opuesta al nombre de tu bucket.
Selecciona el archivo create_table.sql
.
Haz clic en Seleccionar.
En la sección Formato del archivo, selecciona SQL.
Especifica la base de datos bts
en tu instancia de Cloud SQL.
Haz clic en Importar para iniciar la importación.
Se creará la tabla vacía unos segundos después.
Haz clic en Revisar mi progreso para verificar la tarea realizada. Si creaste correctamente una base de datos de la BTS y una tabla de vuelos mediante el archivo create_table.sql, verás una puntuación de evaluación.
Creaste la base de datos y la tabla vacías y, ahora, cargarás los archivos CSV en esta tabla. Explora el archivo 201501.csv en tu bucket para cargar los datos de enero y especifica CSV como el formato, bts como la base de datos y flights como la tabla.
En la página de tu instancia de Cloud SQL, haz clic en IMPORTAR.
En el campo de archivos de Cloud Storage, haz clic en Explorar. Luego, haz clic en la flecha que se encuentra opuesta al nombre de tu bucket y, por último, selecciona 201501.csv
.
Haz clic en Seleccionar.
Selecciona CSV como el formato de archivo.
Selecciona la base de datos bts
y escribe flights
para la tabla.
Haz clic en IMPORTAR.
Cuando se le solicite una contraseña, ingresa Passw0rd
. Es posible que no veas las letras mientras escribes.
En el mensaje que aparece, conéctate con la base de datos bts:
Cuando se le solicite una contraseña, ingresa Passw0rd
.
Luego, ejecuta una consulta para obtener los 5 aeropuertos más concurridos:
Si bien la consulta tiene alto rendimiento porque el conjunto de datos es relativamente pequeño (solo enero), esta se volverá más lenta cuando agregues más meses.
Las bases de datos relacionales son adecuadas para conjuntos de datos más pequeños, en los que puedes realizar consultas ad hoc que mostrarán un pequeño subconjunto de los datos. En el caso de los conjuntos de datos más grandes, debes indexar las columnas de interés para ajustar el rendimiento de este tipo de base de datos. Además, como las bases de datos relacionales normalmente admiten transacciones y garantizan una coherencia sólida, son una buena elección para los datos que se actualizarán a menudo.
Sin embargo, este tipo de base de datos es una mala opción en las siguientes situaciones:
Esto describe el caso de uso de las demoras en vuelos. En este caso, puedes cambiar de una base de datos relacional a un almacén de datos analítico: BigQuery. El almacén de datos analítico nos permitirá utilizar SQL, y tiene mucha más capacidad para trabajar con conjuntos de datos grandes y consultas ad hoc (es decir, no es necesario que indexe las columnas).
Ahora sabes cómo crear tablas y, también, cómo importar datos de texto que se almacenaron en Cloud Storage a Google Cloud SQL.
Aquí se muestran algunos pasos para continuar:
Recibe la formación que necesitas para aprovechar al máximo las tecnologías de Google Cloud. Nuestras clases incluyen habilidades técnicas y recomendaciones para ayudarte a avanzar rápidamente y a seguir aprendiendo. Para que puedas realizar nuestros cursos cuando más te convenga, ofrecemos distintos tipos de capacitación de nivel básico a avanzado: a pedido, presenciales y virtuales. Las certificaciones te ayudan a validar y demostrar tus habilidades y tu conocimiento técnico respecto a las tecnologías de Google Cloud.
Actualización más reciente del manual: 28 de noviembre de 2023
Prueba más reciente del lab: 28 de noviembre de 2023
Copyright 2024 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.
Este contenido no está disponible en este momento
Te enviaremos una notificación por correo electrónico cuando esté disponible
¡Genial!
Nos comunicaremos contigo por correo electrónico si está disponible
One lab at a time
Confirm to end all existing labs and start this one