
Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
- On the top left of your screen, click Start lab to begin
Create a cloud storage bucket
/ 25
Upload CSV files to Cloud Storage
/ 25
Create a Cloud SQL instance
/ 25
Create a database
/ 25
SQL (Structured Query Language) ist eine Standardsprache für Datenoperationen, mit der Sie Fragen stellen und aus strukturierten Datasets Informationen gewinnen können. Diese Sprache wird häufig in der Datenbankverwaltung genutzt. Mit SQL können Sie beispielsweise Transaktionsdaten in relationale Datenbanken schreiben und Daten im Petabytebereich analysieren.
Das Lab besteht aus zwei Blöcken: Im ersten Block lernen Sie grundlegende Schlüsselwörter zur SQL-Abfrage kennen. Diese Schlüsselwörter verwenden Sie anschließend in BigQuery für ein öffentliches Dataset mit Informationen zu Fahrradverleihern in London.
Im zweiten Block lernen Sie, wie Teilmengen des Dataset zu Fahrradverleihern in London in CSV-Dateien exportiert werden, die dann nach Cloud SQL hochgeladen werden. Danach wird gezeigt, wie mit Cloud SQL Datenbanken und Tabellen erstellt und verwaltet werden. Am Ende des Labs erwarten Sie praktische Übungen mit zusätzlichen SQL-Schlüsselwörtern, mit denen Daten verarbeitet und bearbeitet werden.
Aufgaben in diesem Lab:
Sehr wichtig: Melden Sie sich von Ihrem privaten oder beruflichen Gmail-Konto ab, bevor Sie mit diesem Lab beginnen.
Dies ist ein Einführungs-Lab. Es werden keine oder nur wenige Vorkenntnisse zu SQL vorausgesetzt. Grundkenntnisse in Cloud Storage und Cloud Shell werden empfohlen, sind aber keine Voraussetzung. In diesem Lab lernen Sie die Grundlagen, um Abfragen in SQL zu lesen und zu schreiben. Diese Kenntnisse wenden Sie dann mit BigQuery und Cloud SQL an.
Bevor Sie dieses Lab absolvieren, sollten Sie Ihre SQL-Kenntnisse überprüfen. Hier sind zwei anspruchsvollere Labs, in denen Sie Ihr Wissen anhand von Anwendungsfällen für Fortgeschrittene testen können:
Wenn Sie bereit sind, können Sie im nächsten Schritt Ihre Lab-Umgebung einrichten.
Lesen Sie diese Anleitung. Labs sind zeitlich begrenzt und können nicht pausiert werden. Der Timer beginnt zu laufen, wenn Sie auf Lab starten klicken, und zeigt Ihnen, wie lange die Ressourcen für das Lab verfügbar sind.
In diesem praxisorientierten Lab können Sie die Lab-Aktivitäten in einer echten Cloud-Umgebung selbst durchführen – nicht in einer Simulations- oder Demo-Umgebung. Dazu erhalten Sie neue, temporäre Anmeldedaten, mit denen Sie für die Dauer des Labs auf Google Cloud zugreifen können.
Für dieses Lab benötigen Sie Folgendes:
Klicken Sie auf Lab starten. Wenn Sie für das Lab bezahlen müssen, wird ein Pop-up-Fenster geöffnet, in dem Sie Ihre Zahlungsmethode auswählen können. Auf der linken Seite befindet sich der Bereich Details zum Lab mit diesen Informationen:
Klicken Sie auf Google Cloud Console öffnen (oder klicken Sie mit der rechten Maustaste und wählen Sie Link in Inkognitofenster öffnen aus, wenn Sie Chrome verwenden).
Im Lab werden Ressourcen aktiviert. Anschließend wird ein weiterer Tab mit der Seite Anmelden geöffnet.
Tipp: Ordnen Sie die Tabs nebeneinander in separaten Fenstern an.
Kopieren Sie bei Bedarf den folgenden Nutzernamen und fügen Sie ihn in das Dialogfeld Anmelden ein.
Sie finden den Nutzernamen auch im Bereich Details zum Lab.
Klicken Sie auf Weiter.
Kopieren Sie das folgende Passwort und fügen Sie es in das Dialogfeld Willkommen ein.
Sie finden das Passwort auch im Bereich Details zum Lab.
Klicken Sie auf Weiter.
Klicken Sie sich durch die nachfolgenden Seiten:
Nach wenigen Augenblicken wird die Google Cloud Console in diesem Tab geöffnet.
Wie bereits erwähnt, können Sie mit SQL Informationen aus strukturierten Datasets abrufen. Strukturierte Datasets haben klare Regeln und Formatierungen und sind oft in Tabellen organisiert oder bestehen aus Daten, die in Zeilen und Spalten formatiert sind.
Ein Beispiel für unstrukturierte Daten ist eine Bilddatei. SQL kann nicht mit unstrukturierten Daten umgehen. Außerdem können unstrukturierte Daten nicht (oder zumindest nicht nativ) in BigQuery-Datasets oder Tabellen gespeichert werden. Sie müssen einen Dienst wie Cloud Vision (ggf. direkt über seine API) verwenden, um zum Beispiel mit Bilddaten arbeiten zu können.
Im Folgenden sehen Sie ein Beispiel für ein strukturiertes Dataset – eine einfache Tabelle:
Nutzer |
Preis |
Versendet |
Peter |
35 $ |
Ja |
Max |
50 $ |
Nein |
Wenn Sie Google Tabellen kennen, dann sollte die oben dargestellte Tabelle recht ähnlich aussehen. Die Tabelle enthält die Spalten „Nutzer“, „Preis“ und „Versendet“ sowie zwei Zeilen mit Spaltenwerten.
Eine Datenbank ist im Wesentlichen eine Sammlung von einer oder mehreren Tabellen. SQL ist ein Verwaltungstool für strukturierte Datenbanken. Sie werden jedoch recht häufig (auch in diesem Lab) Abfragen für eine oder mehrere miteinander verknüpfte Tabellen ausführen und nicht für komplette Datenbanken.
SQL ist an natürlicher Sprache ausgerichtet. Bevor Sie eine Abfrage Ihrer Daten ausführen, ist es daher immer hilfreich, genau zu wissen, was Sie fragen möchten (es sei denn, Sie probieren nur aus Spaß etwas aus).
SQL bietet vordefinierte Schlüsselwörter, mit denen Sie Ihre Frage in das Pseudo-Englisch der SQL-Syntax übersetzen können. Auf diese Weise gibt Ihnen das Datenbankmodul die Antwort zurück, die Sie haben möchten.
Die wichtigsten Schlüsselwörter sind SELECT
und FROM
:
SELECT
verwenden Sie, um anzugeben, welche Felder des Datasets abgerufen werden sollen.FROM
legen Sie fest, aus welchen Tabellen Sie Daten abrufen.Mit einem Beispiel wird es klarer. Nehmen wir an, dass Ihnen die Tabelle example_table
vorliegt. Diese Tabelle enthält die Spalten NUTZER, PREIS und VERSENDET:
An dieser Stelle sollen nur Daten aus der Spalte NUTZER abgerufen werden. Dazu führen Sie die folgende Abfrage mit SELECT
und FROM
aus:
Mit dem obigen Befehl werden alle Namen der Spalte NUTZER
, die in example_table
gefunden wurden, ausgewählt.
Mit dem SQL-Schlüsselwort SELECT
können Sie mehrere Spalten auswählen. Ein Beispiel: Sie möchten die Daten aus den Spalten NUTZER und VERSENDET abrufen. Dazu verändern Sie die vorherige Abfrage, indem Sie noch einen Spaltenwert zur SELECT
-Abfrage hinzufügen. Dabei müssen Sie darauf achten, dass der neue Spaltenwert durch ein Komma getrennt ist:
Mit dieser Abfrage werden die Daten für NUTZER
und VERSENDET
aus dem Speicher abgerufen:
Das wars auch schon. Jetzt kennen Sie zwei grundlegende SQL-Schlüsselwörter. Nun wird es noch ein bisschen interessanter.
WHERE
ist ein weiteres SQL-Schlüsselwort, mit dem Tabellen nach bestimmten Spaltenwerten gefiltert werden können. Ein Beispiel: Sie möchten die Namen aus example_table
abrufen, für die Pakete versendet wurden. Hierzu können Sie die Abfrage folgendermaßen um das Schlüsselwort WHERE
erweitern:
Mit dieser Abfrage werden alle NUTZER, deren Pakete VERSENDET wurden, aus dem Speicher zurückgegeben:
Nachdem Sie nun die wichtigsten SQL-Schlüsselwörter kennen, wenden wir die Abfragetypen in der BigQuery-Konsole an.
Im Folgenden stellen wir Ihnen einige Multiple-Choice-Fragen, um Ihr bisher erworbenes Wissen zu den Konzepten zu testen und zu festigen. Beantworten Sie die Fragen so gut Sie können.
BigQuery ist ein vollständig verwaltetes Data Warehouse im Petabytebereich, das auf Google Cloud ausgeführt wird. Data Analysts oder Data Scientists können schnell große Datasets abfragen und filtern, Ergebnisse zusammenfassen und komplexe Operationen ausführen, ohne dafür Server einrichten oder verwalten zu müssen. BigQuery liegt entweder in Form eines Befehlszeilentools (in Cloud Shell vorinstalliert) oder einer Webkonsole vor. Mit beiden Varianten können Sie Daten in Google Cloud-Projekten umgehend verwalten und abfragen.
In diesem Lab nutzen Sie die Webkonsole, um SQL-Abfragen auszuführen.
Zuerst wird das Fenster Willkommen bei BigQuery in der Cloud Console geöffnet, das neben allgemeinen Informationen auch einen Link zur Kurzanleitung und zu den Versionshinweisen enthält.
Die BigQuery Console wird geöffnet.
Sehen Sie sich nun einige wichtige Elemente der Benutzeroberfläche genauer an. Auf der rechten Seite der Konsole befindet sich unter „Editor“ der Abfrageeditor. Hier schreiben Sie SQL-Befehle, etwa die vorherigen Beispiele, und führen sie aus. Unter dem Abfrageeditor befindet sich der „Abfrageverlauf“, eine Liste der Abfragen, die Sie bisher ausgeführt haben.
Im linken Bereich der Konsole finden Sie das Navigationsmenü. Neben dem selbsterklärenden Abfrageverlauf, den gespeicherten Abfragen und dem Jobverlauf finden Sie hier auch den Tab Explorer.
Die Ressourcen auf der obersten Ebene des Tabs Explorer enthalten Google Cloud-Projekte. Diese entsprechen Ihren temporären Google Cloud-Projekten, bei denen Sie sich anmelden und die Sie in den Google Cloud Skills Boost-Labs verwenden. Wie Sie in der Konsole und im letzten Screenshot sehen können, wird auf dem Tab „Explorer“ nur Ihr Projekt angezeigt. Wenn Sie auf den Pfeil neben dem Projektnamen klicken, werden keine weiteren Elemente eingeblendet.
Der Grund dafür ist, dass Ihr Projekt keine Datasets oder Tabellen enthält – es gibt nichts, was abgefragt werden kann. Zuvor haben Sie gelernt, dass Datasets Tabellen enthalten. Wenn Sie Ihrem Projekt Daten hinzufügen, beachten Sie, dass in BigQuery Projekte Datasets enthalten und Datasets Tabellen enthalten. Da Sie nun ein besseres Verständnis für das Modell „Projekt > Dataset > Tabelle“ und die Funktionsweise der Konsole haben, können Sie abfragbare Daten hochladen.
In diesem Abschnitt binden Sie einige öffentliche Daten in Ihr Projekt ein, um die SQL-Befehle in BigQuery in der Praxis auszuprobieren.
Klicken Sie auf + HINZUFÜGEN.
Wählen Sie Projekt nach Name markieren aus.
Geben Sie als Projektnamen bigquery-public-data ein.
Klicken Sie auf MARKIEREN.
Beachten Sie, dass Sie in diesem neuen Tab immer noch im Lab-Projekt arbeiten. Sie haben lediglich ein öffentlich zugängliches Projekt mit Datasets und Tabellen zur Analyse in BigQuery eingebunden – Sie sind nicht zu diesem Projekt gewechselt. Alle Ihre Jobs und Dienste sind weiterhin an Ihr Google Cloud Skills Boost-Konto gebunden. Sie können dies selbst überprüfen, indem Sie das Feld „Projekt“ oben in der Konsole ansehen:
bigquery-public-data
london_bicycles
cycle_hire
cycle_stations
In diesem Lab verwenden Sie Daten aus cycle_hire. Öffnen Sie die Tabelle cycle_hire
und klicken Sie dann auf den Tab Vorschau. Die Seite sollte in etwa so aussehen:
Prüfen Sie die Spalten und die Werte in den Zeilen. Sie können nun einige SQL-Abfragen in der Tabelle cycle_hire
ausführen.
Sie haben nun ein grundlegendes Verständnis der SQL-Schlüsselwörter und des BigQuery-Modells sowie einige Daten, mit denen Sie arbeiten können. Mit diesem Dienst können Sie einige SQL-Befehle ausführen.
Unten rechts in der Konsole sehen Sie, dass es 83.434.866 Datenzeilen gibt, d. h., dass in London zwischen 2015 und 2017 tatsächlich so viele Einzelfahrten mit Leihfahrrädern unternommen wurden.
Beachten Sie nun in der neunten Spalte den Schlüssel end_station_name
. Dieser steht für den Zielort der Fahrten mit den Leihfahrrädern. Bevor wir tiefer einsteigen, führen wir eine einfache Abfrage aus, um die Spalte end_station_name
zu isolieren.
Nach ungefähr 20 Sekunden sollten die 83.434.866 Zeilen der abgefragten Spalte end_station_name
zurückgegeben werden.
Nun möchten wir herausfinden, welche Fahrten 20 Minuten oder länger gedauert haben.
WHERE
aus:Diese Abfrage dauert etwa eine Minute.
Durch SELECT *
werden alle Spaltenwerte aus der Tabelle zurückgegeben. Die Dauer wird in Sekunden gemessen. Aus diesem Grund haben Sie den Wert 1.200 gewählt (60 × 20).
Unten rechts sehen Sie nun, dass 26.441.016 Zeilen zurückgegeben wurden. Das bedeutet, dass in London ca. 30 % (26.441.016 ÷ 83.434.866) aller Fahrten mit Leihfahrrädern mindestens 20 Minuten gedauert haben.
Im Folgenden stellen wir Ihnen einige Multiple-Choice-Fragen, um Ihr bisher erworbenes Wissen zu testen und zu festigen. Beantworten Sie die Fragen so gut Sie können.
Das Schlüsselwort GROUP BY
fasst Zeilen mit Ergebnismengen zusammen, die den gleichen Kriterien (d. h. dem gleichen Spaltenwert) entsprechen, und gibt alle eindeutigen Einträge für ein solches Kriterium zurück.
Es ist ein nützliches Schlüsselwort, um aus Tabellen Informationen nach Kategorien herauszufiltern.
Als Ergebnis erhalten Sie eine Liste eindeutiger, nur einmal vorkommender Spaltenwerte.
Ohne das Schlüsselwort GROUP BY
wären durch die Abfrage alle 83.434.866 Zeilen zurückgegeben worden. Mit GROUP BY
werden nur die eindeutigen Spaltenwerte aus der Tabelle ausgegeben. Dies können Sie selbst unten rechts überprüfen. Sie sehen hier 954 Zeilen, was bedeutet, dass es in London 954 unterschiedliche Startpunkte für den Fahrradverleih gibt.
Das Schlüsselwort COUNT()
gibt die Anzahl der Zeilen zurück, die denselben Kriterien (d. h. dem gleichen Spaltenwert) entsprechen. Diese Funktion kann in Kombination mit GROUP BY
sehr hilfreich sein.
Fügen Sie unserer vorherigen Abfrage die Funktion COUNT
hinzu, um herauszufinden, wie viele Fahrten an den einzelnen Startpunkten begonnen wurden.
Ihre Ausgabe enthält die Anzahl der Fahrten, die an den einzelnen Startpunkten mit Leihfahrrädern begonnen wurden.
AS
ist ein SQL-Schlüsselwort, das einen Alias einer Tabelle oder einer Spalte erstellt. Ein Alias ist ein neuer Name, der einer zurückgegebenen Spalte oder Tabelle gegeben wird – je nachdem, was durch AS
definiert wird.
AS
hinzu, um in der Praxis zu sehen, was geschieht. Löschen Sie die Abfrage aus dem Editor, kopieren Sie den folgenden Befehl und fügen Sie ihn ein:Für die Anzeige der Ergebnisse wird der Name der rechten Spalte von COUNT(*)
in num_starts
geändert.
Wie Sie sehen, hat die Spalte COUNT(*)
in der zurückgegebenen Tabelle nun den Aliasnamen num_starts
. Vor allem bei großen Datasets ist dies ein praktisches Schlüsselwort. Schließlich kommen mehrdeutige Bezeichnungen für Tabellen oder Spalten häufiger vor, als man denkt.
Das Schlüsselwort ORDER BY
sortiert die zurückgegebenen Daten einer Abfrage anhand eines bestimmten Kriteriums oder Spaltenwerts in aufsteigender oder absteigender Reihenfolge. Fügen Sie dieses Schlüsselwort in unsere vorherige Abfrage ein, um Folgendes zu erreichen:
Jeder der folgenden Befehle ist eine separate Abfrage. Führen Sie für jeden Befehl Folgendes aus:
In den Ergebnissen der letzten Abfrage sind die Startstandorte nach der Anzahl der Starts vom jeweiligen Standort aus aufgeführt.
Sie sehen, dass die meisten Fahrten in „Hyde Park Corner, Hyde Park“ begonnen wurden. Der Anteil der Fahrten, die an dieser Station begonnen wurden, entspricht jedoch insgesamt weniger als 1 % (671.688 ÷ 83.434.866).
Im Folgenden stellen wir Ihnen einige Multiple-Choice-Fragen, um Ihr bisher erworbenes Wissen zu den Konzepten zu testen und zu festigen. Beantworten Sie die Fragen so gut Sie können.
Cloud SQL ist ein vollständig verwalteter Datenbankdienst, mit dem Sie Ihre relationalen PostgreSQL- und MySQL-Datenbanken ganz einfach in der Cloud einrichten und verwalten können. Cloud SQL kann mit zwei Dateitypen arbeiten: Dumpdateien (.sql) oder CSV-Dateien (.csv). Sie lernen, wie Sie Teilmengen aus der Tabelle cycle_hire
in CSV-Dateien exportieren und diese in Cloud Storage als Zwischenspeicherort hochladen.
In der BigQuery-Konsole sollten Sie als Letztes den folgenden Befehl ausgeführt haben:
Klicken Sie im Bereich „Abfrageergebnisse“ auf ERGEBNISSE SPEICHERN > CSV (lokale Datei). Hierdurch wird die Abfrage als CSV-Datei heruntergeladen und gespeichert. Notieren Sie sich den Speicherort und den Namen der heruntergeladenen Datei, denn Sie benötigen diese Informationen bald.
Löschen Sie den Inhalt im Abfrageeditor und führen Sie darin den folgenden Befehl aus:
Mit diesem Befehl wird eine Tabelle zurückgegeben, die die Anzahl der Fahrten mit Leihfahrrädern enthält, die an den einzelnen Endpunkten beendet wurden, und zwar absteigend sortiert nach Anzahl der Fahrten.
Rufen Sie die Cloud Console auf, um dort einen Storage-Bucket zu erstellen, in den Sie die eben erstellten Dateien hochladen können.
Klicken Sie auf das Navigationsmenü > Cloud Storage > Buckets und dann auf BUCKET ERSTELLEN.
Geben Sie einen eindeutigen Namen für Ihren Bucket ein, übernehmen Sie bei allen anderen Einstellungen die Standardeinstellung und klicken Sie auf Erstellen.
Wenn Sie dazu aufgefordert werden, klicken Sie im Dialogfeld Der öffentliche Zugriff wird verhindert
auf Bestätigen.
Klicken Sie unten auf Fortschritt prüfen. Wenn Sie den Bucket erfolgreich erstellt haben, sehen Sie ein Testergebnis.
Sie sollten sich jetzt in der Cloud Console befinden, in der der neue Cloud Storage-Bucket zu sehen ist.
Klicken Sie auf HOCHLADEN > Dateien hochladen und wählen Sie die CSV-Datei aus, die die Daten aus start_station_name
enthält.
Klicken Sie auf Öffnen. Wiederholen Sie diese Schritte für die Daten aus end_station_name
.
Benennen Sie die Datei start_station_name
um, indem Sie auf die drei Punkte neben der Datei und dann auf Umbenennen klicken. Benennen Sie die Datei in start_station_data.csv
um.
Benennen Sie die Datei end_station_name
um, indem Sie auf die drei Punkte neben der Datei und dann auf Umbenennen klicken. Benennen Sie die Datei in end_station_data.csv
um.
Es sollten nun start_station_data.csv
und end_station_data.csv
in der Liste Objekte auf der Seite Bucket-Details angezeigt werden.
Klicken Sie auf Fortschritt prüfen. Wenn Sie CSV-Objekte in Ihren Bucket hochgeladen haben, erhalten Sie ein Testergebnis.
Klicken Sie in der Konsole im Navigationsmenü auf SQL.
Klicken Sie auf INSTANZ ERSTELLEN > MySQL auswählen.
Geben Sie für die Instanz‑ID my-demo ein.
Geben Sie in das Feld Passwort ein sicheres Passwort ein und merken Sie sich dieses.
Wählen Sie für die Datenbankversion MySQL 8 aus.
Entscheiden Sie sich bei Cloud SQL-Version auswählen für die Option Enterprise.
Wählen Sie für Versionsvoreinstellung die Option Entwicklung (4 vCPU, 16 GB RAM, 100 GB Speicher, Einzelne Zone) aus.
Legen Sie für das Feld Region
Legen Sie für Mehrere Zonen (Hochverfügbarkeit) > Primäre Zone
Klicken Sie auf INSTANZ ERSTELLEN.
Klicken Sie unten auf Fortschritt prüfen. Wenn Sie eine Cloud SQL-Instanz erfolgreich eingerichtet haben, erhalten Sie ein Testergebnis.
Nachdem die Cloud SQL-Instanz läuft, fügen Sie ihr mithilfe der Cloud Shell-Befehlszeile eine Datenbank hinzu.
Klicken Sie zum Öffnen von Cloud Shell auf das Symbol oben rechts in der Konsole.
Führen Sie den folgenden Befehl aus, um Ihre Projekt‑ID als Umgebungsvariable festzulegen.
Wenn Sie die Eingabeaufforderung [Y/n] erhalten, drücken Sie Y und dann die EINGABETASTE.
Sie erhalten damit einen Link zum Öffnen in Ihrem Browser. Öffnen Sie den Link in dem Browser, mit dem Sie sich beim Qwiklabs-Konto angemeldet haben. Wenn Sie angemeldet sind, erhalten Sie einen Bestätigungscode zum Kopieren. Fügen Sie diesen Code in Cloud Shell ein.
my-demo
, wenn Sie für Ihre Instanz einen anderen Namen verwendet haben:Es sollte in etwa Folgendes angezeigt werden:
Eine Cloud SQL-Instanz enthält vorkonfigurierte Datenbanken. Sie erstellen jedoch Ihre eigene Datenbank, um die Daten aus dem Londoner Fahrradverleih zu speichern.
bike
zu erstellen:Sie sollten folgende Ausgabe erhalten:
Klicken Sie auf Fortschritt prüfen. Wenn Sie eine Datenbank in der Cloud SQL-Instanz erstellt haben, wird ein Testergebnis angezeigt.
In diesem Befehl wird das Schlüsselwort CREATE
verwendet, wobei mit der Klausel TABLE
angegeben wird, dass anstelle einer Datenbank eine Tabelle erstellt werden soll. Das Schlüsselwort USE
gibt die Datenbank an, mit der die Tabelle verknüpft werden soll. Sie haben nun eine Tabelle mit dem Namen „london1“, die zwei Spalten enthält: „start_station_name“ und „num“. VARCHAR(255)
gibt für die Spalte einen in der Länge variablen String mit bis zu 255 Zeichen als Typ an, und INT
steht für eine Spalte des Typs „Ganzzahl“.
Für beide Befehle sollten Sie die folgende Ausgabe erhalten:
Es wird „Empty set“ angezeigt, da noch keine Daten geladen wurden.
Kehren Sie zur Cloud SQL-Konsole zurück. Dort können Sie die beiden CSV-Dateien start_station_name
und end_station_name
in die neu erstellen Tabellen „london1“ und „london2“ hochladen.
start_station_data.csv
. Klicken Sie auf Auswählen.bike
aus und geben Sie london1
als Tabelle ein.Wiederholen Sie diese Schritte für die andere CSV-Datei.
end_station_data.csv
. Klicken Sie auf Auswählen.bike
aus und geben Sie london2
als Tabelle ein.Es sollten nun beide CSV-Dateien in die Tabellen der Datenbank bike
hochgeladen sein.
Es sollten 955 Zeilen ausgegeben werden, jeweils eine für einen eindeutigen Stationsnamen.
Es sollten 959 Zeilen ausgegeben werden, jeweils eine für einen eindeutigen Stationsnamen.
Hier finden Sie weitere Schlüsselwörter, die bei der Datenverarbeitung nützlich sind. Das erste ist das Schlüsselwort DELETE
.
Nach der Ausführung der einzelnen Befehle sollten Sie jeweils folgende Ausgabe erhalten:
Die gelöschten Zeilen in den CSV-Dateien waren die Spaltenüberschriften. Mit dem Schlüsselwort DELETE
löscht man nicht generell die erste Zeile einer Datei, sondern alle Zeilen der Tabelle, in denen der Spaltenname (in diesem Fall „num“) einen bestimmten Wert enthält (in diesem Fall „0“). Wenn Sie die Abfragen SELECT * FROM london1;
und SELECT * FROM london2;
ausführen und an den Anfang der Tabelle scrollen, sehen Sie, dass diese Zeilen gelöscht wurden.
Sie können auch mit dem Schlüsselwort INSERT INTO
Werte in Tabellen eingeben.
start_station_name
auf „test destination“ und num
auf „1“ gesetzt:Für das Schlüsselwort INSERT INTO
ist eine Tabelle („london1“) erforderlich, in die eine neue Zeile mit Spalten eingefügt wird. Diese Spalten werden von den Begriffen in der ersten Klammer spezifiziert (in diesem Fall „start_station_name“ und „num“). Was nach „VALUES“ angegeben wird, wird als Wert in die neue Zeile eingefügt.
Sie sollten folgende Ausgabe erhalten:
Wenn Sie die Abfrage SELECT * FROM london1;
ausführen, sehen Sie am Ende der Tabelle „london1“ eine weitere Zeile.
Das letzte SQL-Schlüsselwort, das wir behandeln, ist UNION
. Dieses Schlüsselwort kombiniert die Ausgabe aus mindestens zwei SELECT
-Abfragen zu einer Ergebnismenge. Sie verwenden UNION
, um Teilmengen aus den Tabellen „london1“ und „london2“ zu kombinieren.
Mit der folgenden verketteten Abfrage rufen Sie bestimmte Daten aus beiden Tabellen ab und kombinieren sie mit dem Schlüsselwort UNION
.
Mit der ersten SELECT
-Abfrage werden die beiden Spalten der Tabelle „london1“ ausgewählt und es wird für „start_station_name“ ein Alias mit dem Namen „top_stations“ erstellt. Das Schlüsselwort WHERE
wird verwendet, um nur die Fahrradverleihstationen abzurufen, an denen mehr als 100.000 Fahrten begonnen wurden.
Mit der zweiten SELECT
-Abfrage werden die beiden Spalten der Tabelle „london2“ ausgewählt. Das Schlüsselwort WHERE
wird verwendet, um nur die Fahrradverleihstationen abzurufen, an denen mehr als 100.000 Fahrten geendet haben.
Das Schlüsselwort UNION
zwischen diesen beiden Abfragen kombiniert die Ausgaben der beiden Abfragen und verarbeitet die Daten aus „london2“ zusammen mit denen aus „london1“. Da „london1“ mit „london2“ zusammengeführt wird, haben die Spaltenwerte „top_stations“ und „num“ Vorrang.
Mit ORDER BY
wird die finale, zusammengeführte Tabelle anhand der Spalte „top_stations“ in absteigender alphabetischer Reihenfolge sortiert.
Beispielausgabe (Ihre Ergebnisse können abweichen):
Wie Sie sehen, teilen sich beim Fahrradverleih 13 von 14 Stationen die besten Plätze als Start- und Endpunkte. Sie konnten mithilfe von grundlegenden SQL-Schlüsselwörtern ein Dataset von beträchtlicher Größe abfragen und haben Datenpunkte erhalten, um bestimmte Fragen zu beantworten.
In diesem Lab haben Sie sich mit den Grundlagen von SQL vertraut gemacht und gelernt, wie Sie Schlüsselwörter verwenden sowie Abfragen in BigQuery und Cloud SQL ausführen. Sie haben die zentralen Konzepte zu Projekten, Datenbanken und Tabellen kennengelernt. Die Schlüsselwörter haben Sie in der Praxis angewendet und damit Daten verarbeitet und bearbeitet. Sie haben erfahren, wie Daten in BigQuery eingelesen und wie Abfragen für Tabellen ausgeführt werden. Sie wissen nun, wie Sie Instanzen in Cloud SQL erstellen, und haben geübt, Datenteilmengen in Tabellen zu übertragen, die sich in Datenbanken befinden. Abfragen haben Sie in SQL verkettet und ausgeführt, um interessante Schlüsse über die Start- und Endpunkte des Fahrradverleihsystems in London zu ziehen.
Üben Sie die Anwendung von Cloud SQL und BigQuery mit den folgenden Google Cloud Skill Boost-Labs:
Erfahren Sie mehr über Data Science mit Data Science on the Google Cloud Platform, 2nd Edition: O'Reilly Media, Inc..
In unseren Schulungen erfahren Sie alles zum optimalen Einsatz unserer Google Cloud-Technologien und können sich entsprechend zertifizieren lassen. Unsere Kurse vermitteln technische Fähigkeiten und Best Practices, damit Sie möglichst schnell mit Google Cloud loslegen und Ihr Wissen fortlaufend erweitern können. Wir bieten On-Demand-, Präsenz- und virtuelle Schulungen für Anfänger wie Fortgeschrittene an, die Sie individuell in Ihrem eigenen Zeitplan absolvieren können. Mit unseren Zertifizierungen weisen Sie nach, dass Sie Experte im Bereich Google Cloud-Technologien sind.
Handbuch zuletzt am 16. Oktober 2024 aktualisiert
Lab zuletzt am 16. Oktober 2024 getestet
© 2025 Google LLC. Alle Rechte vorbehalten. Google und das Google-Logo sind Marken von Google LLC. Alle anderen Unternehmens- und Produktnamen können Marken der jeweils mit ihnen verbundenen Unternehmen sein.
Diese Inhalte sind derzeit nicht verfügbar
Bei Verfügbarkeit des Labs benachrichtigen wir Sie per E-Mail
Sehr gut!
Bei Verfügbarkeit kontaktieren wir Sie per E-Mail
One lab at a time
Confirm to end all existing labs and start this one