
Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
- On the top left of your screen, click Start lab to begin
Query the NYC collision data
/ 30
Query the most popular bike route by gender
/ 30
Creating datacatalog template and tag
/ 40
O Data Catalog foi descontinuado e não estará mais disponível a partir de 30 de janeiro de 2026. Você ainda pode concluir este laboratório, se quiser.
Para saber como fazer a transição dos usuários, das cargas de trabalho e do conteúdo do Data Catalog para o Dataplex Catalog, consulte "Fazer a transição do Data Catalog para o Dataplex Catalog" (https://cloud.google.com/dataplex/docs/transition-to-dataplex-catalog).
O Data Catalog é um serviço de administração de metadados totalmente gerenciado e escalonável no Dataplex.
Sem as ferramentas certas, o gerenciamento de recursos de dados pode ser demorado e caro. O Data Catalog fornece um local centralizado onde as organizações podem localizar, selecionar e descrever os recursos de dados.
Existem duas maneiras principais de interagir com o Data Catalog:
Neste curso, você vai aprender a:
Importante: antes de iniciar este laboratório, saia da sua conta pessoal ou corporativa do Gmail ou faça o laboratório usando a navegação anônima. Isso evita confusão no processo de login enquanto o laboratório está em execução.
Clique em Começar o laboratório se ainda não tiver feito isso.
Dica: leva de três a cinco minutos para o ambiente do laboratório gerar automaticamente dois projetos do Google Cloud, dois conjuntos de dados pré-preenchidos e duas contas de usuário. Não é necessário esperar a conclusão dos recursos do laboratório para continuar lendo. Você não fará login após ler o cenário a seguir.
Clique em Abrir console de bicicletas no laboratório ou acesse o console do Cloud em uma janela anônima do navegador. Não faça login com as contas fornecidas até agora. Continue lendo o cenário. Você receberá instruções depois sobre qual conta usar.
Observação importante: uma vez iniciado, o laboratório não pode ser pausado. Se ele for encerrado, os projetos em execução do estudante serão excluídos.
Você é CEO de uma empresa de transportes na cidade de Nova York. As equipes de analistas consultam os conjuntos de dados que você coletou sobre o transporte por bicicleta e carro em Nova York.
Desafios:
Cada equipe de engenharia de dados mantém seu conjunto de dados em um projeto separado do Google Cloud. Assim fica mais fácil gerenciar o acesso e o faturamento. Embora isso seja melhor para elas, fica mais difícil para a equipe de analistas encontrar esses conjuntos de dados.
Para complicar ainda mais, existem diferentes níveis de analistas de dados trabalhando para você na equipe de BI:
Para simular melhor um ambiente corporativo real com vários projetos e conjuntos de dados para catalogar, sua equipe de engenharia permitiu que você acessasse recursos. O laboratório carrega esses recursos antecipadamente para que você não precise criá-los.
Como mostrado acima, sua equipe forneceu logins a você para:
Além disso, ela adicionou as seguintes observações sobre a restrição do acesso:
Lembre que a equipe de engenharia de dados disponibilizou três projetos, cada um com um conjunto de dados diferente sobre a cidade de Nova York. Verifique se o Papel de proprietário pode acessar e consultar todos os conjuntos de dados.
Faça login usando o e-mail e a senha gerados automaticamente para o Proprietário (administrador total) como parte deste laboratório.
Aceite os Termos e Condições para usar o Google Cloud (se solicitado).
NYC Motor Vehicle Collisions Project
e encontre o valor da string no pop-up "Selecione um projeto":Depois de pesquisar e consultar manualmente os conjuntos de dados no BigQuery, volte a este laboratório para usar o Data Catalog.
Verifique se o papel de proprietário pode visualizar o conjunto de dados new_york_mv_collisions
.
Em Explorer no BigQuery, clique no nome do seu projeto para abrir os conjuntos de dados aos quais você tem acesso de visualização.
Verifique se você pode ver o conjunto de dados new_york_mv_collisions
.
Clique no conjunto de dados new_york_mv_collisions
para abrir as tabelas que ele contém.
Clique na tabela nypd_mv_collisions
e analise os campos disponíveis no esquema.
O esquema será semelhante a este:
Responda às perguntas a seguir.
Embora a tabela não contenha informações de identificação pessoal, como número de telefone ou endereço de e-mail, ainda é preciso ter cuidado ao compartilhar esse conjunto de dados com toda a equipe.
No restante do laboratório, você vai aprender maneiras de acessar conjuntos de dados restritos e usar o Data Catalog para incluir tags de maneira proativa em conjuntos de dados e tabelas com metadados avançados para sua organização.
Uma vez que você fez login como um proprietário global, confirme se é possível ver e acessar os projetos e conjuntos de dados. Verifique se você pode executar a consulta a seguir.
Quais são os 10 fatores mais comuns nas colisões de carros em NY?
Clique em Verificar meu progresso para ver o objetivo.
Clique em Selecionar um projeto na parte de cima da página.
Selecione a guia Todos.
Encontre o conjunto de dados de compartilhamento de bicicletas consultando o ID do projeto correto gerado automaticamente:
new_york_citibike
> citibike_trips
.Ao acessar o esquema, os detalhes e a prévia, responda às perguntas a seguir.
O Conjunto de dados público sobre bicicletas na cidade de Nova York rastreia cada viagem (local de saída e de chegada), bem como outros campos dos usuários.
Clique em Verificar meu progresso para conferir o objetivo.
A seguir, você vai aprender a incluir tags em conjuntos de dados e tabelas com dados confidenciais.
Até o momento, você só usou a conta de proprietário fornecida pela equipe de engenharia de dados com as permissões de mais alto nível.
Você pediu para as equipes de engenharia limitarem o acesso aos usuários analistas de dados da seguinte maneira.
Os analistas de dados podem ver:
Os analistas de dados NÃO podem ver:
Clique no ícone de perfil.
Saia da conta.
Clique em Usar outra conta.
Entre novamente no Google Cloud com o e-mail e a senha do Data Analyst User
[usuário analista de dados].
Em Selecionar um projeto, verifique se você pode ver somente um, e não dois projetos gerados automaticamente pelo Qwiklabs.
Selecione o projeto do Qwiklabs que você pode acessar.
Acesse o BigQuery.
No BigQuery, é possível consultar um projeto (se você tiver acesso) sem ele estar fixado ou disponível na seção "Explorer". Tente consultar o conjunto de dados sobre colisões em Nova York diretamente como um usuário analista de dados usando o ID do projeto.
NYC Motor Vehicle Collisions Project
:A mensagem de erro de acesso negado verifica seu nível de acesso de analista de dados.
Você já conheceu os diferentes privilégios e acessos concedidos aos papéis de proprietário (o conjunto de privilégios mais amplo) e analista de dados (mais limitado) na hora de acessar projetos, conjuntos de dados e consultas.
A seguir, você vai tentar encontrar um conjunto de dados escondido usando o recurso de pesquisa do Data Catalog. Você acha que ele aparecerá para os analistas de dados se o BigQuery bloquear você?
Você já conhece os conjuntos de dados e os níveis de acesso concedidos a diferentes papéis. Agora, você vai solucionar os desafios definidos anteriormente no cenário:
Desafios:
Para obedecer aos requisitos regulatórios recentes, você precisa de uma forma clara de indicar os conjuntos de dados com PII (informações de identificação pessoal). Solucione esses desafios e conclua a tarefa com o serviço do Data Catalog.
Insira qwiklabs-gcp
na barra de pesquisa do Data Catalog para filtrar os recursos externos do Qwiklabs.
Confira se sua visualização como analista de dados é parecida com esta:
Qualquer que seja o projeto em que você fez login, o Data Catalog mostrará TODOS os conjuntos de dados do BigQuery que seu papel pode acessar.
Como analista de dados, não vai aparecer o new_york_mv_collisions
no Data Catalog, mesmo que esse valor exista, porque já consultou esse conjunto como proprietário.
Por quê? A seguir, saiba como funciona o controle de acesso no nível do Data Catalog.
Antes de pesquisar, descobrir ou exibir recursos do Google Cloud, o Data Catalog verifica se o usuário recebeu uma função do IAM com as permissões de leitura de metadados exigidas pelo BigQuery, o Pub/Sub ou outro sistema de origem para acessar o recurso.
Exemplo: o Data Catalog verifica se o usuário recebeu um papel com a permissão bigquery.tables.get
antes de exibir os metadados da tabela do BigQuery.
new_york_citibike
da tabela. Essa é uma subtarefa do conjunto de dados sobre aluguel de bicicletas que você tem permissão para visualizar.Nas tabelas do BigQuery, o Data Catalog permite incluir tags:
Tente clicar no botão Anexar tag.
Verifique se este erro aparece:
Parece que o papel de analista de dados pode procurar metadados no Data Catalog, mas não pode anexar novas tags.
A seguir, você vai descobrir como funcionam as permissões de inclusão de tags e os modelos de tag do Data Catalog.
Os modelos de tag do Data Catalog ajudam você a criar e gerenciar metadados comuns sobre recursos de dados em um único local. As tags são anexadas ao recurso de dados, o que significa que podem ser encontradas no sistema do Data Catalog. Ao usar esse recurso, você também pode criar mais aplicativos que consomem metadados contextuais sobre um recurso de dados.
Para criar modelos de tag, o usuário precisa ter, no mínimo, acesso para editar o recurso em questão (o BigQuery, neste laboratório) E datacatalog.tagTemplateUser
, se o modelo já tiver sido criado. Para saber mais, consulte o Guia de IAM do Data Catalog.
E se for preciso criar um modelo de tag novo? No mínimo, você precisaria ser datacatalog.tagTemplateCreator
ou roles/datacatalog.tagTemplateOwner
. O proprietário pode excluir modelos e outros privilégios de administrador.
Papéis do Cloud IAM mais comuns predefinidos para o Data Catalog:
roles/datacatalog.tagTemplateViewer
roles/datacatalog.tagTemplateUser
roles/datacatalog.tagTemplateCreator
roles/datacatalog.tagTemplateOwner
Faça login com o papel de proprietário que tem a permissão roles/datacatalog.tagTemplateOwner
.
Selecione o projeto de aluguel de bicicletas em Nova York
que você usou antes.
Navegue até o Data Catalog.
Clique em Modelos de tag > Criar modelo de tag.
Insira informações básicas no novo modelo e dê o nome Conjuntos de dados de Nova York.
Selecione
Clique em Adicionar campo.
Dê o nome Contém PII ao novo campo, marque Tornar este campo obrigatório, selecione o tipo Booleano e, por fim, clique em Concluído.
Selecione Adicionar campo.
Dê o nome de Tipo de PII ao campo, selecione o tipo Enumerado, adicione os valores a seguir e clique em Concluído quando terminar:
Selecione Adicionar campo.
Dê o nome Equipe do proprietário dos dados ao campo, marque Tornar este campo obrigatório, selecione o tipo Enumerado, adicione os valores a seguir e clique em Concluído quando terminar:
Clique em Pesquisar entradas que não usam este modelo.
Clique no conjunto de dados new_york_mv_collisions.
Observe que não há tags abaixo do nome do conjunto de dados. Depois disso, clique em Anexar tags.
Escolha o modelo que você criou antes e clique em OK.
Use o menu suspenso para preencher os valores dos campos do modelo com os dados a seguir. Depois disso, clique em Salvar:
É possível incluir tags no nível da tabela e da coluna para detalhar ainda mais o processo.
Volte aos recursos da pesquisa anterior e clique na tabela nypd_mv_collisions
.
Clique em Anexar tags e defina os campos a seguir como Tags de coluna e esquema:
Tabela: nypd_mv_collisions
Coluna: local
Modelo de tag: conjuntos de dados de Nova York
Valores de tag:
Clique em Salvar.
Inclua a tag PII no campo para geolocalização e verifique se ela aparece quando você clica no nome do modelo.
Clique em Verificar meu progresso para conferir o objetivo.
Agora, com as tag incluídas, é possível pesquisar seu catálogo usando as que você adicionou.
tag:qwiklabs-YOUR-PROJECT-HERE.new_york_datasets.contains_pii
e substitua o prefixo do ID do projeto pelo ID atual no Qwiklabs.Você aprendeu sobre outras funções do Data Catalog. como:
Esses treinamentos ajudam você a aproveitar as tecnologias do Google Cloud ao máximo. Nossas aulas incluem habilidades técnicas e práticas recomendadas para ajudar você a alcançar rapidamente o nível esperado e continuar sua jornada de aprendizado. Oferecemos treinamentos que vão do nível básico ao avançado, com opções de aulas virtuais, sob demanda e por meio de transmissões ao vivo para que você possa encaixá-las na correria do seu dia a dia. As certificações validam sua experiência e comprovam suas habilidades com as tecnologias do Google Cloud.
Manual atualizado em 30 de abril de 2024
Laboratório testado em 30 de abril de 2024
Copyright 2025 Google LLC. Todos os direitos reservados. Google e o logotipo do Google são marcas registradas da Google LLC. Todos os outros nomes de produtos e empresas podem ser marcas registradas das respectivas empresas a que estão associados.
Este conteúdo não está disponível no momento
Você vai receber uma notificação por e-mail quando ele estiver disponível
Ótimo!
Vamos entrar em contato por e-mail se ele ficar disponível
One lab at a time
Confirm to end all existing labs and start this one