08
Inspect Rich Documents with Gemini Multimodality and Multimodal RAG
08
Inspect Rich Documents with Gemini Multimodality and Multimodal RAG
Conclua o curso intermediário para obter o selo de habilidade Inspect Rich Documents with Gemini Multimodality and Multimodal RAG e demonstrar suas habilidades em: usar comandos multimodais para extrair informações de dados textuais e visuais, gerar uma descrição de vídeo e recuperar mais informações além das que aparecem no vídeo usando a multimodalidade do Gemini; criar metadados de documentos com textos e imagens, acessar todos os blocos de texto relevantes e imprimir citações usando a Geração Aumentada de Recuperação (RAG, na sigla em inglês) multimodal com o Gemini.
Os selos de habilidade são digitais e exclusivos. Eles são emitidos pelo Google Cloud como forma de reconhecer sua proficiência com os produtos e serviços do Cloud e comprovam sua habilidade de aplicar seu conhecimento em um ambiente prático e interativo. Conclua este curso e o laboratório com desafio da avaliação final para receber um selo de habilidade que pode ser compartilhado no seu currículo e nas suas redes sociais.
Informações sobre o curso
Objetivos
- Use a API Gemini da Vertex AI para gerar informações e texto usando comandos de imagem, vídeo e texto.
- Extraia, armazene e pesquise metadados de documentos que contêm texto e imagens.
- Aplique multimodalidade e RAG multimodal com o Gemini em um cenário de marketing do mundo real.
Idiomas disponíveis
English, Deutsch, español (Latinoamérica), bahasa Indonesia, 日本語, 한국어, português (Brasil), 简体中文, 繁體中文, and Türkçe
O que eu faço quando terminar o curso?
Ao final do curso, você pode navegar pelo conteúdo complementar do programa de aprendizado ou conferir nosso catálogo.
Quais selos eu posso ganhar?
Ao terminar um curso, você receberá um selo de conclusão. Os selos são exibidos no seu perfil e podem ser compartilhados nas suas redes sociais.
Tem interesse em participar desse curso com um dos nossos parceiros?
Confira o conteúdo do Google Cloud no Coursera e no Pluralsight.
Prefere aprender com um instrutor?