Descubra uma coleção de workflows de referência que usam modelos de linguagem de visão para fornecer recursos avançados e interativos de percepção visual para uma variedade de setores.
Cargas de Trabalho
Visão Computacional / Análise de Vídeo
Indústrias
Varejo/Bens de Consumo Embalados
Manufatura
Cidades/espaços inteligentes
Área da Saúde e Ciências da Vida
Objetivo de negócios
Retorno sobre o investimento
Inovação
Produtos
NVIDIA Metropolis
NVIDIA AI Enterprise
As aplicações tradicionais de análise de vídeo e seus workflows de desenvolvimento geralmente são criados em modelos limitados e de função fixa, projetados para detectar e identificar apenas um conjunto selecionado de objetos predefinidos. Com IA generativa e modelos básicos, agora você pode criar aplicações com menos modelos que têm uma percepção incrivelmente complexa e ampla e uma rica compreensão contextual. Essa nova geração de VLMs (Vision Language Models) está dando origem a agentes visuais de IA inteligentes e poderosos.
Um agente de IA visual pode combinar as modalidades de visão e linguagem para entender prompts de linguagem natural e realizar respostas visuais a perguntas. Por exemplo, responder a uma ampla gama de perguntas em linguagem natural que podem ser aplicadas em uma transmissão de vídeo gravada ou ao vivo. Essa compreensão mais profunda do conteúdo de vídeo permite interpretações mais precisas e significativas, melhorando a funcionalidade das aplicações de análise de vídeo e a interpretação de cenários do mundo real. Esses agentes prometem desbloquear possibilidades de aplicação industrial totalmente novas.
Agentes visuais de IA altamente perceptivos, precisos e interativos serão implantados em nossas fábricas, armazéns, lojas de varejo, aeroportos, cruzamentos de tráfego e muito mais. Isso terá um tremendo impacto nas equipes de operações que buscam tomar melhores decisões usando insights mais ricos gerados a partir de interações naturais. Os gerentes e as equipes de operações se comunicarão com esses agentes em linguagem natural, todos impulsionados por IA generativa e grandes modelos de linguagem de visão com microsserviços NVIDIA NIM™ em seu núcleo.
Links Rápidos
Explore o workflow de referência, com vários modelos de linguagem visual, para criar facilmente seu agente de IA para análise de vídeo.