Microsserviços NVIDIA NIM

Projetados para implantação rápida e confiável de inferência de IA generativa acelerada em qualquer lugar.

Comece Agora

Video | Resumo da Solução | Para Desenvolvedores

Visão Geral
Benefícios
Demonstração
Tecnologia
Benchmarks
Modelos
Recursos
Casos de Uso
Opções de Inicialização
Recursos
Próximos Passos

Visão Geral

Visão Geral
Benefícios
Demonstração
Tecnologia
Benchmarks
Modelos
Recursos
Casos de Uso
Opções de Inicialização
Recursos
Próximos Passos

Comece Agora

Visão Geral

O Que É o NVIDIA NIM?

O NVIDIA NIM™ fornece microsserviços de inferência pré-construídos e otimizados para a implantação rápida dos modelos de IA mais recentes em qualquer infraestrutura acelerada pela NVIDIA: nuvem, data center, workstation e edge.

Inferência de IA Generativa com Tecnologia NVIDIA NIM: Desempenho e TCO

Veja como os microsserviços NIM têm um desempenho melhor do que as alternativas mais conhecidas. Eles podem processar até 3 vezes mais tokens por segundo quando executados na mesma infraestrutura acelerada pela NVIDIA.

Assista Agora

Acesso Gratuito de Desenvolvimento ao NIM

Tenha acesso à prototipagem ilimitada com APIs hospedadas para o NIM aceleradas pelo DGX Cloud ou faça o download e hospede você mesmo os microsserviços NIM para pesquisa e desenvolvimento como parte do Programa de Desenvolvedores NVIDIA.

Experimente as APIs

Acelere a Implantação de IA com o NVIDIA NIM

O NVIDIA NIM combina a facilidade de uso e a simplicidade operacional das APIs gerenciadas com a flexibilidade e segurança dos modelos de auto-hospedagem na sua infraestrutura preferida. Os microsserviços NIM acompanham tudo o que as equipes de IA precisam: modelos fundacionais de IA mais recentes, mecanismos de inferência otimizados, APIs padrão do setor e dependências de tempo de execução, pré-empacotados em contêineres de software de nível empresarial prontos para implantação e dimensionamento em qualquer lugar.

Benefícios

IA Generativa Empresarial Que Faz Mais por Menos

Microsserviços fáceis de usar e de nível empresarial criados para IA de alto desempenho, projetados para funcionar com perfeição e escalar de maneira acessível. Experimente o mais rápido tempo de geração de valor para agentes de IA e outras aplicações de IA generativa empresarial, capacitadas pelos modelos de IA mais recentes para lógica, simulação, fala e muito mais.

Facilidade de Uso

Acelere a inovação e o tempo de chegada ao mercado com microsserviços pré-construídos e otimizados para os modelos de IA mais recentes. Com APIs padrão, os modelos podem ser implantados em cinco minutos e facilmente integrados às aplicações.

Assista: Implante o NIM em 5 Minutos

Ícone que mostra segurança e capacidade de gerenciamento

Nível Empresarial

Implante microsserviços de nível empresarial que são continuamente gerenciados pela NVIDIA por meio de processos de validação rigorosos e ramais de recursos dedicados, todos com suporte empresarial da NVIDIA, que também oferece acesso direto aos seus especialistas em IA.

Desempenho e Escala

Melhore o TCO com a inferência de IA de baixa latência e alto rendimento que escala com a nuvem, e alcance a melhor precisão com suporte para modelos minuciosamente ajustados e prontos para uso.

Assista: Vantagens de Desempenho e TCO do NIM

Portabilidade

Implante em qualquer lugar com microsserviços pré-construídos e nativos de nuvem prontos para execução em qualquer infraestrutura acelerada pela NVIDIA (nuvem, data center e workstation) e escale com perfeição em ambientes Kubernetes e de provedores de serviços de nuvem.

Demonstração

Crie Agentes de IA Com o NIM

Miniatura de vídeo mostrando alguém usando um agente de IA

Saiba como configurar dois agentes de IA, um para geração de conteúdo e outro para design gráfico digital, e veja como é fácil começar a usar os microsserviços NIM.

Assista Agora

Tecnologia

Bases para a IA Baseada em Agentes

Obtenha os Modelos de IA de Lógica Mais Recentes

Obtenha os modelos de IA mais recentes para lógica, linguagem, recuperação, fala, visão e muito mais, prontos para implantação em cinco minutos em qualquer infraestrutura acelerada pela NVIDIA.

Experimente Agora

Dê Início ao Desenvolvimento com os NVIDIA Blueprints

Crie aplicações de IA baseada em agentes impactantes com workflows de referência abrangentes que incluem bibliotecas de aceleração da NVIDIA, SDKs e microsserviços NIM.

Saiba Mais Experimente Agora

Simplifique o Desenvolvimento com o Kit de Ferramentas NVIDIA AgentIQ

Transforme microsserviços NIM em aplicações de IA baseadas em agentes com a biblioteca NVIDIA AgentIQ, um kit de ferramentas para desenvolvedores projetado para a criação de agentes de IA e sua integração em workflows personalizados.

Saiba Mais Experimente Agora

Benchmarks

Aumente o Rendimento com o NIM

O NVIDIA NIM fornece rendimento e latência otimizados desde o início para maximizar a geração de tokens, além de oferecer suporte a usuários simultâneos em horários de pico e melhorar a capacidade de resposta. Os microsserviços NIM são continuamente atualizados com os mecanismos de inferência otimizados mais recentes, aumentando o desempenho na mesma infraestrutura ao longo do tempo.

Configuração: instrução Llama 3.1 8B, 1 unidade de H100 SXM; solicitações simultâneas: 200. NIM ATIVO: FP8, rendimento de 1201 tokens/s, ITL de 32 ms. NIM INATIVO: FP8, rendimento de 613 tokens/s, ITL de 37 ms.

Modelos

Crie Com os Principais Modelos Abertos

Obtenha um desempenho de inferência otimizado para os modelos de IA mais recentes para capacitar a IA baseada em agentes multimodais com lógica, linguagem, recuperação, fala, imagem e muito mais. O NIM vem com mecanismos de inferência acelerada da NVIDIA e da comunidade, incluindo o NVIDIA® TensorRT™, o TensorRT-LLM e muito mais, pré-criados e otimizados para inferência de baixa latência e alto rendimento na infraestrutura acelerada pela NVIDIA.

Veja Mais Modelos

Recursos

O Modo Fácil para o Desenvolvimento e a Implantação de IA

Projetados para serem executados em qualquer lugar, os microsserviços de inferência NIM expõem APIs padrão do setor para fácil integração com sistemas e aplicações empresariais, além de escalarem com perfeição no Kubernetes para oferecer inferência de alto rendimento e baixa latência em escala de nuvem.

Implante o NIM

Implante o NIM para o seu modelo com um único comando. Também é fácil você executar o NIM com modelos ajustados com precisão.

Inferência de Execução

Coloque o NIM em funcionamento com o mecanismo de tempo de execução ideal baseado em sua infraestrutura acelerada pela NVIDIA.

Criação

Integre os terminais auto-hospedados do NIM com apenas algumas linhas de código.

Deploy

Run

Build

docker run nvcr.io/nim/publisher_name/model_name

 
 curl -X 'POST' \ 
  'http://0.0.0.0:8000/v1/completions' \ 
  -H 'accept: application/json' \ 
  -H 'Content-Type: application/json' \ 
  -d '{ 
  "model" : "model_name", 
  "prompt" : "Once upon a time", 
  "max_tokens" : 64 
 }' 

 
 import openai 
 client = openai.OpenAI( 
  base_url = "YOUR_LOCAL_ENDPOINT_URL", 
  api_key="YOUR_LOCAL_API_KEY" 
 ) 
 chat_completion = client.chat.completions.create( 
  model="model_name", 
  messages=[{"role" : "user" , "content" : "Write me a love song" }], 
  temperature=0.7 
 ) 

Casos de Uso

Como o NIM Está Sendo Usado

Veja como o NVIDIA NIM é compatível com casos de uso do setor e comece seu desenvolvimento de IA com exemplos selecionados.

Assistentes Virtuais de IA
Inteligência de Documentos
Compras Hiperpersonalizadas
Configuradores de Produtos 3D

Assistentes Virtuais de IA

Aprimore as experiências dos clientes e melhore os processos empresariais com a IA generativa.

Saiba Mais Sobre a IA no Atendimento ao Cliente

Crie Agora

Humano virtual em uma sessão de bate-papo virtual.

Processamento Inteligente de Documentos

Use a IA generativa para acelerar e automatizar o processamento de documentos.

Saiba Mais Sobre o Processamento Inteligente de Documentos

Crie Agora

IA para Compras Hiperpersonalizadas

Ofereça experiências customizadas que melhoram a satisfação do cliente com o poder da IA.

Saiba Mais Sobre Compras Hiperpersonalizadas

Crie Agora

Cliente usando uma IA conselheira para comprar.

Configuradores de Produtos 3D

Use o OpenUSD e a IA generativa para desenvolver e implantar ferramentas e experiências de configuradores de produtos 3D em praticamente qualquer dispositivo.

Saiba Mais Sobre os Configuradores de Produtos 3D

Carro 3D criado usando o OpenUSD e a IA generativa

Opções de Inicialização

Maneiras de Começar a Usar o NVIDIA NIM

Comece a Prototipar Gratuitamente

Comece agora com os terminais de API fáceis de usar para o NIM, com tecnologia DGX Cloud.

Acesse a infraestrutura de IA totalmente acelerada.
Garanta que seus dados não sejam usados para o treinamento de modelos.
Acesso para desenvolvimento e testes como parte do Programa de Desenvolvedores NVIDIA.

Crie Agora

Faça o Download e Comece a Implantar

Execute o NVIDIA NIM para escalar modelos de IA otimizados na nuvem ou no data center de sua escolha.

Garanta que os dados nunca saiam do seu perímetro seguro.
Transite de forma fluida dos terminais na nuvem para APIs auto-hospedadas sem alterações de código.
Comece com acesso gratuito para o desenvolvimento e testes e mude para uma licença NVIDIA AI Enterprise para a produção.

Implante Agora

Entre em Contato

Converse com um especialista em IA da NVIDIA sobre como migrar a fases de testes da IA generativa para a produção com a segurança, a estabilidade da API e o suporte que acompanham o NVIDIA AI Enterprise.

Explore seus casos de uso de IA generativa.
Discuta seus requisitos técnicos.
Alinhe as soluções de IA da NVIDIA com seus objetivos e exigências.

Contate a Equipe Comercial

Crie Agora

Recursos

Os Recursos Mais Recentes do NVIDIA NIM

Blogs
Sessões
Cursos
Vídeos

NVIDIA NIM nas Notícias

Veja Todos os Blogs de Tecnologia Veja Todas as Notícias do Assunto

Veja Todas as Sessões

Introdução aos Microsserviços NVIDIA NIM

Saiba como o NIM permite a criação, a implantação e o escalamento de aplicações de IA.

Veja o Curso

Implante grandes modelos de linguagem usando os microsserviços NIM

Dimensionamento de Sistemas de Inferência para LLM

Saiba como otimizar e implantar grandes modelos de linguagem usando os microsserviços NIM para aplicações reais.

Veja o Curso

Desenvolvendo um Gerador de Fundo com IA com o NIM

Analise o processo de criação de uma aplicação baseada no kit NVIDIA Omniverse™ habilitada para IA. Você aprenderá como usar as extensões do Omniverse, os microsserviços NIM e o código Python para adicionar uma extensão capaz de gerar fundos a partir de entradas de texto.

Veja o Curso

Veja Todos os Cursos

Como Criar um Agente de IA Simples em 5 Minutos com o NVIDIA NIM

Veja como configurar dois agentes de IA: um para geração de conteúdo e outro para design gráfico digital.

Assista Agora (04:09)

Microsserviços NVIDIA NIM para PCs RTX com IA

Aproveite os modelos de IA generativa mais recentes localmente no seu PC NVIDIA RTX™ com IA através do NVIDIA NIM e dos NVIDIA Blueprints.

Assista Agora (01:10)

Inferência de IA Generativa com Tecnologia NVIDIA NIM

Visualize o impacto da inferência de IA generativa de alto desempenho com os microsserviços NVIDIA NIM.

Assista Agora (02:33)

Veja Todos os Vídeos

Próximos Passos

Pronto para Começar?

Tenha acesso ilimitado aos terminais da API do NIM para prototipagem, acelerada pelo DGX Cloud. Quando tudo estiver pronto para a produção, faça o download e hospede você mesmo o NIM na sua infraestrutura preferida (workstation, data center, edge ou nuvem) ou acesse os terminais do NIM hospedados por parceiros da NVIDIA.

Comece Agora

Entre em Contato

Converse com um especialista em produtos da NVIDIA sobre como migrar da fase de testes para a produção com a segurança, a estabilidade da API e o suporte que acompanham o NVIDIA AI Enterprise.

Fale Conosco

Atualize-se Com as Notícias Sobre IA da NVIDIA

Receba as últimas notícias, tecnologias, avanços e muito mais diretamente na sua caixa de entrada.

Fique por Dentro

Microsserviços NVIDIA NIM

Visão Geral

O Que É o NVIDIA NIM?

Inferência de IA Generativa com Tecnologia NVIDIA NIM: Desempenho e TCO

Acesso Gratuito de Desenvolvimento ao NIM

Acelere a Implantação de IA com o NVIDIA NIM

Benefícios

IA Generativa Empresarial Que Faz Mais por Menos

Facilidade de Uso

Nível Empresarial

Desempenho e Escala

Portabilidade

Demonstração

Crie Agentes de IA Com o NIM

Tecnologia

Bases para a IA Baseada em Agentes

Obtenha os Modelos de IA de Lógica Mais Recentes

Dê Início ao Desenvolvimento com os NVIDIA Blueprints

Simplifique o Desenvolvimento com o Kit de Ferramentas NVIDIA AgentIQ

Benchmarks

Aumente o Rendimento com o NIM

Modelos

Crie Com os Principais Modelos Abertos

Recursos

O Modo Fácil para o Desenvolvimento e a Implantação de IA

Implante o NIM

Inferência de Execução

Criação

Casos de Uso

Como o NIM Está Sendo Usado

Assistentes Virtuais de IA

Opções de Inicialização

Maneiras de Começar a Usar o NVIDIA NIM

Comece a Prototipar Gratuitamente

Faça o Download e Comece a Implantar

Entre em Contato

Recursos

Os Recursos Mais Recentes do NVIDIA NIM

NVIDIA NIM nas Notícias

(15 sessions)

Próximos Passos

Pronto para Começar?

Entre em Contato

Atualize-se Com as Notícias Sobre IA da NVIDIA