IA da NVIDIA

Microsserviços NVIDIA NIM

Projetados para implantação rápida e confiável de inferência de IA generativa acelerada em qualquer lugar.

Visão Geral

O Que É o NVIDIA NIM?

O NVIDIA NIM™ fornece microsserviços de inferência pré-construídos e otimizados para a implantação rápida dos modelos de IA mais recentes em qualquer infraestrutura acelerada pela NVIDIA: nuvem, data center, workstation e edge.

Inferência de IA Generativa com Tecnologia NVIDIA NIM: Desempenho e TCO

Veja como os microsserviços NIM têm um desempenho melhor do que as alternativas mais conhecidas. Eles podem processar até 3 vezes mais tokens por segundo quando executados na mesma infraestrutura acelerada pela NVIDIA.

Acesso Gratuito de Desenvolvimento ao NIM

Tenha acesso à prototipagem ilimitada com APIs hospedadas para o NIM aceleradas pelo DGX Cloud ou faça o download e hospede você mesmo os microsserviços NIM para pesquisa e desenvolvimento como parte do Programa de Desenvolvedores NVIDIA.

Acelere a Implantação de IA com o NVIDIA NIM

O NVIDIA NIM combina a facilidade de uso e a simplicidade operacional das APIs gerenciadas com a flexibilidade e segurança dos modelos de auto-hospedagem na sua infraestrutura preferida. Os microsserviços NIM acompanham tudo o que as equipes de IA precisam: modelos fundacionais de IA mais recentes, mecanismos de inferência otimizados, APIs padrão do setor e dependências de tempo de execução, pré-empacotados em contêineres de software de nível empresarial prontos para implantação e dimensionamento em qualquer lugar.

Diagrama do Stack do NVIDIA NIM

Benefícios

IA Generativa Empresarial Que Faz Mais por Menos

Microsserviços fáceis de usar e de nível empresarial criados para IA de alto desempenho, projetados para funcionar com perfeição e escalar de maneira acessível. Experimente o mais rápido tempo de geração de valor para agentes de IA e outras aplicações de IA generativa empresarial, capacitadas pelos modelos de IA mais recentes para lógica, simulação, fala e muito mais. 

Ícone que mostra a facilidade de uso

Facilidade de Uso

Acelere a inovação e o tempo de chegada ao mercado com microsserviços pré-construídos e otimizados para os modelos de IA mais recentes. Com APIs padrão, os modelos podem ser implantados em cinco minutos e facilmente integrados às aplicações.

Ícone que mostra segurança e capacidade de gerenciamento

Nível Empresarial

Implante microsserviços de nível empresarial que são continuamente gerenciados pela NVIDIA por meio de processos de validação rigorosos e ramais de recursos dedicados, todos com suporte empresarial da NVIDIA, que também oferece acesso direto aos seus especialistas em IA.

Ícone mostrando desempenho e escala

Desempenho e Escala

Melhore o TCO com a inferência de IA de baixa latência e alto rendimento que escala com a nuvem, e alcance a melhor precisão com suporte para modelos minuciosamente ajustados e prontos para uso.

Ícone mostrando portabilidade

Portabilidade

Implante em qualquer lugar com microsserviços pré-construídos e nativos de nuvem prontos para execução em qualquer infraestrutura acelerada pela NVIDIA (nuvem, data center e workstation) e escale com perfeição em ambientes Kubernetes e de provedores de serviços de nuvem. 

Demonstração

Crie Agentes de IA Com o NIM

Saiba como configurar dois agentes de IA, um para geração de conteúdo e outro para design gráfico digital, e veja como é fácil começar a usar os microsserviços NIM.


Tecnologia

Bases para a IA Baseada em Agentes

Ícone de lógica do NIM

Obtenha os Modelos de IA de Lógica Mais Recentes

Obtenha os modelos de IA mais recentes para lógica, linguagem, recuperação, fala, visão e muito mais, prontos para implantação em cinco minutos em qualquer infraestrutura acelerada pela NVIDIA.

Ícone dos NVIDIA Blueprints

Dê Início ao Desenvolvimento com os NVIDIA Blueprints

Crie aplicações de IA baseada em agentes impactantes com workflows de referência abrangentes que incluem bibliotecas de aceleração da NVIDIA, SDKs e microsserviços NIM.

Ícone do kit de ferramentas AgentIQ

Simplifique o Desenvolvimento com o Kit de Ferramentas NVIDIA AgentIQ

Transforme microsserviços NIM em aplicações de IA baseadas em agentes com a biblioteca NVIDIA AgentIQ, um kit de ferramentas para desenvolvedores projetado para a criação de agentes de IA e sua integração em workflows personalizados.

Benchmarks

Aumente o Rendimento com o NIM

O NVIDIA NIM fornece rendimento e latência otimizados desde o início para maximizar a geração de tokens, além de oferecer suporte a usuários simultâneos em horários de pico e melhorar a capacidade de resposta. Os microsserviços NIM são continuamente atualizados com os mecanismos de inferência otimizados mais recentes, aumentando o desempenho na mesma infraestrutura ao longo do tempo.

0.0x0.5x1.0x1.5x2x2X1XNIM OnNIM Off

Configuração: instrução Llama 3.1 8B, 1 unidade de H100 SXM; solicitações simultâneas: 200. NIM ATIVO: FP8, rendimento de 1201 tokens/s, ITL de 32 ms. NIM INATIVO: FP8, rendimento de 613 tokens/s, ITL de 37 ms.

Modelos

Crie Com os Principais Modelos Abertos

Obtenha um desempenho de inferência otimizado para os modelos de IA mais recentes para capacitar a IA baseada em agentes multimodais com lógica, linguagem, recuperação, fala, imagem e muito mais. O NIM vem com mecanismos de inferência acelerada da NVIDIA e da comunidade, incluindo o NVIDIA® TensorRT™, o TensorRT-LLM e muito mais, pré-criados e otimizados para inferência de baixa latência e alto rendimento na infraestrutura acelerada pela NVIDIA. 


Recursos

O Modo Fácil para o Desenvolvimento e a Implantação de IA

Projetados para serem executados em qualquer lugar, os microsserviços de inferência NIM expõem APIs padrão do setor para fácil integração com sistemas e aplicações empresariais, além de escalarem com perfeição no Kubernetes para oferecer inferência de alto rendimento e baixa latência em escala de nuvem.

Implante o NIM

Implante o NIM para o seu modelo com um único comando. Também é fácil você executar o NIM com modelos ajustados com precisão.

Inferência de Execução

Coloque o NIM em funcionamento com o mecanismo de tempo de execução ideal baseado em sua infraestrutura acelerada pela NVIDIA.

Criação

Integre os terminais auto-hospedados do NIM com apenas algumas linhas de código.

Deploy
Run
Build
docker run nvcr.io/nim/publisher_name/model_name
curl -X 'POST' \ 'http://0.0.0.0:8000/v1/completions' \ -H 'accept: application/json' \ -H 'Content-Type: application/json' \ -d '{ "model" : "model_name", "prompt" : "Once upon a time", "max_tokens" : 64 }'
import openai client = openai.OpenAI( base_url = "YOUR_LOCAL_ENDPOINT_URL", api_key="YOUR_LOCAL_API_KEY" ) chat_completion = client.chat.completions.create( model="model_name", messages=[{"role" : "user" , "content" : "Write me a love song" }], temperature=0.7 )

Casos de Uso

Como o NIM Está Sendo Usado

Veja como o NVIDIA NIM é compatível com casos de uso do setor e comece seu desenvolvimento de IA com exemplos selecionados.

Assistentes Virtuais de IA

Aprimore as experiências dos clientes e melhore os processos empresariais com a IA generativa.

Humano virtual em uma sessão de bate-papo virtual.

Opções de Inicialização

Maneiras de Começar a Usar o NVIDIA NIM

Comece a Prototipar Gratuitamente

Comece agora com os terminais de API fáceis de usar para o NIM, com tecnologia DGX Cloud.

  • Acesse a infraestrutura de IA totalmente acelerada.
  • Garanta que seus dados não sejam usados para o treinamento de modelos.
  • Acesso para desenvolvimento e testes como parte do Programa de Desenvolvedores NVIDIA.

Faça o Download e Comece a Implantar

Execute o NVIDIA NIM para escalar modelos de IA otimizados na nuvem ou no data center de sua escolha.

  • Garanta que os dados nunca saiam do seu perímetro seguro.
  • Transite de forma fluida dos terminais na nuvem para APIs auto-hospedadas sem alterações de código.
  • Comece com acesso gratuito para o desenvolvimento e testes e mude para uma licença NVIDIA AI Enterprise para a produção.

Entre em Contato

Converse com um especialista em IA da NVIDIA sobre como migrar a fases de testes da IA generativa para a produção com a segurança, a estabilidade da API e o suporte que acompanham o NVIDIA AI Enterprise.

  • Explore seus casos de uso de IA generativa.
  • Discuta seus requisitos técnicos.
  • Alinhe as soluções de IA da NVIDIA com seus objetivos e exigências.

Recursos

Os Recursos Mais Recentes do NVIDIA NIM

Próximos Passos

Pronto para Começar?

Tenha acesso ilimitado aos terminais da API do NIM para prototipagem, acelerada pelo DGX Cloud. Quando tudo estiver pronto para a produção, faça o download e hospede você mesmo o NIM na sua infraestrutura preferida (workstation, data center, edge ou nuvem) ou acesse os terminais do NIM hospedados por parceiros da NVIDIA.

Entre em Contato

Converse com um especialista em produtos da NVIDIA sobre como migrar da fase de testes para a produção com a segurança, a estabilidade da API e o suporte que acompanham o NVIDIA AI Enterprise.

Atualize-se Com as Notícias Sobre IA da NVIDIA

Receba as últimas notícias, tecnologias, avanços e muito mais diretamente na sua caixa de entrada.

Select Location
Middle East