Implante Instantaneamente IA Generativa com NVIDIA NIM

Explore os modelos de IA mais recentes criados pela comunidade com uma API otimizada e acelerada pela NVIDIA e, em seguida, implante em qualquer lugar com os microsserviços de inferência NVIDIA NIM™.

Experimente Agora os Principais Modelos Abertos


Integrações

A IA Acelerada Está Apenas a Uma API de Distância

Comece a trabalhar rapidamente com APIs conhecidas.

Compatibilidade Perfeita com Bibliotecas Populares

Aproveite as APIs NVIDIA dos seus SDKs existentes com apenas três linhas de código.

import openai
client = openai.OpenAI(
base_url = "https://integrate.api.nvidia.com/v1",
api_key="YOUR_NVIDIA_API_KEY"
)
chat_completion = client.chat.completions.create(
model="mistralai/mixtral-8x7b-instruct-v0.1",
messages=[{"role" : "user" , "content" : "Write me a love song" }],
temperature=0.7
)

Construa com as Ferramentas Que Você Adora

Trabalhe com seus frameworks favoritos de programação LLM, incluindo LangChain e LlamaIndex, e implante facilmente suas aplicações.


Execute em Qualquer Lugar

Acelere sua Implantação de IA com NVIDIA NIM

Parte do NVIDIA AI Enterprise, o NVIDIA NIM é um conjunto de microsserviços fáceis de usar para acelerar a implantação de modelos básicos em qualquer nuvem ou data center e ajuda a manter seus dados seguros.

Accelerate Your AI Deployment With NVIDIA NIM

Implante o NIM

Implante o NIM para seu modelo com um único comando. Você também pode executar facilmente o NIM com modelos otimizados.

Execute a Inferência

Coloque o NIM em funcionamento com o mecanismo de tempo de execução ideal com base na sua infraestrutura acelerada pela NVIDIA.

Crie

Os desenvolvedores podem integrar endpoints NIM auto-hospedados em apenas algumas linhas de código.

Deploy
Run
Build
docker run nvcr.io/nim/publisher_name/model_name
curl -X 'POST' \ 'http://0.0.0.0:8000/v1/completions' \ -H 'accept: application/json' \ -H 'Content-Type: application/json' \ -d '{ "model" : "model_name", "prompt" : "Once upon a time", "max_tokens" : 64 }'
import openai client = openai.OpenAI( base_url = "YOUR_LOCAL_ENDPOINT_URL", api_key="YOUR_LOCAL_API_KEY" ) chat_completion = client.chat.completions.create( model="model_name", messages=[{"role" : "user" , "content" : "Write me a love song" }], temperature=0.7 )

Inicie Localmente ou Dimensione com o Kubernetes

Implante perfeitamente microsserviços de IA em contêineres em qualquer infraestrutura acelerada da NVIDIA, desde um único dispositivo até a escala do data center.

Implante com Segurança e Confiança

Conte com tempos de execução de nível de produção, incluindo atualizações de segurança contínuas, e execute suas aplicações de negócios com APIs estáveis apoiadas por suporte de nível empresarial.

Redução de Custos e de Sua Pegada de Carbono

Reduza o custo operacional de execução de modelos em produção com tempos de execução de IA que são continuamente otimizados para baixa latência e alto rendimento na infraestrutura acelerada pela NVIDIA.

Taxa de Transferência

O NVIDIA NIM fornece taxa de transferência e latência otimizadas prontas para uso para maximizar a geração de tokens, oferecer suporte a usuários simultâneos em horários de pico e melhorar a capacidade de resposta.


Configuração: Llama 3-70b-instruct, comprimento do token de entrada: 7.000, comprimento do token de saída: 1.000. Solicitações de clientes simultâneas: 100, em 4 x H100 SXM NVLink. NIM OFF: FP16, TTFT: ~120s, ITL: ~180ms; NIM ON: FP8, TTFT: ~4,5s, ITL: ~70ms.

Veja os NVIDIA NIMs em Ação

Comece Agora

Comece a Prototipar Gratuitamente

Comece com APIs sem servidor fáceis de usar e gerenciadas pela NVIDIA.

  • Acesse a infraestrutura de IA totalmente acelerada.
  • Garanta que seus dados não sejam usados ​​para treinamento de modelos.
  • Comece gratuitamente com 1.000 créditos de inferência.

Faça o Download e Implante

Execute o NVIDIA NIM para dimensionar modelos de IA otimizados na nuvem ou no data center de sua escolha.

  • Garanta que os dados nunca saiam do seu enclave seguro.
  • Transição perfeita de endpoints de nuvem para APIs auto-hospedadas sem alterações de código.
  • Use uma licença NVIDIA AI Enterprise para produção ou comece gratuitamente com o Programa de Desenvolvedores da NVIDIA.

Casos de Uso

Impulsione Sua Inovação

Veja como as APIs da NVIDIA oferecem suporte a casos de uso do setor e impulsione seu desenvolvimento de IA com exemplos selecionados.

Humanos Digitais

Dê vida aos personagens do game ou crie avatares virtuais interativos para aprimorar o atendimento ao cliente, capacitando sua aplicação para se conectar mais profundamente com os usuários.

Geração de Conteúdo

Gere conteúdo altamente relevante, personalizado e preciso, baseado na experiência de domínio e na propriedade intelectual de sua empresa.

Geração Biomolecular

Os modelos generativos biomoleculares e o poder computacional das GPUs exploram eficientemente o espaço químico, gerando rapidamente diversos conjuntos de pequenas moléculas adaptadas a alvos ou propriedades específicas de medicamentos.

Ecossistema

Leve Sua IA Empresarial Mais Longe e Mais Rápido

Desenvolva suas aplicações de IA com modelos, kits de ferramentas, bancos de dados vetoriais,
frameworks e infraestrutura com nossos principais parceiros.

Recursos

Desbloqueie, Melhore e Aprimore

NVIDIA LaunchPad

Desbloqueie a IA com um Laboratório Prático

Experimente soluções de IA de ponta a ponta por meio de laboratórios práticos guiados para frameworks de desenvolvimento, chatbots baseados em geração aumentada por recuperação (RAG), otimizações de rota e muito mais.

Programa de Desenvolvedores NVIDIA

Acelere Suas Aplicações de IA

Obtenha acesso gratuito ao NIM para desenvolvimento, pesquisa e teste de aplicações, além de recursos de aprendizado técnico por meio do Programa de Desenvolvedor NVIDIA.

AI Workbench

Comece Pequeno. Execute Grande.

O NVIDIA AI Workbench oferece aos desenvolvedores a flexibilidade de executar modelos habilitados para API em contêineres locais ou remotos com GPU, permitindo workflows de projetos interativos, desde a experimentação até a prototipagem e a prova de conceito.

Notícias

Explore o NVIDIA NIM nas Notícias

Confira os últimos comunicados à imprensa da NVIDIA para ver como NIM e IA generativa estão impactando indústrias, parceiros, clientes e muito mais.

Documentação

Explore a documentação técnica para começar a prototipar e criar suas aplicações corporativas de IA com APIs NVIDIA ou dimensione em sua própria infraestrutura com o NVIDIA NIM.