NVIDIA AI

Crie IA Generativa com NVIDIA NIM

Explore os modelos de IA otimizados mais recentes, conecte aplicações a dados com o NVIDIA Blueprints e implante em qualquer lugar com microsserviços NVIDIA NIM.

Experimente Agora os Principais Modelos Abertos


Integrações

A IA Acelerada Está Apenas a Uma API de Distância

Comece a trabalhar rapidamente com APIs conhecidas.

Compatibilidade Perfeita com Bibliotecas Populares

Compatibilidade Perfeita com Bibliotecas Populares

Aproveite as APIs NVIDIA dos seus SDKs existentes com apenas três linhas de código.

import openai
client = openai.OpenAI(
base_url = "https://integrate.api.nvidia.com/v1",
api_key="YOUR_NVIDIA_API_KEY"
)
chat_completion = client.chat.completions.create(
model="mistralai/mixtral-8x7b-instruct-v0.1",
messages=[{"role" : "user" , "content" : "Write me a love song" }],
temperature=0.7
)

Construa com as Ferramentas Que Você Adora

Trabalhe com seus frameworks favoritos de programação LLM, incluindo LangChain e LlamaIndex, e implante facilmente suas aplicações.

Construa com as Ferramentas Que Você Adora

Desbloqueie Insights de Dados Corporativos

Os dados impulsionam aplicações corporativas modernas. Conecte agentes de IA a dados corporativos em escala com um mecanismo de consulta de IA que usa geração aumentada por recuperação (RAG) para equipar os funcionários com conhecimento institucional instantâneo e preciso.

NVIDIA Blueprints

Tudo o que você precisa para criar aplicações de IA generativa impactantes.   Cada blueprint inclui microsserviços NVIDIA NIM e parceiros, um ou mais agentes de IA, código de exemplo, instruções de personalização e um gráfico do Helm para implantação.

NIM Agent Blueprints

Execute em Qualquer Lugar

Acelere Sua Implantação de IA com o NVIDIA NIM

Parte do NVIDIA AI Enterprise, o NVIDIA NIM é um conjunto de microsserviços de inferência fáceis de usar para acelerar a implantação de modelos básicos em qualquer nuvem ou data center e ajudar a manter seus dados seguros.

Accelerate Your AI Deployment With NVIDIA NIM

Implante o NIM

Implante o NIM para seu modelo com um único comando. Você também pode executar facilmente o NIM com modelos otimizados.

Execute a Inferência

Coloque o NIM em funcionamento com o mecanismo de tempo de execução ideal com base na sua infraestrutura acelerada pela NVIDIA.

Crie

Os desenvolvedores podem integrar endpoints NIM auto-hospedados em apenas algumas linhas de código.

Deploy
Run
Build
docker run nvcr.io/nim/publisher_name/model_name
curl -X 'POST' \ 'http://0.0.0.0:8000/v1/completions' \ -H 'accept: application/json' \ -H 'Content-Type: application/json' \ -d '{ "model" : "model_name", "prompt" : "Once upon a time", "max_tokens" : 64 }'
import openai client = openai.OpenAI( base_url = "YOUR_LOCAL_ENDPOINT_URL", api_key="YOUR_LOCAL_API_KEY" ) chat_completion = client.chat.completions.create( model="model_name", messages=[{"role" : "user" , "content" : "Write me a love song" }], temperature=0.7 )

Launch Locally or Scale  With Kubernetes

Inicie Localmente ou Dimensione com o Kubernetes

Implante perfeitamente microsserviços de IA em contêineres em qualquer infraestrutura acelerada da NVIDIA, desde um único dispositivo até a escala do data center.

Implante com Segurança e Confiança

Implante com Segurança e Confiança

Conte com tempos de execução de nível de produção, incluindo atualizações de segurança contínuas, e execute suas aplicações de negócios com APIs estáveis apoiadas por suporte de nível empresarial.

Continually Lower Costs and Your Carbon Footprint

Redução de Custos e de Sua Pegada de Carbono

Reduza o custo operacional de execução de modelos em produção com tempos de execução de IA que são continuamente otimizados para baixa latência e alto rendimento na infraestrutura acelerada pela NVIDIA.

Taxa de Transferência

O NVIDIA NIM fornece taxa de transferência e latência otimizadas prontas para uso para maximizar a geração de tokens, oferecer suporte a usuários simultâneos em horários de pico e melhorar a capacidade de resposta.

01x2x3x2.8X1XNIM OnNIM Off


Configuração: Llama3.1-8B-instruir, 1x H100SXM; insira 1000 tokens, produza 1000 tokens. Solicitações simultâneas: 200. NIM ON: FP8. taxa de transferência 6.354 tokens/s, TTFT 0,4s, ITL: 31ms. NIM OFF: FP8. taxa de transferência 2.265 tokens/s, TTFT 1,1s, ITL: 85ms.

Veja os NVIDIA NIMs em Ação

Personalização

Adapte os Microsserviços NIM para Suas Necessidades Específicas de Domínio

Ajuste Fino com NVIDIA NeMo

NVIDIA NeMo™ é uma plataforma de ponta a ponta para desenvolver IA generativa personalizada em qualquer lugar. Ele inclui ferramentas para treinamento, personalização e geração aumentada por recuperação, proteção, curadoria de dados e pré-treinamento de modelos, oferecendo às empresas uma maneira fácil, econômica e rápida de adotar a IA generativa.

Ajuste Fino com NVIDIA NeMo

Comece Agora

Comece a Prototipar Gratuitamente

Comece a usar APIs sem servidor gerenciadas pela NVIDIA fáceis de usar.

  • Acesse uma infraestrutura de IA totalmente acelerada.
  • Verifique se os dados não são usados para treinamento de modelo.
  • Comece gratuitamente com 1.000 créditos de inferência.

Faça o Download e Implante

Execute o NVIDIA NIM para dimensionar modelos de IA otimizados na nuvem ou no data center de sua escolha.

  • Certifique-se de que os dados nunca saiam do seu enclave seguro.
  • Faça a transição perfeita de endpoints de nuvem para APIs auto-hospedadas sem alterações de código.
  • Use uma licença NVIDIA AI Enterprise para produção ou comece gratuitamente com o Programa de Desenvolvedores da NVIDIA.

Casos de Uso

Impulsione Sua Inovação

Veja como as APIs da NVIDIA oferecem suporte a casos de uso do setor e impulsione seu desenvolvimento de IA com exemplos selecionados.

Humanos Digitais

Humanos Digitais

Dê vida aos personagens do game ou crie avatares virtuais interativos para aprimorar o atendimento ao cliente, capacitando sua aplicação para se conectar mais profundamente com os usuários.

Geração de Conteúdo

Geração de Conteúdo

Gere conteúdo altamente relevante, personalizado e preciso, baseado na experiência de domínio e na propriedade intelectual de sua empresa.

Geração Biomolecular

Geração Biomolecular

Os modelos generativos biomoleculares e o poder computacional das GPUs exploram eficientemente o espaço químico, gerando rapidamente diversos conjuntos de pequenas moléculas adaptadas a alvos ou propriedades específicas de medicamentos.

Ecossistema

Leve Sua IA Empresarial Mais Longe e Mais Rápido

Desenvolva suas aplicações de IA com modelos, kits de ferramentas, bancos de dados vetoriais,
frameworks e infraestrutura com nossos principais parceiros.

Recursos

Desbloqueie, Melhore e Aprimore

NVIDIA LaunchPad
NVIDIA LaunchPad

Desbloqueie a IA com um Laboratório Prático

Experimente soluções de IA de ponta a ponta por meio de laboratórios práticos guiados para frameworks de desenvolvimento, chatbots baseados em geração aumentada por recuperação (RAG), otimizações de rota e muito mais.

Programa de Desenvolvedores NVIDIA
Programa de Desenvolvedores NVIDIA

Acelere Suas Aplicações de IA

Obtenha acesso gratuito ao NIM para desenvolvimento, pesquisa e teste de aplicações, além de recursos de aprendizado técnico por meio do Programa de Desenvolvedor NVIDIA.

NVIDIA AI Workbench
AI Workbench

Comece Pequeno. Execute Grande.

O NVIDIA AI Workbench oferece aos desenvolvedores a flexibilidade de executar modelos habilitados para API em contêineres locais ou remotos com GPU, permitindo workflows de projetos interativos, desde a experimentação até a prototipagem e a prova de conceito.

Explore NVIDIA NIM  in the News
Notícias

Explore o NVIDIA NIM nas Notícias

Confira os últimos comunicados à imprensa da NVIDIA para ver como NIM e IA generativa estão impactando indústrias, parceiros, clientes e muito mais.

Documentação

Explore a documentação técnica para começar a prototipar e criar suas aplicações corporativas de IA com APIs NVIDIA ou dimensione em sua própria infraestrutura com o NVIDIA NIM.