Visit your regional NVIDIA website for local content, pricing, and where to buy partners specific to your country.
Ferramentas para levar grandes modelos de linguagem (LLMs) do desenvolvimento à produção.
Experimente a plataforma empresarial completa para IA generativa.
Experimente modelos base otimizados pela NVIDIA.
Crie protótipo com APIs hospedadas por NeMo e NVIDIA.
Execute na produção com NVIDIA AI Enterprise.
Comece a criar protótipos com os principais modelos de IA generativa de código aberto desenvolvidos pela NVIDIA e ajustados para alto desempenho e eficiência. Os LLMs podem então ser personalizados com NeMo e implantados usando NVIDIA NIM do Catálogo de API da NVIDIA.
Inicie o desenvolvimento de modelos de IA generativa com processamento automatizado de dados, técnicas de treinamento de modelos e opções flexíveis de implantação.
Conecte dados empresariais a modelos de IA generativa e recupere informações com a menor latência, maior rendimento e máxima privacidade de dados.
Orquestre o gerenciamento de diálogos para LLMs, garantindo precisão, adequação e segurança em aplicativos inteligentes.
Use esta ferramenta de curadoria de dados acelerada por GPU para preparar conjuntos de dados em grande escala e de alta qualidade para pré-treinamento de modelos de IA generativa.
Simplifique o ajuste fino e o alinhamento de LLMs para casos de uso específicos de domínio com este microsserviço escalonável e de alto desempenho.
Avalie LLMs e RAGs personalizados de maneira eficiente e confiável em diversos benchmarks acadêmicos e personalizados em qualquer nuvem ou data center.
O NVIDIA AI Enterprise é a plataforma de software completa que coloca IA generativa ao alcance de todas as empresas, fornecendo o tempo de execução mais rápido e eficiente para modelos básicos de IA generativa. Inclui NeMo e NVIDIA NIM para agilizar a adoção com segurança, estabilidade, capacidade de gerenciamento e suporte.
Solicite um avaliação gratuita de 90 dias para acessar soluções de IA generativa e suporte empresarial hoje.
Encontre uma coleção de documentos, guias, manuais, instruções e outros recursos informativos no NeMo Documentation Hub.
Confira NVIDIA On-Demand, que apresenta conteúdo gratuito sobre NeMo do GTC e outras conferências de tecnologia de todo o mundo.
Leia como o NeMo permite criar, personalizar e implantar grandes modelos de linguagem.
Aprenda como configurar projetos completos com aprendizado prático e obtenha certificação nas mais recentes tecnologias de IA generativa.
NVIDIA NeMo é um framework nativo da nuvem de ponta a ponta para criar, personalizar e implantar modelos de IA generativa em qualquer lugar. Inclui frameworks de treinamento e inferência, um kit de ferramentas de proteção, ferramentas de curadoria de dados e modelos pré-treinados, oferecendo às empresas uma maneira fácil, econômica e rápida de adotar IA generativa. Os desenvolvedores podem optar por acessar o NeMo por meio de código-fonte aberto no GitHub, como um contêiner empacotado no NVIDIA Catálogo NGC™ ou por meio de uma assinatura do NVIDIA AI Enterprise.
NeMo está disponível como parte do NVIDIA AI Enterprise. Os detalhes completos de preços e licenciamento podem ser encontrados aqui.
Os clientes podem obter suporte NVIDIA Business-Standard por meio de uma assinatura do NVIDIA AI Enterprise que inclui o NeMo . O suporte NVIDIA Business-Standard oferece diferentes níveis de serviço, acesso a especialistas da NVIDIA e suporte de longo prazo em implantações locais e na nuvem.
O NVIDIA AI Enterprise inclui o suporte NVIDIA Business Standard. Para obter suporte e serviços adicionais disponíveis, como suporte crítico aos negócios da NVIDIA, gerente técnico de contas, treinamento e serviços profissionais, consulte o Guia de serviços e suporte empresarial da NVIDIA.
O NeMo Curator é uma ferramenta escalonável de curadoria de dados que permite aos desenvolvedores classificar conjuntos de dados multilíngues de trilhões de tokens para LLMs de pré-treinamento. Ele consiste em um conjunto de módulos Python expressos como APIs que fazem uso de Dask, cuDF, cuGraph e Pytorch para dimensionar tarefas de curadoria de dados, como download de dados, extração de texto, limpeza, filtragem, desduplicação exata/difusa e classificação de texto para milhares. de núcleos de computação.
O NeMo Guardrails, um kit de ferramentas de código aberto, orquestra o gerenciamento de diálogos, garantindo precisão, adequação e segurança em aplicações inteligentes com grandes modelos de linguagem. Ele protege as empresas que supervisionam os sistemas LLM.
O NeMo Guardrails permite que os desenvolvedores configurem três tipos de limites:
Com o NeMo Retriever, uma coleção de microsserviços de IA generativa, as empresas podem conectar perfeitamente modelos personalizados a diversos dados de negócios para fornecer respostas altamente precisas. O NeMo Retriever fornece recuperação de informações de classe mundial com menor latência, maior rendimento e máxima privacidade de dados, permitindo que as empresas usem melhor seus dados e gerem insights de negócios em tempo real. O NeMo Retriever aprimora aplicações de IA generativa com recursos de geração aumentada de recuperação (RAG) de nível empresarial, que podem ser conectados a dados de negócios onde quer que estejam.
NVIDIA NIM, parte do NVIDIA AI Enterprise, é um tempo de execução fácil de usar projetado para acelerar a implantação de IA generativa em empresas. Este microsserviço versátil oferece suporte a uma ampla gama de modelos de IA, desde modelos de comunidade de código aberto até modelos NVIDIA AI Foundation, bem como modelos base de IA personalizados sob medida. Construído sobre as bases robustas dos mecanismos de inferência, ele foi projetado para facilitar a inferência contínua de IA em escala, garantindo que as aplicações de IA possam ser implantadas na nuvem, no data center e na workstation.
NeMo Evaluator é um microsserviço automatizado projetado para avaliação rápida e confiável de LLMs e RAGs personalizados. Abrange diversos benchmarks com métricas predefinidas, incluindo avaliações humanas e técnicas de LLMs como juiz. Vários trabalhos de avaliação podem ser implantados simultaneamente no Kubernetes em plataformas de nuvem ou data centers preferenciais por meio de chamadas de API, permitindo resultados agregados eficientes.
NeMo Customizer é um microsserviço escalonável e de alto desempenho que simplifica o ajuste fino e o alinhamento de LLMs para casos de uso específicos de domínio.
A geração de recuperação aumentada é uma técnica que permite aos LLMs criar respostas a partir das informações mais recentes, conectando-as à base de conhecimento da empresa. O NeMo trabalha com várias ferramentas de terceiros e da comunidade, incluindo Milvus, Llama Index e LangChain , para extrair trechos relevantes de informações do banco de dados de vetores e alimentá-los ao LLM para gerar respostas em linguagem natural.
A NVIDIA oferece workflows de IA, exemplos de referência empacotados e nativos da nuvem que ilustram como os frameworks de IA da NVIDIA podem ser aproveitados para criar soluções de IA. Com modelos pré-treinados, pipelines de treinamento e inferência, Notebooks Jupyter e gráficos Helm, os workflows de IA aceleram o caminho para o fornecimento de soluções de IA.
Crie rapidamente suas soluções de IA generativa com estes workflows completos:
NVIDIA LaunchPad é um campo de testes universal, que oferece testes abrangentes do mais recente hardware e software empresarial da NVIDIA. Esta plataforma dinâmica agiliza testes de curto prazo, facilita provas de conceito (POCs) de longo prazo e estimula o desenvolvimento acelerado de serviços gerenciados e soluções autônomas.
Os usuários podem iniciar sua jornada de IA com um ambiente de desenvolvimento prescritivo adaptado às suas necessidades. Ou podem explorar um vasto catálogo de laboratórios práticos projetados para oferecer experiências imersivas em uma variedade de casos de uso, desde IA e ciência de dados até design 3D e otimização de infraestrutura. As empresas obtêm acesso fácil aos mais recentes stacks acelerados de hardware e software implantados em infraestrutura hospedada privada.
NVIDIA AI Enterprise é uma plataforma de software nativa da nuvem de ponta a ponta que acelera pipelines de ciência de dados e agiliza o desenvolvimento e a implantação de aplicações de IA de nível de produção, incluindo IA generativa, visão computacional, IA para fala e muito mais. Inclui as melhores ferramentas de desenvolvimento, frameworks, modelos pré-treinados e microsserviços para profissionais de IA e recursos de gerenciamento confiáveis para profissionais de IT para garantir desempenho, estabilidade de API e segurança.
O catálogo de APIs da NVIDIA fornece modelos de IA generativa prontos para produção e tempo de execução de inferência continuamente otimizado, empacotados como NVIDIA NIM, microsserviços que podem ser facilmente implantados com ferramentas padronizadas em qualquer sistema acelerado por GPU.
Mantenha-se atualizado sobre as últimas notícias sobre IA generativa da NVIDIA.
Receba atualizações para desenvolvedores, anúncios e muito mais da NVIDIA diretamente em sua caixa de entrada.
Quero receber as últimas novidades, anúncios e mais da NVIDIA sobre Soluções de Negócios Empresariais e Tecnologias e Ferramentas para Desenvolvedores.
Política de Privacidade da NVIDIA