NVIDIA NeMo

Un conjunto de software integral para crear, supervisar y optimizar agentes de IA a lo largo de su ciclo de vida a escala empresarial.

Descripción

¿Qué es NVIDIA NeMo?

NVIDIA NeMo™ es un conjunto de software modular para gestionar el ciclo de vida de los agentes de IA. Proporciona microservicios y kits de herramientas para el procesamiento de datos, el ajuste preciso y la evaluación de modelos, el aprendizaje por refuerzo, la aplicación de políticas y la observabilidad de sistemas. NeMo ayuda a las empresas a crear, supervisar y optimizar sistemas de IA de agentes a escala, en cualquier infraestructura acelerada por GPU. Se integra con plataformas de IA existentes y admite la implementación en la nube, in situ e híbrida, lo que permite a las empresas gestionar rápidamente y crear sin esfuerzo volantes de datos que optimicen continuamente a los agentes de IA.

Nuevo blueprint de NVIDIA AI para crear volantes de datos

Ya disponible, este nuevo blueprint de IA permite a los desarrolladores crear un volante de datos automatizado que impulsa continuamente sus aplicaciones de IA generativa y de agentes con modelos más precisos y eficientes.

Ventajas

Explore las ventajas de NVIDIA NeMo para la IA de agentes

Gestión modular del ciclo de vida de los agentes de IA

Gestione el ciclo de vida de los agentes de IA, desde la selección de datos, la personalización y la evaluación hasta la protección, la observabilidad y la optimización, con un conjunto de software interoperable y listo para la empresa.

Optimizar la implementación y el escalado

Cree fácilmente volantes de datos que utilizan datos empresariales para mejorar los agentes de IA, impulsando todo el volante con una simple implementación de gráfico de Helm o llamadas API para varias partes del flujo de trabajo.

Aumento del retorno de la inversión (ROI)

Entrene, personalice e implemente rápidamente modelos de lenguaje de gran tamaño (LLM), modelos de lenguaje de visión (VLM), vídeo e IA de voz a escala, lo cual reduce el tiempo para llegar a la solución y aumenta el ROI.

Rendimiento acelerado

Maximice el rendimiento y la capacidad de los agentes de IA con optimización acelerada por GPU, escalado de varios nodos y ajuste para lograr un entrenamiento, una implementación y una mejora continuos y rentables.

IA de agentes más segura

Cree sistemas de IA de agentes más seguros examinando modelos, protegiendo indicaciones y escaneando continuamente en busca de vulnerabilidades.

Listo para producción

Implemente en producción una solución de pila completa, segura y optimizada que ofrece soporte, seguridad y estabilidad de API como parte de NVIDIA AI Enterprise.

Cree, supervise y optimice agentes de IA en cualquier lugar, desde la nube y el centro de datos hasta el perímetro.

Características

Herramientas para gestionar el ciclo de vida de los agentes de IA

El ciclo de vida de los agentes de IA es un proceso de extremo a extremo para desarrollar y mejorar agentes de IA en aplicaciones de producción. NVIDIA NeMo proporciona herramientas que facilitan cada etapa de este flujo de trabajo para que las empresas puedan crear agentes potentes, seguros y en continuo aprendizaje.

Desarrollar
Prepare datos listos para la IA

Procese los conjuntos de datos multimodales existentes en formatos de alta calidad y listos para la IA para las canalizaciones de desarrollo y genere datos sintéticos para cerrar las brechas de datos críticas.
Seleccione el modelo correcto

Seleccione o cree modelos adecuados para el caso de uso, valídelos con pruebas de referencia académicas, ejecute evaluaciones personalizadas y ajuste si es necesario.
  • NVIDIA Nemotron
    Modelos de razonamiento multimodal abiertos y de vanguardia.
  • NeMo Retriever
    Modelos de extracción, incrustación y reclasificación para canalizaciones RAG.
  • NeMo Evaluator
    Someter a pruebas de referencia, probar y evaluar modelos y agentes.
Cree su agente de IA

Convierta su modelo personalizado en una aplicación escalable, conéctelo a la perfección a su pila y herramientas empresariales y defina los flujos de trabajo con una orquestación flexible.
  • NeMo Agent Toolkit
    Kit de herramientas independiente de cualquier marco para crear, perfilar y optimizar agentes de IA.
Implementación
Implemente su agente con el máximo rendimiento

Optimice su agente para la producción con inferencia de alto rendimiento y baja latencia, garantizando que se pueda escalar para satisfacer las exigencias empresariales y ofrecer respuestas rápidas y de confianza.
  • NVIDIA NIM
    Ejecute modelos de IA en contenedores optimizados, expuestos como API compatibles con OpenAI.
Siga apoyándose en los datos y aplique barreras de protección

Utilice la generación aumentada por recuperación (RAG) para basar las respuestas de los agentes en conocimientos de confianza al tiempo que aplica barreras de protección de seguridad, cumplimiento normativo y moderación de contenido.
  • NeMo Retriever
    Cree canalizaciones RAG precisas que preserven la privacidad.
  • NeMo Guardrails
    Garantiza la seguridad, el cumplimiento normativo y el control en todas las interacciones de IA.
Optimizar
Supervise y recopile comentarios

Haga un seguimiento de las interacciones reales del agente con usuarios y otros sistemas. Evalúe sistemáticamente su rendimiento y precisión, encontrando oportunidades para mejorar continuamente.
  • NeMo Agent Toolkit
    Kit de herramientas independiente de cualquier marco para crear, perfilar y optimizar agentes de IA.
  • NeMo Customizer
    Ajuste y alinee modelos con datos de dominio.
  • NeMo Framework
    Kit de herramientas de código abierto para entrenar y alinear modelos LLM y multimodales.
Mejore continuamente con volantes de datos

Utilice los comentarios y los datos recopilados a partir de la supervisión para crear un volante basado en datos, reentrenando iterativamente al agente para optimizarlo continuamente y que siga siendo eficaz con el tiempo.
  • NeMo RL
    Posentrenamiento y alineación de modelos a escala con técnicas avanzadas de aprendizaje por refuerzo.
  • NeMo Gym
    Entornos de entrenamiento simulados para generar implementaciones de RL (Aprendizaje de refuerzo) de agentes de alta calidad.
  • NeMo Evaluator
    Someter a pruebas de referencia, probar y evaluar modelos y agentes.
  • NeMo Customizer
    Ajuste y alinee modelos con datos de dominio.

Casos de uso

Cómo se utiliza NeMo

Descubra cómo NVIDIA NeMo respalda los casos de uso del sector y estimula el desarrollo de IA.

Agentes de IA

Los agentes de IA transforman el servicio al cliente en todos los sectores y ayudan a las empresas a mejorar las conversaciones con los clientes, lograr altas tasas de resolución y mejorar la productividad de los representantes humanos. Los agentes de IA pueden manejar tareas predictivas, razonar y resolver problemas, formarse para comprender términos específicos del sector y extraer información relevante de las bases de conocimientos de una organización dondequiera que residan los datos.

Generación de datos sintéticos para IA de agentes

Los sistemas especializados de IA de agentes necesitan conjuntos de datos masivos y de alta calidad que son lentos y costosos de recopilar a partir de fuentes del mundo real. Los datos sintéticos creados a través de simulaciones o modelos de IA generativa pueden eliminar este cuello de botella al crear escenarios de entrenamiento ilimitados sin restricciones de privacidad ni problemas de calidad. Esto permite un desarrollo más rápido de LLM de razonamiento, responsables de la toma de decisiones de varios pasos y asistentes de IA multimodal.

Asistente de IA

Las empresas están implementando asistentes de IA para abordar de manera eficiente las consultas de millones de clientes y empleados las veinticuatro horas del día. Con los microservicios NVIDIA NIM personalizados para LLM, RAG e IA de voz y de traducción, estos compañeros de equipo de IA proporcionan respuestas de voz inmediatas y precisas, incluso con ruido de fondo, mala calidad de sonido y diversidad de dialectos y acentos.

Recuperación de información

Se generan billones de archivos PDF cada año, y cada archivo probablemente se compone de varias páginas llenas de varios tipos de contenido, incluidos texto, imágenes, gráficos y tablas. Esta mina de oro de datos solo puede ser utilizada con la rapidez con la que los humanos puedan leerla y entenderla. Pero con la IA generativa y la RAG, estos datos sin explotar se pueden utilizar para descubrir ideas comerciales que pueden ayudar a los empleados a trabajar de manera más eficiente y a reducir los costes.

Generación de contenido

La IA generativa permite generar contenido muy relevante, personalizado, preciso y fundamentado en la especialización sectorial y en la propiedad intelectual de la empresa.

Robot humanoide

Los robots humanoides han sido diseñados para adaptarse rápidamente a los actuales espacios de trabajo, tanto urbanos como industriales, centrados en el ser humano, a fin de abordar las tareas más tediosas, repetitivas o físicamente exigentes. Su versatilidad los lleva a lugares tan variados como las fábricas y los centros de atención sanitaria, donde estos robots asisten a los humanos y ayudan a sobrellevar la escasez de mano de obra a través de la automatización.

Apptronik

Opciones iniciales

Maneras de empezar a usar NVIDIA NeMo

Gestione el ciclo de vida de los agentes de IA con herramientas y tecnologías para crear, supervisar y optimizar agentes de IA en la producción.

1

Pruebe modelos de base optimizados por NVIDIA, como NVIDIA Nemotron.

2

Cree, supervise y optimice agentes de IA con NVIDIA NeMo.

3

Empiece a crear sus soluciones de IA con NVIDIA Blueprints.

Historias de clientes

Cómo impulsan los líderes del sector la innovación con NeMo

Usuarios

Principales usuarios de todos los sectores

Recursos

Lo último en recursos de NVIDIA NeMo

Empezar con la personalización de LLM

En este curso irá más allá del diseño por indicaciones de los LLM y aprenderá técnicas para personalizar de forma eficiente LLM preentrenados para sus casos de uso específicos. Con los microservicios NVIDIA NIM, NeMo Curator y NeMo Framework, aprenderá diversos métodos de ajuste preciso con parámetros eficientes a fin de personalizar el comportamiento de los LLM para su organización.

Perfeccione las habilidades de su LLM

Aproveche nuestra exhaustiva ruta de aprendizaje para LLM, que abarca desde los temas básicos hasta los avanzados y proporciona formación práctica desarrollada e impartida por expertos de NVIDIA. Puede optar por la flexibilidad de realizar los cursos a su propio ritmo o inscribirse en talleres impartidos por instructores para obtener un certificado de competencia.

Obtenga la certificación de NVIDIA

Muestre sus habilidades en IA generativa y avance en su carrera profesional obteniendo la certificación de NVIDIA. Nuestro nuevo programa de certificación profesional ofrece dos exámenes de desarrollador que giran en torno a la competencia en modelos de lenguaje de gran tamaño (LLM) y en habilidades de flujo de trabajo multimodal.

Entrenar a un LLM capaz de razonar en un fin de semana

Analice un enfoque sencillo y computacionalmente eficiente para entrenar modelos de razonamiento con pequeñas cantidades de datos de entrenamiento seleccionados a partir del conjunto de datos de postentrenamiento de Llama Nemotron y NVIDIA NeMo.

Optimizar agentes de IA con un volante de datos

Descubra cómo optimizar agentes de IA en la producción con NVIDIA Data Flywheel Blueprint, un bucle continuo de destilación, ajuste preciso y evaluación impulsado por microservicios NeMo y NIM.

Crear agentes de IA con el kit de herramientas de código abierto NeMo Agent.

Descubra cómo crear, integrar y optimizar agentes de IA personalizados con el kit de herramientas Python de código abierto NVIDIA NeMo Agent.

Próximos pasos

¿Todo listo para empezar?

Utilice las herramientas y tecnologías más adecuadas para llevar los modelos de IA generativa desde la fase de desarrollo a la fase de producción.

Para desarrolladores

Explore todo lo que necesita para empezar a desarrollar con NVIDIA NeMo, incluida la documentación más reciente, tutoriales, blogs técnicos y mucho más.

Póngase en contacto

Hable con un especialista en productos de NVIDIA sobre cómo pasar de la fase piloto a la de producción con la garantía de seguridad, estabilidad de API y asistencia técnica que ofrece NVIDIA AI Enterprise.

Shell

Shell entrena con NVIDIA NeMo un chatbot de IA personalizado para mejorar las operaciones

Shell, líder global en el sector de la energía, ha aprovechado NVIDIA NeMo™ para impulsar su andadura hacia el desarrollo de un chatbot de IA personalizado para experiencia en el ámbito de la química. Esta solución innovadora tiene el potencial de mejorar significativamente la productividad de los empleados al agilizar los procesos de búsqueda, mejorar la toma de decisiones y favorecer la investigación y el desarrollo en entornos de producción.

AI Sweden

Acelerar las aplicaciones del sector con LLM

AI Sweden facilitó las aplicaciones de modelos lingüísticos regionales al ofrecer un acceso fácil a un potente modelo de 100 000 millones de parámetros. Digitalizaron los registros históricos para desarrollar modelos lingüísticos de uso comercial.

Amazon

Cómo Amazon y NVIDIA ayudan a los vendedores a crear mejores listados de productos con IA

Amazon duplica la velocidad de inferencia de las nuevas capacidades de IA con NVIDIA TensorRT-LLM y GPU para ayudar a los vendedores a optimizar las listas de productos con mayor rapidez.

Amdocs

NVIDIA y Amdocs llevan la IA generativa personalizada al sector global de las telecomunicaciones

Amdocs tiene previsto crear LLM personalizados para el sector mundial de las telecomunicaciones, con un valor de 1,7 billones de dólares, mediante el servicio de creación de IA de NVIDIA en Microsoft Azure.

AT&T

AT&T impulsa la precisión, la eficiencia y el rendimiento de los agentes de IA de atención al cliente con NVIDIA NeMo

AT&T, una de las mayores empresas de telecomunicaciones del mundo, reimagina la atención al cliente a través de la potencia de la IA. Frente a desafíos como la deriva de modelos, el aumento de las demandas computacionales y la necesidad de acceso a datos en tiempo real, AT&T recurrió a los microservicios NVIDIA NeMo™ para crear una plataforma de IA basada en comentarios que mejora continuamente el rendimiento al tiempo que optimiza los costes, la velocidad y la conformidad.

AWS

NVIDIA impulsa el entrenamiento para algunos de los modelos de base de Amazon Titan más grandes

Amazon aprovechó el marco de trabajo NVIDIA NeMo, las GPU y los EFA (adaptadores de tejido elástico) de AWS para entrenar a su LLM de última generación, lo cual proporciona a algunos de los clientes de modelos de base más grandes de Amazon Titan una solución más rápida y accesible para la IA generativa.

Accenture

Acelerar la adopción de IA generativa para empresas

ServiceNow, NVIDIA y Accenture anunciaron el lanzamiento de AI Lighthouse, un programa pionero diseñado para acelerar el desarrollo y la adopción de capacidades de IA generativa para empresas.

Azure

Aprovechamos la potencia de NVIDIA AI Enterprise en Azure Machine Learning

Obtenga acceso a un ecosistema completo de herramientas, bibliotecas, entornos de trabajo y servicios de soporte adaptados a entornos empresariales en Microsoft Azure.

Bria

Bria crea IA generativa responsable para empresas con NVIDIA NeMo y Picasso

Bria, una startup con sede en Tel Aviv, ayuda a las empresas que buscan formas responsables de integrar la tecnología de IA generativa visual en sus productos empresariales con un servicio de IA generativa que hace hincapié en la transparencia de los modelos junto con la atribución justa y la protección de los derechos de autor.

Cohesity

Descubra sus superpoderes de datos: los microservicios NVIDIA liberan IA generativa segura de nivel empresarial para Cohesity.

Con NVIDIA NIM y modelos optimizados, los clientes de Cohesity DataProtect pueden añadir inteligencia de IA generativa a las copias de seguridad y los archivos de datos. Esto permite a Cohesity y NVIDIA trasladar las capacidades de la IA generativa a todos los clientes de Cohesity DataProtect. Al utilizar la potencia de los modelos optimizados de NIM y NVIDIA, los clientes de Cohesity DataProtect obtienen el poder de la información basada en datos de sus copias de seguridad y archivos, lo cual permite alcanzar nuevos niveles de eficiencia, innovación y crecimiento.

CrowdStrike

Dar forma al futuro de la IA en el dominio de la ciberseguridad

CrowdStrike y NVIDIA están aprovechando la computación acelerada y la IA generativa para brindar a sus clientes una gama innovadora de soluciones basadas en IA, diseñadas específicamente para abordar de manera eficiente las amenazas de seguridad.

Dell

Diseño validado de Dell para la IA generativa con NVIDIA

Dell Technologies y NVIDIA han anunciado una iniciativa para facilitar a las empresas la creación y el uso de modelos de IA generativa en sus instalaciones de forma rápida y segura.

Deloitte

Descubrir el valor de la IA generativa en todas las plataformas de software empresariales

Deloitte utilizará la tecnología y los conocimientos de IA de NVIDIA para crear soluciones de IA generativa de alto rendimiento destinadas a plataformas de software empresarial que permitan generar un importante valor empresarial.

Domino Data Lab

Domino ofrece IA generativa lista para la producción con tecnología de NVIDIA

Con NVIDIA NeMo, los científicos de datos pueden ajustar los LLM en la plataforma de Domino para casos de uso específicos del dominio basados en datos patentados e IP, sin necesidad de empezar desde cero.

Dropbox

Dropbox y NVIDIA llevarán la IA generativa personalizada a millones de clientes

Dropbox tiene previsto utilizar AI Foundry de NVIDIA para desarrollar modelos personalizados y mejorar el trabajo de conocimiento impulsado por IA mediante la herramienta de búsqueda universal Dropbox Dash y Dropbox AI.

Google Cloud

Titanes de IA colaboran para crear magia generativa de IA

En su conferencia Next, Google Cloud anunció la disponibilidad de sus instancias A3 con tecnología de GPU NVIDIA H100 Tensor Core. Los equipos de ingeniería de ambas empresas han colaborado para incorporar NVIDIA NeMo a las instancias A3 y lograr así un entrenamiento y una inferencia más rápidos.

Hugging Face

Comunidad líder en IA para acelerar el proceso de organización de datos

Hugging Face, la plataforma abierta líder para creadores de IA, colabora con NVIDIA para integrar NeMo Curator y acelerar DataTrove, su biblioteca de filtrado y deduplicación de datos. «¡Nos entusiasman las capacidades de aceleración por GPU de NeMo Curator y estamos impacientes por verlas contribuir a DataTrove!», dice Jeff Boudier, director de producto de Hugging Face.

KT

Creamos nuevas experiencias de clientes con LLM

El operador móvil líder de Corea del Sur desarrolla modelos LLM de mil millones de parámetros entrenados con la plataforma NVIDIA DGX SuperPOD y el marco NeMo para impulsar altavoces inteligentes y centros de llamadas de atención al cliente.

Lenovo

Nueva arquitectura de referencia para IA generativa basada en LLM

Solución para acelerar la innovación al permitir a los partners y clientes globales desarrollar, entrenar e implementar IA a escala en todos los sectores verticales con la máxima seguridad y eficiencia.

Quantiphi

Capacitamos a las empresas para acelerar sus avances impulsados por la IA

Quantiphi se especializa en el entrenamiento y el ajuste preciso de los modelos de base utilizando el marco de NVIDIA NeMo, así como en la optimización de las implementaciones a escala con la plataforma de software NVIDIA AI Enterprise, a la vez que se adhiere a los principios de IA responsable.

SAP

SAP y NVIDIA aceleran la adopción de IA generativa en diversas aplicaciones empresariales para impulsar a sectores empresariales globales

Los clientes pueden aprovechar sus datos empresariales en las soluciones en la nube de SAP utilizando modelos LLM personalizados que se han implementado con los servicios de NVIDIA AI Foundry y los microservicios NVIDIA NIM.

ServiceNow

Creación de IA generativa en TI empresarial

ServiceNow desarrolla LLM personalizados en su propia plataforma para permitir la automatización inteligente de flujos de trabajo y aumentar la productividad en los procesos de TI empresariales.

Perplexity

Mejorar el rendimiento del modelo para motores de búsqueda impulsados por IA

Mediante el uso de NVIDIA NeMo, Perplexity tiene como objetivo personalizar rápidamente los modelos de frontera para mejorar la precisión y la calidad de los resultados de búsqueda, con el fin de optimizarlos para conseguir una latencia menor y un rendimiento alto a fin de mejorar la experiencia de usuario.

VMware

VMware y NVIDIA introducen la IA generativa en las empresas

VMware Private AI Foundation con NVIDIA permitirá a las empresas personalizar modelos y ejecutar aplicaciones de IA generativa, incluidos chatbots inteligentes, asistentes, búsquedas y resúmenes.

Weight & Biases

Depurar, optimizar y supervisar canalizaciones LLM 

Weights & Biases ayuda a los equipos que trabajan en casos de uso de IA generativa o con LLM a rastrear y visualizar todos los experimentos de ingeniería de estímulos (lo que ayuda a los usuarios a depurar y optimizar las canalizaciones de LLM), además de proporcionar capacidades de supervisión y observabilidad para los LLM.

Writer

Una empresa emergente redacta una historia de éxito de IA generativa con NVIDIA NeMo

Con NVIDIA NeMo, Writer está desarrollando LLM que ayudan a cientos de empresas a crear contenido personalizado para casos de uso empresariales en marketing, formación, soporte y mucho más. 

Arize

Arize impulsa los volantes de datos de IA que se optimizan automáticamente

La plataforma de ingeniería y observabilidad LLM de Arize integra microservicios NVIDIA NeMo para impulsar los volantes de datos de IA, lo que permite el refinamiento continuo de modelos a través de comentarios del mundo real. Con NeMo Customizer, Evaluator y Guardrails, Arize garantiza que los sistemas de agentes sean eficientes y seguros, así como que estén alineados con las cambiantes necesidades empresariales. Esta colaboración respalda el desarrollo de una IA adaptativa que aprende y evoluciona con el tiempo.

DataRobot

Agentes de IA preparados para empresas y de confianza con NeMo en DataRobot

Con NVIDIA NeMo integrado en el conjunto de IA empresarial de DataRobot, las empresas pueden garantizar que los sistemas de agentes sean seguros, cumplan las normas y estén basados en datos específicos de la empresa. Esta integración facilita el desarrollo de agentes de IA que ofrecen respuestas precisas y conscientes del contexto al tiempo que se adhieren a los estándares organizativos.

DataStax

DataStax y NVIDIA crean una plataforma de datos e IA

Durante el año pasado, DataStax se ha asociado con NVIDIA para adoptar los microservicios NVIDIA NeMo a fin de mejorar la IA generativa, la generación aumentada por recuperación y la búsqueda híbrida en su base de datos y sus ofertas de IA. Los resultados han sido impresionantes: un rendimiento 19 veces mejor de la producción, una reducción significativa de los costes y una latencia mejorada.

Galileo

Galileo y NVIDIA NeMo: reducir los riesgos de la IA de agentes en la producción

Galileo integra microservicios NVIDIA NeMo para crear volantes de datos de IA que refuercen el rendimiento, la fiabilidad y la confianza de los agentes. NeMo añade capacidades complementarias a la plataforma Galileo, lo que permite un ajuste preciso, continuo y específico del dominio a través de NeMo Customizer, una evaluación avanzada con NeMo Evaluator y la protección de las interacciones de los usuarios con NeMo Guardrails para permitir a los equipos de IA crear, evaluar y supervisar sistemas de IA de agentes que aprenden y mejoran continuamente en entornos reales.

Creación e implementación de modelos de IA generativa

Las empresas recurren a la IA generativa para revolucionar la forma en que innovan, optimizan las operaciones y crean una ventaja competitiva. NeMo es una plataforma de extremo a extremo destinada a seleccionar datos; entrenar, personalizar y evaluar modelos multimodales; y a ejecutar inferencias a escala. Admite la generación de texto, imágenes, vídeo y voz.

Hacer posible la generación de datos sintéticos con Llama 3.1

Descubra cómo usar el modelo Meta Llama 3.1 405B para generar datos sintéticos adaptados a un sector específico, explorar cómo evaluar esos datos empleando el modelo Nemotron-4 340B Reward y asegurar que se ajusten a las preferencias humanas a través de NVIDIA NeMo.

Desarrollar asistentes virtuales de IA de primer nivel para el servicio de atención al cliente con RAG

Descubra cómo las empresas pueden utilizar el asistente virtual de IA para NVIDIA AI Blueprint de atención al cliente a fin de mejorar la eficacia operativa de las soluciones de centro de contacto existentes o crear nuevos sistemas centrados en el servicio de atención al cliente.