NVIDIA Nemotron

Modelos abiertos, multimodales y de alta eficiencia para agentes de IA de larga duración.

Descripción General

¿Qué Es NVIDIA Nemotron?

NVIDIA Nemotron es una familia de modelos de IA altamente eficientes, multimodales y abiertos desarrollados para agentes autoevolutivos y de larga duración. Los modelos de Nemotron, diseñados para la finalización rápida de tareas, ofrecen un alto rendimiento de razonamiento y una precisión líder para workflows de agentes complejos.

Con datos de entrenamiento transparentes y una amplia compatibilidad con plataformas, incluidas NVIDIA RTX PRO™ y NVIDIA DGX Spark™, los modelos de Nemotron están disponibles y están integrados abiertamente en todo el ecosistema de IA, lo que permite implementar agentes de IA confiables y de alto desempeño en cualquier lugar, desde el edge hasta la nube.

Desarrolle el Futuro del Trabajo con las Plataformas de Software Empresarial de NVIDIA

Descubra cómo el software de NVIDIA impulsa agentes de larga duración para workflows complejos en ingeniería, el área de la salud y las operaciones, lo que aumenta la productividad de los empleados.

NVIDIA Expande Modelos Abiertos para IA de Agentes y Física

Los nuevos modelos abiertos impulsan los agentes de IA, la IA física para robótica y la investigación en el área de la salud.

Video

Por Qué NVIDIA Desarrolló Nemotron

Escuche a Bryan Catanzaro, vicepresidente de investigación de aprendizaje profundo aplicado de NVIDIA, compartir la visión detrás de Nemotron y por qué las tecnologías abiertas son esenciales para desarrollar una IA confiable y lista para empresas.

Beneficios

¿Qué aporta Nemotron a la IA de agentes?

Modelos Abiertos

Los datos abiertos y las técnicas de optimización de NVIDIA garantizan modelos potentes, transparentes y adaptables para desarrolladores y empresas. Los modelos y los datos de entrenamiento se publican abiertamente en Hugging Face.

Alta Eficiencia de Computación

La familia Nemotron está optimizada para completar tareas agénticas más rápido con el más alto rendimiento y la arquitectura MoE híbrida.

Alta Exactitud

Los modelos de Nemotron, desarrollados desde el principio con conocimiento excepcional, posentrenados con datos de entrenamiento de alta calidad y alineados con el aprendizaje por refuerzo, logran una precisión líder para sistemas agénticos de larga duración.

Implementación Segura y Sencilla

La familia de modelos Nemotron, disponible como microservicios NVIDIA NIM™ optimizados, ofrece el máximo desempeño de inferencia y opciones de implementación flexibles, lo que garantiza una seguridad, privacidad y portabilidad superiores.

Modelos

Modelos para Cargas de Trabajo Diversas

Los modelos de Nemotron sobresalen en una gama de tareas de IA agéntica, como razonamiento, visión multimodal, generación aumentada por recuperación (RAG), habla y seguridad. Los modelos de investigación también están disponibles para la experimentación.

Razonamiento

Los modelos de Nemotron admiten una gama de cargas de trabajo de razonamiento. Nano proporciona una precisión y una eficiencia superiores para subagentes especializados, Super ofrece el más alto nivel de precisión, razonamiento con rendimiento y llamada de herramientas para ejecutar tareas complejas en sistemas de múltiples agentes y Ultra ofrece el mejor razonamiento para aplicaciones de misión crítica que exigen la máxima capacidad en workflows de múltiples pasos.

Comprensión Visual

Los modelos multimodales de Nemotron ofrecen la mayor eficiencia y una precisión líder en video, audio, imagen y texto para casos de uso de agentes empresariales. Están optimizados para subagentes especializados e impulsan capacidades como los agentes de uso de computadoras, la inteligencia de documentos y la comprensión de video y audio.

Habla

Los modelos de NVIDIA Nemotron Speech proporcionan reconocimiento automático de habla (ASR), texto a voz (TTS) y traducción automática neuronal (NMT) de alto rendimiento y latencia ultrabaja para aplicaciones de IA de agentes.

Generación Aumentada por Recuperación

Los modelos de Nemotron RAG ofrecen una comprensión rápida y precisa de documentos al extraer información estructurada multimodal, generar incrustaciones de alta calidad y clasificar los documentos más relevantes. Proporcionan una recuperación escalable y de alta velocidad que mejora la calidad de los datos para el entrenamiento de LLM, aumenta el desempeño de agentes y recuperadores y agiliza los flujos de trabajo de documentos.

Seguridad

Los modelos de NVIDIA Nemotron Safety proporcionan protección en tiempo real contra contenido dañino, desviaciones fuera de tema e intentos de jailbreak. Agregan una capa de seguridad de contenido multilingüe y multimodal con capacidades de razonamiento, lo que mejora la moderación y garantiza el alineamiento cultural.

Tecnología

Componentes de la IA Basada en Agentes

Comience a desarrollar agentes de IA con NVIDIA NeMo para la IA personalizada de agentes, NVIDIA NIM que permite una implementación rápida y lista para empresas, y NVIDIA Blueprints para acelerar el desarrollo con flujos de trabajo de referencia personalizables.

NVIDIA NeMo

  • Desarrolle, personalice e implemente IA generativa e IA basada en agentes.
  • Ofrezca grandes modelos de lenguaje (LLM) listos para empresas con selección de datos precisa, personalización de vanguardia, ingesta de datos escalable, RAG y desempeño acelerado.
  • Desarrolle fácilmente volantes de datos y optimice continuamente los agentes de IA con la información más reciente.

NVIDIA NIM

  • Acelere la implementación de modelos de IA generativa optimizados para brindar alto desempeño.
  • Ejecute sus aplicaciones empresariales con API estables y seguras que cuentan con soporte de nivel empresarial.

NVIDIA Blueprints

  • Comience rápidamente con aplicaciones de referencia para casos de uso de IA generativa, como la investigación profunda empresarial y el RAG multimodal.
  • Acelere el desarrollo con Blueprints, que incluyen microservicios de socios, uno o más agentes de IA, código de referencia, documentos de personalización y un gráfico de Helm para la implementación.

Opciones de Inicio

Formas de Comenzar con Nemotron

Comience a Crear Prototipos Gratis

Comience con terminales de API fáciles de usar con NIM, impulsadas por DGX™ Cloud.

  • Acceda a una infraestructura de IA completamente acelerada.
  • Asegúrese de que sus datos no se usen para el entrenamiento de modelos.
  • Sin créditos, solo una ruta sencilla para crear, probar e implementar.

Contáctenos

Hable con un especialista en IA de NVIDIA sobre cómo pasar los pilotos de IA generativa a la producción con la seguridad, la estabilidad de las API y la asistencia que viene con NVIDIA AI Enterprise.

  • Explore casos de uso de IA generativa.
  • Analice sus requisitos técnicos.
  • Alinee las soluciones de IA de NVIDIA con sus objetivos y requisitos.

Adoptantes

Empresas que Usan Nemotron

Recursos

Descubra lo Último en Nemotron

NVIDIA Lanza una Familia de Modelos de Razonamiento de Código Abierto para el Desarrollo de Plataformas de IA de Agentes

Explore la familia, posentrenada por NVIDIA, basada en Llama y destilada a partir de DeepSeek-R1, y aprenda cómo los modelos satisfacen las necesidades empresariales de los agentes de IA listos para la implementación.

Cree Agentes de IA Empresariales con Modelos de Razonamiento Avanzados de Código Abierto de NVIDIA Llama Nemotron

Lea cómo NVIDIA desarrolló la familia de modelos Llama Nemotron con razonamiento, que se basa en modelos abiertos de Llama y se posentrenó con la experiencia de razonamiento de DeepSeek-R1.

Desarrolle modelos de razonamiento personalizados para lograr una autonomía avanzada de IA para agentes

Aprenda a crear o personalizar modelos de razonamiento con varias técnicas, como la destilación y el aprendizaje por refuerzo

Blogs

Preguntas Frecuentes

Los modelos de NVIDIA Nemotron no solo son abiertos, sino que son verdaderamente de código abierto. NVIDIA publica conjuntos de datos, técnicas y ponderaciones de modelos de entrenamiento para que la comunidad de código abierto pueda beneficiarse de nuestro aprendizaje y usar estos recursos para crear sus propios modelos.

La Licencia de Modelos Abiertos de NVIDIA es una licencia de permisos que autoriza a los usuarios a usar, modificar, distribuir e implementar comercialmente los modelos y derivados sin atribuir autoría a NVIDIA, para fomentar la innovación y un mayor desarrollo de la IA generativa.

Sí, puede descargar y ejecutar modelos de NVIDIA Nemotron desde Hugging Face de forma gratuita en la producción.

NVIDIA también ofrece modelos de Nemotron como microservicios NVIDIA NIM para una implementación segura y escalable, lo que requiere una licencia de NVIDIA AI Enterprise. Puede probar los modelos de Nemotron y descargar los microservicios NIM desde build.nvidia.com.

Sí, NVIDIA se compromete a publicar más modelos, conjuntos de datos y técnicas de Nemotron para habilitar ecosistemas de código abierto.

Los modelos de NVIDIA Nemotron se basan en modelos abiertos del más alto nivel, lo que permite desarrollar mejores modelos más rápido. Además, NVIDIA publica las ponderaciones de los modelos, los conjuntos de datos de entrenamiento y las técnicas de entrenamiento para que la comunidad de desarrolladores pueda usar estas diferentes partes de Nemotron para entrenar sus propios modelos.

NVIDIA proporciona una variedad de herramientas, como NVIDIA Dynamo, TensorRT-LLM y NIM, para ejecutar modelos de Nemotron a escala en la producción. También puede usar bibliotecas de código abierto populares como SGLang y vLLM.

Próximos Pasos

¿Todo Listo para Empezar?

Use las herramientas y tecnologías correctas para llevar los modelos NVIDIA Nemotron del desarrollo a la producción.

Contáctenos

Hable con un especialista en productos de NVIDIA sobre cómo pasar de la fase piloto a la producción con la seguridad, la estabilidad de las API y la asistencia que viene con NVIDIA AI Enterprise.

Manténgase al Día con las Noticias sobre IA de Agentes de NVIDIA

Reciba las últimas noticias, tecnologías, avances y más sobre la IA de agentes directamente en su bandeja de entrada.