Visit your regional NVIDIA website for local content, pricing, and where to buy partners specific to your country.
Encuentra la licencia adecuada para implementar, ejecutar y escalar la IA en cualquier aplicación y cualquier plataforma.
Para personas que buscan acceso al código de código abierto del servidor de inferencia Triton para desarrollo.
Para personas que buscan acceso a contenedores gratuitos del servidor de inferencia Triton para desarrollo.
Para empresas que quieren comprar Triton para producción
El servidor de inferencia NVIDIA Triton es un software de servicio de inferencia de código abierto. Permite a los equipos implementar, ejecutar y escalar modelos de IA desde cualquier marco (TensorFlow, NVIDIA TensorRT™, PyTorch, ONNX, XGBoost, Python, marcos personalizados y más) en cualquier infraestructura basada en GPU o CPU (nube, centro de datos o perímetro). Para obtener más información, visita la página web de Triton.
El Analizador de modelos Triton es una herramienta sin conexión que optimiza las configuraciones de implementación de inferencia (tamaño de lote, número de instancias de modelo, etc.) para lograr el mejor rendimiento, latencia y uso de la memoria en la GPU o CPU de destino. Admite el análisis de un único modelo, de conjuntos de modelos y de varios modelos simultáneos.
Triton se incluye con NVIDIA AI Enterprise, una plataforma software de IA de extremo a extremo con asistencia, estabilidad de seguridad y capacidad de administración de nivel empresarial. NVIDIA AI Enterprise incluye una asistencia de nivel empresarial que proporciona acceso a expertos en IA de NVIDIA, formación de clientes, recursos de la base de conocimientos y mucho más. También hay disponibles asistencia y servicios empresariales adicionales, como asistencia crítica para la empresa, un administrador técnico de cuenta dedicado, formación y servicios profesionales. Para obtener más información, visita la Guía del usuario de asistencia y servicios empresariales.
Sí, hay varios laboratorios que utilizan Triton en NVIDIA Launchpad.
NVIDIA LaunchPad es un programa que proporciona a los usuarios acceso a corto plazo al hardware y software empresarial de NVIDIA a través de un navegador web. Selecciona entre un amplio catálogo de laboratorios prácticos para experimentar soluciones en torno a casos de uso, desde IA y ciencia de datos hasta diseño 3D y optimización de la infraestructura. Las empresas pueden aprovechar inmediatamente las pilas de hardware y software necesarias en una infraestructura alojada privada.
Sí, Triton es la mejor opción del ecosistema para la inferencia de IA y la implementación de modelos. Triton está disponible en los mercados de AWS, Microsoft Azurey Google Cloud con NVIDIA AI Enterprise. También está disponible en Alibaba Cloud, Amazon Elastic Kubernetes Service (EKS), Amazon Elastic Container Service (ECS), Amazon SageMaker, Google Kubernetes Engine (GKE), Google Vertex AI, HPE Ezmeral, Microsoft Azure Kubernetes Service (AKS), Azure Machine Learningy Oracle Cloud Infrastructure Data Science Platform.
Mantente informado sobre las últimas novedades sobre inferencia de IA de NVIDIA.
Política de privacidad de NVIDIA