Acelere a Inovação na Nuvem

Diagnosticando câncer. Prevendo furacões. Automatizando operações de negócios. Estas são algumas das inovações possíveis quando se utiliza a computação acelerada para revelar os insights ocultos em vastos volumes de dados. A Amazon Web Services (AWS) e NVIDIA colaboram há mais de 13 anos para fornecer a nuvem acelerada por GPU mais poderosa e avançada para ajudar os clientes a construir um futuro mais inteligente.

Potencialize Novos Recursos com a AWS e NVIDIA

Área da Saúde

Forneça medicamentos personalizados e acelere avanços em pesquisas biomédicas com soluções AWS e NVIDIA.

Mídia e Entretenimento

Perceba o potencial da computação em nuvem para a criação de conteúdo digital. Adapte seus recursos à medida que as demandas do seu estúdio crescem e acesse os melhores talentos criativos em todo o mundo.

Serviços Financeiros

Impulsione o gerenciamento de riscos, melhore as decisões e a segurança baseadas em dados e aprimore as experiências dos clientes com soluções de IA generativa, deep learning, machine learning e processamento de linguagem natural (PNL) .

Gêmeos Digitais e o Metaverso

Aproveite o poder da simulação em larga escala para aplicações industriais e científicas.

IA Generativa e Machine Learning

Reduza o tempo de desenvolvimento, reduza os custos, melhore a precisão e o desempenho e tenha mais confiança nos resultados de IA com soluções NVIDIA executadas na AWS.

Computação de Alto Desempenho

Saiba como as soluções de computação de alto desempenho (HPC) da AWS e da NVIDIA são otimizadas para funcionarem juntas, resolvendo de maneira econômica os problemas mais complexos do mundo.

 

Explore Histórias de Clientes

Transcrição de Videochamada

A empresa de software Read.ai construiu sua plataforma de transcrição de videochamadas no NVIDIA® Riva e reduziu os custos em 20 a 30 por cento usando instâncias Amazon EC2 G5 com tecnologia de GPUs NVIDIA A10G Tensor Core.

Machine Learning em Ciências Biológicas

A empresa de ciências biológicas Paige está promovendo o tratamento do câncer com um workflow de machine learning híbrido criado usando instâncias P4d do Amazon EC2 com tecnologia de GPUs NVIDIA A100 Tensor Core.

Estúdio de Efeitos Visuais na Nuvem

A Netflix implantou seu estúdio de efeitos visuais (VFX) para facilitar a colaboração remota entre uma equipe global usando instâncias Amazon EC2 G5 com tecnologia de GPUs NVIDIA A10G.

IA Generativa para Conteúdo

A Iternal Technologies usou instâncias do Amazon EC2 com GPUs NVIDIA para ajudar seus clientes a turbinar seu marketing, melhorando o ROI em 30 vezes com IA generativa. Como a Iternal faz parte do NVIDIA Inception, ela foi uma das primeiras a obter acesso aos recursos de clonagem de voz do NVIDIA Riva para colocar um produto de voz de IA generativa de prova de conceito em funcionamento em duas semanas.

HPC e Machine Learning para Varejo

A empresa automotiva Reezocar estima reparos de veículos com rapidez e precisão usando AWS HPC e infraestrutura de machine learning com GPUs NVIDIA. Com esta infraestrutura, a empresa pode detectar meticulosamente amassados e imperfeições nos automóveis e estimar os custos de reparação em milissegundos, ajudando a prolongar a vida útil dos veículos.

IA Generativa para Games

A Codeway otimizou o desempenho de preço para sua aplicação de IA generativa, Wonder, usando instâncias Amazon EC2 G5 com GPU NVIDIA, economizando 48% em custos de computação.

Infraestrutura Acelerada da NVIDIA, da Nuvem ao Edge, na AWS

Amazon Elastic Cloud Compute (EC2)

Acesse uma ampla variedade de instâncias aceleradas por GPU NVIDIA no Amazon EC2 sob demanda para atender aos diversos requisitos computacionais de IA, machine learning, análise de dados, gráficos, games na nuvem, desktops virtuais e aplicações HPC. Desde instâncias de GPU única até milhares de GPUs em EC2 UltraClusters , os clientes da AWS podem provisionar a GPU do tamanho certo para acelerar o tempo de solução e reduzir os custos totais de execução de suas cargas de trabalho na nuvem.

Amazon EC2 G5 com NVIDIA A10G

Apresentando GPUs NVIDIA A10G Tensor Core e suporte para a tecnologia NVIDIA RTX™, as instâncias EC2 G5 são ideais para aplicações com uso intensivo de gráficos, como edição de vídeo, renderização, visualização 3D e simulações fotorrealistas. Além disso, eles podem ser usados para acelerar inferência de IA e cargas de trabalho de treinamento de IA com GPU única.

 

Amazon EC2 G5g com NVIDIA T4G

Apresentando GPUs NVIDIA T4G Tensor Core e processadores AWS Graviton2, as instâncias EC2 G5g são mais adequadas para desenvolvimento de games na nuvem e serviços de games Android na nuvem. Eles também podem ser usados para inferência de IA econômica usando software habilitado para Arm® do catálogo NVIDIA NGC™

 

Amazon EC2 P4d com NVIDIA A100 40GB

Apresentando oito GPUs Tensor Core NVIDIA A100 de 40GB, as instâncias EC2 P4d oferecem o mais alto desempenho para IA e HPC. Para treinamento de IA de vários nós e cargas de trabalho de HPC distribuídas, você pode dimensionar de poucas até milhares de GPUs NVIDIA A100 em EC2 UltraClusters.

Amazon EC2 P5 com NVIDIA H100 80 GB

As GPUs Tensor Core oferecem o mais alto desempenho no Amazon EC2 para deep learning e aplicações de HPC. Eles ajudam você a acelerar o tempo de solução em até 6 vezes em comparação com instâncias EC2 baseadas em GPU da geração anterior e a reduzir o custo de treinamento de modelos de machine learning em até 40%.

Soluções de Nuvem Híbrida e Edge da AWS

Aproveite o poder da computação acelerada pela NVIDIA em uma ampla variedade de soluções de edge e nuvem híbrida da AWS para atender aos requisitos de baixa latência e em tempo real de cargas de trabalho como IA, machine learning, games, criação de conteúdo e realidade aumentada (AR) e streaming de realidade virtual (VR). O stack de software nativo da nuvem e com desempenho otimizado da NVIDIA garante que você obtenha o melhor desempenho para suas aplicações, onde quer que eles precisem ser executados, da nuvem até o edge.

AWS Panorama

AWS Panorama é uma coleção de dispositivos de machine learning e um SDK que leva visão computacional para câmeras de protocolo de Internet (IP) locais. Os dispositivos no edga do AWS Panorama são criados no sistema NVIDIA Jetson™ em módulos (SOM) e usam o SDK NVIDIA JetPack para acelerar a IA no edge para casos de uso de inspeção industrial, monitoramento de tráfego e gerenciamento da cadeia de suprimentos.

AWS Outposts

Com as GPUs NVIDIA T4 Tensor Core no AWS Outposts, você pode atender aos requisitos de segurança e latência em uma ampla variedade de aplicações gráficas e de IA em data centers locais. Combinado com o acesso ao software otimizado para GPU do NGC, você pode obter insights de grandes quantidades de ordens de magnitude de dados mais rapidamente do que apenas CPUs.

AWS Wavelength

O AWS Wavelength leva a nuvem AWS até o edge da rede móvel 5G para desenvolver e implantar aplicações de latência ultrabaixa. As zonas do AWS Wavelength oferecem acesso a instâncias aceleradas por GPU NVIDIA para acelerar aplicações como streaming de games, AR/VR e inferência de IA no edge.

AWS IoT Greengrass

O AWS IoT Greengrass estende os serviços da AWS para dispositivos no edge, como plataformas NVIDIA Jetson, para desenvolver modelos de IA e implantá-los no edge para agir localmente nos dados gerados. Combinado com o SDK NVIDIA DeepStream, você pode criar e implantar aplicações de IA de visão de alto rendimento e baixa latência no edge.

Simplifique o Desenvolvimento e Maximize o Desempenho com Software Otimizado para NVIDIA

Software Otimizado para NVIDIA na AWS

Acesse o poder computacional das instâncias aceleradas por GPU NVIDIA na AWS para desenvolver e implantar suas aplicações em escala com menos recursos computacionais, acelerando o tempo de solução e reduzindo o TCO. Para maximizar o desempenho e a produtividade do desenvolvedor, a NVIDIA oferece uma ampla variedade de software otimizado para GPU para uma ampla variedade de cargas de trabalho, incluindo ciência de dados, análise de dados, treinamento em IA e machine learning, inferência de IA e machine learning, HPC e gráficos.

NVIDIA NGC

NVIDIA NGC é o portal de serviços empresariais, software, ferramentas de gerenciamento e suporte para IA ponta a ponta e workflows de gêmeos digitais. O catálogo de software NGC fornece uma variedade de recursos que atendem às necessidades de cientistas de dados, desenvolvedores e pesquisadores com diversos níveis de especialização, incluindo contêineres, modelos pré-treinados, SDKs específicos de domínio, coleções baseadas em casos de uso e gráficos Helm para o mais rápido Implementações de IA. Para levar cargas de trabalho de IA para produção com software NGC, você pode acessar suporte, treinamento e serviços de nível empresarial com NVIDIA AI Enterprise.

NVIDIA AI Enterprise na AWS

NVIDIA AI Enterprise é um pacote de software de IA seguro, completo e nativo da nuvem. Ele acelera os pipelines de ciência de dados e agiliza o desenvolvimento, a implantação e o gerenciamento de modelos preditivos de IA para automatizar processos essenciais e fornecer insights rápidos a partir dos dados. NVIDIA AI Enterprise inclui uma extensa biblioteca de software full-stack, incluindo workflows de IA da NVIDIA, frameworks, modelos pré-treinados e otimização de infraestrutura. O suporte empresarial global e as revisões regulares de segurança garantem a continuidade dos negócios e que os projetos de IA permanecem no caminho certo.

Workstation Virtual NVIDIA RTX

A workstation virtual NVIDIA RTX (RTX vWS) para gráficos acelerados por GPU ajuda profissionais criativos e técnicos a maximizar sua produtividade em qualquer lugar, fornecendo acesso às aplicações profissionais de design e engenharia mais exigentes na nuvem. Instâncias Amazon EC2 G5 (NVIDIA A10G) e G4dn (NVIDIA T4), combinadas com o Imagem de máquina Amazon RTX vWS (AMI), permite a plataforma gráfica 3D mais avançada do setor, incluindo o mais recente ray tracing em tempo real com tecnologia RTX em máquinas virtuais.

NVIDIA-Accelerated AWS Services

NVIDIA and AWS collaborate closely on integrations to bring the power of NVIDIA-accelerated computing to a broad range of AWS services. Whether you provision and manage the NVIDIA GPU-accelerated instances on AWS yourself or leverage them in managed services like Amazon SageMaker or Amazon Elastic Kubernetes Service (EKS), you have the flexibility to choose the optimal level of abstraction you need.

Amazon EMR

Aproveite o Acelerador NVIDIA RAPIDS™ para Apache Spark no Amazon EMR para acelerar pipelines de ciência de dados do Apache Spark 3.x sem nenhuma alteração de código em instâncias AWS aceleradas por GPU NVIDIA. Essa integração permite que os cientistas de dados executem seus pipelines de extração, transformação e carregamento (ETL), processamento de dados e machine learning em grande escala e reduzam os custos da nuvem, fazendo mais em menos tempo e com menos instâncias baseadas na nuvem.

Amazon SageMaker

O software de IA da NVIDIA e as instâncias aceleradas por GPU podem acelerar cada etapa dos workflows de IA e machine learning no Amazon Sagemaker , incluindo preparação de dados, treinamento de modelo e serviço de inferência. Para implantar modelos de IA na produção com mais rapidez e reduzir custos de inferência, o Amazon SageMaker integrou o Servidor de Inferência NVIDIA Triton™, habilitando recursos como suporte a múltiplos frameworks, lote dinâmico e execução de modelo simultâneo que maximizam o desempenho em instâncias de CPU e GPU na AWS.

Amazon Titan

Uma equipe de cientistas e desenvolvedores experientes da AWS criando os modelos básicos Amazon Titan para Amazon Bedrock, um serviço de IA generativa, usa NVIDIA NeMo™, um framework nativo da nuvem de ponta a ponta para criar, personalizar e implantar modelos de IA generativa em qualquer lugar.

E o Elastic Fabric Adapter (EFA) da AWS oferece aos clientes uma infraestrutura UltraCluster Networking que pode conectar diretamente mais de 10.000 GPUs e ignorar o sistema operacional e a CPU usando NVIDIA GPUDirect® .

Recursos para Desenvolvedores e Guias de Início Rápido

Oficinas de Rótulos MONAI

Saiba como você pode usar MONAI, um framework de IA de código aberto para área da saúde, em seu trabalho. Junte-se a nós para ter uma experiência prática.

BioNeMo Agora na AWS

Pesquisadores e desenvolvedores das principais empresas farmacêuticas e tecnológicas agora podem implantar facilmente o software e serviços NVIDIA Clara™, incluindo NVIDIA BioNeMo™, para área da saúde acelerada por meio da AWS.

Acelere Sua Startup

 

Explore o programa que oferece a startups de ponta em todo o mundo acesso crítico a suporte de entrada no mercado, conhecimento técnico, treinamento e oportunidades de financiamento.

Recursos de IA usando TensorRT -LLM

Anteriormente, a criação de listas de produtos detalhadas exigia tempo e esforço significativos para os vendedores, mas esse processo simplificado lhes dá mais tempo para se concentrarem em outras tarefas. O software NVIDIA TensorRT-LLM está disponível hoje no GitHub e pode ser acessado por meio do NVIDIA AI Enterprise, que oferece segurança, suporte e confiabilidade de nível empresarial para IA de produção.

NVIDIA CloudXR

NVIDIA CloudXR ™ é a tecnologia de streaming de realidade estendida (XR) da NVIDIA, baseada no software RTX e RTX Virtual Workstation. Ao usar o CloudXR junto com os protocolos de streaming Amazon NICE DCV, você pode usar recursos de computação sob demanda para todos os aspectos do desenvolvimento de aplicações imersivas.

Servidor de Inferência NVIDIA Triton no Amazon SageMaker

Este blog fornece uma visão geral do Servidor de Inferência NVIDIA Triton e do SageMaker, mostra as vantagens do uso de contêineres do Servidor de Inferência Triton e mostra como é fácil implantar seus próprios modelos de machine learning. Para trabalhar a partir de um bloco de notas de amostra que suporte esta postagem do blog, faça o download aqui.

NVIDIA Riva em Escala com Amazon EKS

Este guia passo a passo mostra como implantar e dimensionar habilidades de fala NVIDIA Riva no Amazon EKS com balanceamento de carga baseado em Traefik.

Amazon Music Usa SageMaker com NVIDIA para Otimizar Treinamento e Inferência de Machine Learning

Dê uma olhada na jornada que a Amazon Music percorreu para otimizar desempenho e custos usando SageMaker, o Servidor de Inferência NVIDIA Triton e NVIDIA TensorRT®. Mostramos como funciona a barra de pesquisa aparentemente simples, mas complexa, garantindo uma experiência perfeita no Amazon Music com atrasos de digitação mínimos ou zero e resultados de pesquisa relevantes em tempo real.

Amazon Acelera a Satisfação do Cliente com NVIDIA Triton e TensorRT

Amazon.com, um dos sites de comércio eletrônico mais visitados do mundo, usa um modelo de IA que corrige automaticamente palavras com erros ortográficos em consultas de pesquisa para permitir que os clientes comprem com mais facilidade. A Amazon mede o sucesso de seus resultados de pesquisa acelerados com base na latência, a rapidez com que os erros de digitação são corrigidos, e no número de sessões bem-sucedidas.

Acesse o Poder da AWS e da NVIDIA

Instâncias P5 do Amazon EC2

NVIDIA AI Enterprise

Workstations Virtuais NVIDIA RTX