A engenharia de dados é a base da ciência de dados e estabelece os fundamentos para análise e modelagem. Para que as empresas possam extrair conhecimentos e insights de dados estruturados e não estruturados, é fundamental que tenham acesso rápido a conjuntos de dados precisos e completos. Trabalhar com enormes volumes de dados de fontes diferentes requer infraestrutura complexa e conhecimento especializado. Pequenas ineficiências podem custar caro, tanto em termos de tempo quanto de gastos, se ampliadas para milhões ou trilhões de pontos de dados.

Neste workshop, veremos como as GPUs podem melhorar os pipelines de dados e como o uso de ferramentas e técnicas avançadas de engenharia de dados pode acelerar o desempenho significativamente. Pipelines mais rápidos produzem dashboards e modelos de machine learning (ML) melhores, que podem ser utilizados pelos usuários para acessar as informações mais atuais.

 

Objetivos de Aprendizagem


Neste workshop, você verá o seguinte:
  • Como funciona o fluxo de dados dentro de um computador. Como criar o equilíbrio correto entre CPU, DRAM, memória de disco e GPUs.
  • Como diferentes formatos de arquivo podem ser lidos e manipulados pelo hardware.
  • Como dimensionar um pipeline de ETL com várias GPUs usando o NVTabular.
  • Como criar um dashboard interativo no Plotly que permita aos usuários filtrar milhões de pontos de dados em menos de 1 segundo.

Faça download do datasheet do workshop (PDF de 318KB)

Resumo do Workshop

Introdução
(15 minutos)
Dados no Nível de Hardware
(60 minutos)
    Ver os pontos fortes e fracos de diferentes abordagens de hardware para dados e os frameworks compatíveis:
    • Pandas
    • CuDF
    • Dask
Intervalo (15 minutos)
ETL com NVTabular
(120 minutos)
    Aprender a dimensionar um pipeline de ETL de uma GPU a várias com o NVTabular na perspectiva de um sistema de recomendação de big data.
    • Transformar um JSON bruto em arquivos Parquet prontos para análise.
    • Aprender a adicionar recursos, como operadores Lambda e Categorify, a um conjunto de dados rapidamente.
Intervalo (60 minutos)
Visualização de Dados
(120 minutos)
    Assumir o papel de meteorologista e aprender a marcar dados de precipitação em um mapa.
    • Aprender a usar estatísticas descritivas e gráficos como histogramas para avaliar a qualidade dos dados.
    • Aprender a usar a memória de forma eficaz para que os usuários possam filtrar dados em uma interface gráfica rapidamente.
Projeto Final: Detetive de Dados
(60 minutos)
    Os usuários estão reclamando da lentidão do dashboard. Solução: aplicar as técnicas aprendidas no curso para encontrar e eliminar problemas de eficiência no código de back-end.
Revisão Final
(15 minutos)
  • Revisar os principais aprendizados e responder a perguntas.
  • Concluir a avaliação e receber o certificado.
  • Completar a pesquisa do workshop.
  • Aprender a configurar o próprio ambiente de desenvolvimento de aplicações de AI.
 

Detalhes do Workshop

Duração: 8 horas

Valor: US$500 para workshops públicos. Para workshops corporativos, fale conosco.

Pré-requisitos:

Tecnologias: Pandas, cuDF, Dask, NVTabular, Plotly

Tipo de Avaliação: avaliações de escrita de código baseadas na habilidade de filtrar, com eficiência, milhões de pontos de dados no contexto de um dashboard interativo.

Certificado: após a conclusão bem-sucedida da avaliação, você receberá um certificado do DLI da NVIDIA que reconhece sua competência no assunto e contribui para o desenvolvimento da carreira e vida profissional.

Requisitos de Hardware: você precisará de um desktop ou notebook capaz de executar a versão mais atual do Chrome ou do Firefox. Você terá acesso exclusivo a uma workstation totalmente configurada e acelerada por GPU no cloud.

Idiomas: inglês

Próximos Workshops

Próximos Workshops Públicos

Europa/Oriente Médio/África

Terça-feira, 6 de julho de 2021
Das 9h às 17h (horário da Europa Central)

América do Norte/América Latina

Terça-feira, 13 de julho de 2021
Das 13h às 21h (horário de Brasília)

Se sua empresa tem interesse em aprimorar e desenvolver habilidades importantes de AI, ciência de dados acelerada ou computação acelerada, solicite um treinamento ministrado por instrutor do DLI da NVIDIA.

Continue a Estudar com Estes Treinamentos do DLI

Conceitos Básicos de Ciência de Dados Acelerada

Computação de Alto Desempenho com Contêineres

Perguntas?

Select Location
Middle East