Evento digital gratuito, organizado por NVIDIA.
8 de noviembre, 11h30 (hora de Ciudad de México)
Únase a los líderes de la industria, los investigadores y los grandes maestros de Kaggle para aprender cómo las herramientas e innovaciones emergentes de la ciencia de datos pueden generar nuevos conocimientos a partir de sus datos.
>La ciencia de datos está impulsando las empresas modernas, fundamentales para aplicaciones transformadoras como LLM, sistemas de recomendación, detección de fraudes, ciberseguridad y más. Durante el summit, participará en debates interactivos en línea sobre las tecnologías que impulsan estas aplicaciones, como la búsqueda vectorial, el análisis de gráficos y el machine learning a gran escala, y cómo puede optimizarlas para su caso de uso.
Acompáñenos en el discurso de apertura del Summit Virtual de IA y Ciencia de Datos, en el que conocerá lo último en computación acelerada para la ciencia de datos y el machine learning.
NetworkX se ha establecido como la biblioteca de referencia para los científicos de datos que utilizan Python para estudiar grafos y redes, y por razones obvias: es muy fácil de usar, admite una amplia variedad de algoritmos de grafos y tiene una gran comunidad que la respalda.
Pero a medida que acumulamos más y más datos, muchos problemas de grafos alcanzan tamaños que exceden las capacidades prácticas de la implementación pura de Python de NetworkX, lo que obliga a los usuarios a abandonar NetworkX por otra biblioteca que a menudo es más difícil de usar.
En respuesta, NetworkX ha agregado la capacidad de enviar sin problemas a backends optimizados, lo que brinda a los usuarios facilidad de uso y escalabilidad. Esta presentación cubrirá NetworkX para el análisis de gráficos y cómo los usuarios pueden aprovechar el envío para trabajar con datos de gráficos de formas que antes no eran posibles.
Aprenda a portar proyectos de ciencia de datos e ingeniería de datos de Python a la suite RAPIDS de código abierto y acelerada por GPU con cambios mínimos en el código. Cubriremos consejos prácticos sobre cómo acelerar masivamente las cargas de trabajo escritas actualmente con Pandas/scikit-learn/NumPy y bibliotecas relacionadas ejecutándolas en la GPU con RAPIDS. Hablaremos de la manipulación de datos, el análisis, el machine learning y las funciones definidas por el usuario. Por último, repasaremos los "trucos" más comunes y las cosas que hay que tener en cuenta a la hora de portar código o mantener bases de código que deben ejecutarse tanto en la GPU como en la CPU. Al final de la charla, estará listo para comenzar a convertir pipelines para que se ejecuten en GPU.
No es necesario tener experiencia previa en RAPIDS, el conocimiento de Python en el mundo real será importante.
Únase a nosotros para una cautivadora mesa redonda en la que distinguidos Grandes Maestros de Kaggle compartirán sus trayectorias en el mundo de las competiciones de ciencia de datos. Explora sus historias personales de triunfo en competiciones desafiantes y descubre las técnicas y estrategias básicas que los impulsaron a la cima del éxito de Kaggle. Los aspirantes a científicos de datos obtendrán consejos prácticos para mejorar las clasificaciones de Kaggle y ampliar sus habilidades de ciencia de datos.
La búsqueda vectorial del vecino más cercano ha experimentado un interés sustancial en los últimos años con su uso en áreas como los sistemas de recomendación y búsqueda, el aprendizaje no supervisado y las nuevas aplicaciones, como los componentes de memoria para grandes modelos de lenguaje (LLM).
Esta charla proporcionará antecedentes sobre el problema de la búsqueda vectorial y las tres principales compensaciones implícitas en su ejecución: calidad de los resultados, almacenamiento de datos y requisitos de cómputo. La biblioteca Faiss (Facebook AI Similarity Search) de Meta, que se originó en 2016, proporciona un conjunto de herramientas algorítmicas que permite muchas de estas compensaciones que a menudo no son expuestas por las bibliotecas y servicios de búsqueda vectorial, o entendidas por sus usuarios. Se detallará la historia de la biblioteca Faiss y las técnicas asociadas, incluidos los desafíos específicos de la GPU para su realización. También se discutirán nuevas aplicaciones interesantes de la búsqueda vectorial, como la computación aproximada y la compresión de datos para el machine learning.
Por último, presentaremos RAPIDS RAFT y cómo Faiss está aprovechando RAFT para seguir impulsando el uso de GPU para la búsqueda de similitudes vectoriales.
Este panel de discusión reunirá a expertos con años de experiencia en la industria para discutir las aplicaciones del mundo real de la ciencia de datos y las tecnologías de machine learning. Obtenga valiosas perspectivas sobre cómo mantenerse al día con el panorama en rápida evolución y descubra consejos invaluables para los aspirantes a profesionales que buscan liderar iniciativas de ciencia de datos y machine learning.
Investigador Fundador | Fast.ai Fast.ai
Científico de datos sénior | H2O.ai H2O.ai
Obtenga una descripción general de RAPIDS, un conjunto de bibliotecas aceleradas por GPU de código abierto con API que reflejan las herramientas de datos de código abierto más populares.
Sumérgete más profundamente con nuestras sesiones de RAPIDS de GTC 2023, todo en una lista de reproducción.
Accede a ocho tutoriales diferentes y hojas de trucos que presentan el ecosistema de RAPIDS.
Únase a la Comunidad de Ciencia de Datos de RAPIDS
Sí, quiero recibir las últimas noticias, anuncios y más de NVIDIA sobre las Soluciones Empresariales y las Herramientas y Tecnologías para Desarrolladores.
Sí, quiero recibir ofertas, anuncios e información de NVIDIA sobre:
(Opcional). Puedes cancelar la suscripción en cualquier momento.
Política de Privacidad de NVIDIA